Ernie Chan - Algorithmic Trading - Es

Accelerating the world's research
Ernie Chan - Trading algorítmico

Traducido de: Ernie Chan - Algorithmic Trading
Alec Huang
¿Necesitas citar este ¿Quieres más papeles como este?

documento?
Descargue un paquete PDF de documentos
Recibe la cita en los estilos relacionados
MLA, APA o Chicago
Busque en el catálogo de la Academia de 22 millones
de artículos gratuitos
translated with Academia.edu 

TRADUCCIÓN 1
Ernie Chan - Trading algorítmico

Alec Huang
Original Paper 
Abstracto
x PREFACIO a los traders de múltiples formas y estrategias. Se hará una distinción entre
las series de tiempo y la reversión a la media transversal. Debatiremos los pros y los contras
del "escalado" y destacaremos el peligro de errores de datos en las estrategias de reversión
de la media, especialmente aquellas que se ocupan de los diferenciales.
Se extraerán ejemplos de estrategias de reversión de la media a partir de modelos de

acciones interdía e intradía, pares y tripletes de fondos negociados en bolsa (ETF), ETF frente
a sus acciones componentes, pares de divisas, calendario de futuros y diferenciales entre
mercados. Explicaremos qué hace que el comercio de algunas de estas estrategias sea
bastante desafiante en los últimos años debido al aumento de los grupos oscuros y el
comercio de alta frecuencia. También ilustraremos cómo ciertas consideraciones
fundamentales pueden explicar la desvinculación temporal de un par ETF hasta ahora muy
rentable y cómo las mismas consideraciones pueden llevar a uno a construir una versión
mejorada de la estrategia. Cuando hablamos del comercio de divisas, nos preocupamos de
explicar por qué incluso el cálculo de los rendimientos puede parecer extraño para un
operador de acciones, y dónde conceptos tales como el interés por reinversión a veces
pueden ser importantes. Se dedicará mucho énfasis al estudio de los rendimientos al
contado frente a los rendimientos de rollo en futuros, y se pueden derivar o comprender
varias estrategias de negociación de futuros a partir de un modelo matemático simple de
precios de futuros. Los conceptos de backwardation y contango se ilustrarán tanto gráfica
como matemáticamente. El capítulo sobre reversión a la media de divisas y futuros se
acumula en el estudio de un futuro muy especial: el futuro de la volatilidad (VX), y cómo
puede constituir la base de algunas estrategias bastante lucrativas.
En el campo del impulso, comenzamos explicando algunas pruebas estadísticas para el

impulso de las series de tiempo. Sin embargo, el tema principal es explorar los cuatro
principales impulsores del impulso en las acciones y los futuros y proponer estrategias que
puedan extraer series de tiempo y un impulso transversal. La rentabilidad de los futuros es
TRADUCCIÓN 2
uno de esos impulsores, pero resulta que las ventas y compras forzadas de activos son el
principal impulsor del impulso de las acciones y los ETF en muchas circunstancias diversas.
Se cubrirán algunas de las estrategias de impulso más nuevas basadas en eventos de
noticias, sentimiento de noticias, ETF apalancados, flujo de pedidos y operaciones de alta
frecuencia. Por último, analizaremos los pros y los contras de las estrategias de impulso
frente a las de reversión a la media y descubriremos sus características de riesgo-
rendimiento diametralmente diferentes bajo diferentes regímenes de mercado en la historia
financiera reciente.
Siempre he sostenido que es fácil encontrar estrategias publicadas, supuestamente

rentables, en los muchos libros, revistas o blogs que existen, pero es mucho más difícil ver
por qué pueden estar equivocadas y quizás finalmente condenadas. Por lo tanto, a pesar del
énfasis en sugerir estrategias prototipo, también discutiremos muchas de las trampas
comunes de las estrategias de negociación algorítmica, que pueden ser casi tan valiosas
para el lector como la descripción de las estrategias en sí. Estos errores pueden hacer que
los resultados comerciales en vivo difieran significativamente de sus backtests. Como
también estarán de acuerdo los veteranos del comercio algorítmico, la misma estrategia
teórica puede resultar en ganancias espectaculares y pérdidas abismales, dependiendo de
los detalles de implementación. Por lo tanto, en este libro he prestado atención a los detalles
del backtesting y, a veces, a la implementación en vivo de estas estrategias, con discusiones
sobre conceptos como sesgo de rastreo de datos, sesgo de supervivencia, cotizaciones
primarias versus consolidadas, la dependencia del lugar de las cotizaciones de divisas, los
matices de las restricciones de la venta al descubierto, la construcción de contratos
continuos de futuros y el uso de precios de cierre versus liquidación de futuros en backtests.
También destacamos algunos casos de "cambio de régimen" históricamente cuando incluso
el backtest más correcto no podrá predecir los rendimientos futuros de una estrategia.
También he prestado atención a la elección de la plataforma de software adecuada para

backtesting y ejecución automatizada, dado que MATLAB ©, mi idioma favorito, ya no es el
único competidor en este departamento. Examinaré el estado del arte en tecnología, para
cada nivel de habilidades de programación y para muchos presupuestos diferentes. En
particular, llamamos la atención sobre el "entorno de desarrollo integrado" para los
comerciantes, que van desde las plataformas de fuerza industrial como Deltix hasta la
miríada de versiones de código abierto como TradeLink. Como explicaremos, la facilidad de
cambiar del modo backtesting al modo de trading en vivo es la virtud más importante de
estas plataformas. En este contexto también se introducirá el concepto de moda de
"procesamiento de eventos complejos". Cubrí el riesgo y la administración del dinero en mi
libro anterior, que se basó en la fórmula de Kelly, una fórmula que determina el
apalancamiento y la asignación de capital óptimos mientras equilibra los rendimientos frente
a los riesgos. Una vez más cubro el riesgo y la administración del dinero aquí, todavía basado
en la fórmula de Kelly, pero moderado con mi experiencia práctica en la administración de
TRADUCCIÓN 3
riesgos que involucran cisnes negros, seguros de cartera de proporción constante y stop
loss. (El juez de la Corte Suprema de Estados Unidos, Robert H. Jackson, podría haber estado
hablando de la aplicación de la fórmula de Kelly cuando dijo que deberíamos "moderar su
lógica doctrinaria con un poco de sabiduría práctica"). Nos enfocamos especialmente en
encontrar el apalancamiento óptimo en situaciones realistas. cuando ya no podemos asumir
la distribución gaussiana de rendimientos. Además, consideramos si los "indicadores de
riesgo" podrían ser un componente útil de un esquema integral de gestión de riesgos.
Una técnica general que he pasado por alto anteriormente es el uso de simulaciones de
Monte Carlo. Aquí, demostramos el uso de datos simulados, en contraposición a los
históricos, para probar la importancia estadística de un backtest así como para evaluar el
riesgo de cola de una estrategia.
Este libro es una continuación de mi libro anterior, Quantitative Trading. Allí, me

concentré en técnicas básicas para un trader algorítmico, como cómo encontrar ideas para
nuevas estrategias, cómo realizar una prueba retrospectiva de una estrategia,
consideraciones básicas para automatizar sus ejecuciones y, finalmente, la gestión de
riesgos a través de la fórmula de Kelly. Sí, se esparcieron algunos ejemplos de estrategias
útiles, pero ese no fue el énfasis. Si es completamente nuevo en el comercio algorítmico, este
es un buen libro para leer. El comercio algorítmico, sin embargo, se trata de estrategias.
Todos los ejemplos de este libro se basan en códigos MATLAB y están disponibles para
su descarga en www.wiley.com/go/algotrading o en mi sitio web en
www.epchan.com/book2. Los lectores encontrarán la contraseña incrustada en el primer
ejemplo. Los lectores que no estén familiarizados con MATLAB pueden querer estudiar el
tutorial en Quantitative Trading o ver los seminarios web gratuitos en mathworks.com.
Además, ocasionalmente se utilizó MATLAB Statistics Toolbox. (Todos los productos de
MATLAB están disponibles como pruebas gratuitas en MathWorks).
El software y las matemáticas son los lenguajes gemelos del comercio algorítmico. Los
lectores encontrarán que este libro implica algo más de matemáticas que el anterior. Esto se
debe a mi deseo de inyectar más precisión al discutir los conceptos involucrados en los
mercados financieros, y también porque creo que usar modelos matemáticos simples para el
comercio puede ser más ventajoso que usar el enfoque habitual de "minería de datos". Es
decir, en lugar de arrojar tantos indicadores técnicos de negociación o reglas en una serie de
precios para ver qué indicador o regla es rentable, una práctica que invita al sesgo de
búsqueda de datos, tratamos de destilar la propiedad fundamental de esa serie de precios
utilizando un modelo matemático simple. Entonces podemos explotar ese modelo para
nuestro beneficio financiero. Sin embargo, el nivel de matemáticas necesario en la
negociación de acciones, futuros y divisas es mucho más bajo que el necesario en la
negociación de derivados, y cualquiera que esté familiarizado con el cálculo de primer año, el
TRADUCCIÓN 4
álgebra lineal y las estadísticas debería poder seguir mis discusiones sin problemas. Si
encuentra que las ecuaciones son demasiado confusas, puede ir directamente a los
ejemplos y ver sus implementaciones concretas como códigos de software.
Cuando escribí mi primer libro, era un comerciante independiente, aunque había

trabajado en la industria de la gestión de inversiones institucionales durante muchos años.
En los años siguientes, inicié y gestioné dos fondos de cobertura, ya sea con un socio o solo.
He sobrevivido al colapso de los fondos cuantitativos en el verano de 2007, a la crisis
financiera de 2008, al colapso repentino de 2010, a la rebaja de la calificación de la deuda
federal de EE. UU. En 2011 y a la crisis de la deuda europea de 2011-2012. Por lo tanto, estoy
más seguro que antes de que mi enfoque inicial del comercio algorítmico es sólido, aunque
ciertamente he aprendido mucho más en el ínterin. Por ejemplo, he descubierto que rara vez
es una buena idea anular manualmente un modelo, sin importar lo traicionero que parezca el
mercado; que siempre es mejor tener un apalancamiento insuficiente que un apalancamiento
excesivo, especialmente cuando se administra el dinero de otras personas; que el
desempeño de la estrategia a menudo significa revertir; y ese exceso de confianza en una
estrategia es el mayor peligro para todos nosotros. Se aprende mucho más de los errores y
las casi catástrofes que de los éxitos. Me esforcé por registrar en este libro gran parte de lo
que he aprendido en los últimos cuatro años.
Mi experiencia en administración de fondos no ha cambiado mi enfoque en el

comerciante minorista serio en este libro. Con suficiente determinación, y con algunas
adaptaciones y refinamientos, todas las estrategias aquí pueden ser implementadas por un
comerciante independiente, y no requieren una cuenta de corretaje de siete cifras, ni
requieren un gasto en tecnología de cinco cifras. Mi mensaje para estos comerciantes sigue
siendo el mismo: una persona con recursos limitados y capacidad informática aún puede
desafiar a los poderosos expertos de la industria en su propio juego.
■ El motivo
Los libros escritos por comerciantes para otros comerciantes deben responder a una
pregunta básica: ¿Por qué lo están haciendo? Más específicamente, si las estrategias
descritas son buenas, ¿por qué el comerciante las publicaría, lo que seguramente las haría
menos rentables en el futuro?
Para responder primero a la segunda pregunta: muchas de las estrategias que describiré
son bastante conocidas por los traders profesionales, por lo que casi no estoy desechando
ninguna joya familiar. Otros tienen capacidades tan altas que su rentabilidad no se verá
seriamente afectada por unos pocos comerciantes adicionales que los ejecuten. Sin
embargo, otros tienen propiedades opuestas: tienen una capacidad tan baja o tienen otras
limitaciones poco atractivas que ya no los encuentro atractivos para su inclusión en la
TRADUCCIÓN 5
cartera de mi propio fondo, pero aún pueden ser adecuados para la cuenta de un
comerciante individual. Por último, a menudo describiré estrategias que a primera vista son
muy prometedoras, pero que pueden contener varias trampas que no he investigado ni
eliminado por completo. Por ejemplo, no he incluido los costos de transacción en mis
códigos de backtest de ejemplo, que son cruciales para un backtest significativo. A menudo
utilizo xiv PREFACIO datos en la muestra tanto para optimizar los parámetros como para
medir el rendimiento, lo que seguramente inflaría los resultados. Estoy cometiendo todos
estos errores en mis ejemplos porque la versión simplificada es más ilustrativa y legible.
Estos pueden denominarse "estrategias prototipo". No están destinados a negociarse "tal
cual", pero son útiles como ilustraciones de técnicas de negociación algorítmica comunes y
como inspiración para que el lector las perfeccione y mejore.
¿Qué pasa con la pregunta del motivo básico? Todo se reduce a esto: el conocimiento de
crowdsourcing es a menudo más eficiente que cualquier otro método para recopilar
información. Y así, como con mi primer libro, agradezco sus comentarios sobre las
estrategias discutidas en este libro.
■ Una nota sobre fuentes y agradecimientos

Naturalmente, no inventé la mayoría de los materiales presentados aquí. Además de las
fuentes tradicionales y comúnmente accesibles de libros, revistas académicas, revistas,
blogs y foros de comerciantes en línea (como elitetrader.com y nuclearphynance.com), ahora
existen nuevas redes de expertos en línea como Hightable.com y Quora.com donde Los
verdaderos expertos de la industria pueden publicar preguntas específicas y, a menudo, las
pueden responder. Personalmente me he beneficiado de todas estas fuentes y estoy
agradecido a los diversos expertos en línea que han respondido a mis preguntas con
profundidad y detalles inesperados. En virtud de mi libro anterior y mi blog (http:
//epchan.blogspot .com), también tengo la suerte de haber escuchado a un gran número de
lectores perspicaces, muchos de los cuales han contribuido a mi base de conocimientos.
También he impartido talleres regulares en Londres y Singapur sobre diversos temas en

el comercio algorítmico a los que asistieron muchos analistas y comerciantes
institucionales. Me han aportado información valiosa que puede no ser fácilmente accesible
en ningún foro público. Los talleres especiales realizados para clientes en Canadá, China,
Hong Kong, India, Sudáfrica y los Estados Unidos también me han expuesto a amplias
perspectivas e inquietudes internacionales.
También tengo el privilegio de haber colaborado con muchos profesionales financieros

expertos, incluso como comerciante independiente y administrador de fondos. Algunas de
estas colaboraciones son a corto plazo e informales, mientras que otras conducen a la
formación formal de empresas de gestión de fondos. En particular, agradezco a Steve
TRADUCCIÓN 6
Halpern y Roger Hunter por sus extensas discusiones e innumerables proyectos y empresas
conjuntos. xv PREFACIO Estoy en deuda con Bryan Downing por presentarme algunas de las
tecnologías comerciales mencionadas en el Capítulo 1, y con Rosario Ingargiola por
mostrarme su plataforma FXOne.
Finalmente, muchas gracias a mi editor Bill Falloon en John Wiley & Sons por ser
siempre entusiasta y apoyar las ideas de mi libro, a la editora de desarrollo Meg Freeborn por
sus sugerencias infaliblemente valiosas y al editor de producción Steven Kyritz por guiar este
libro hasta su final. formulario.
Y reducirá o eliminará las posibilidades de cometer los escollos antes mencionados.

También explicaremos por qué la elección de una buena plataforma de backtesting a
menudo está ligada a la elección de una buena plataforma de ejecución automatizada: a
menudo, la mejor plataforma combina ambas funciones.
■ La importancia del backtesting

El backtesting es el proceso de alimentar datos históricos a su estrategia comercial para
ver cómo se habría desempeñado. La esperanza es que su desempeño histórico nos diga
qué esperar de su desempeño futuro. La importancia de este proceso es obvia si ha
desarrollado una estrategia desde cero, ya que seguramente querrá saber cómo ha
funcionado. Pero incluso si lee acerca de una estrategia en una publicación y confía en que el
autor no mintió sobre su desempeño declarado, es imperativo que realice una prueba
retrospectiva de la estrategia de manera independiente. Hay varias razones para esto.
A menudo, la rentabilidad de una estrategia depende sensiblemente de los detalles de la

implementación. Por ejemplo, ¿se supone que las órdenes de acciones se envían como
órdenes de mercado en abierto o como órdenes de mercado justo después de la apertura?
¿Se supone que debemos enviar un pedido para el futuro E-mini Standard & Poor's (S&P) 500
justo antes de las 4:00 p.m. hora de cierre del mercado de valores, o justo antes de las 4:15
p.m. hora de cierre del mercado de futuros? ¿Se supone que debemos usar el precio de oferta
o demanda para activar una operación, o se supone que debemos usar el último precio?
Todos estos detalles tienden a pasarse por alto en un artículo publicado, a menudo con
justificación para que no distraigan la atención de la idea principal, pero pueden afectar
significativamente la rentabilidad de una estrategia de negociación en vivo. La única forma
de precisar estos detalles con exactitud, para implementarlos en nuestro propio sistema de
ejecución automatizado, es hacer una prueba retrospectiva de la estrategia nosotros
mismos. De hecho, idealmente, nuestro programa de backtesting se puede transformar en un
programa de ejecución automatizado con solo presionar un botón para garantizar la
implementación exacta de los detalles.
TRADUCCIÓN 7
Una vez que hemos implementado todos los detalles de una estrategia como un
programa de backtest, podemos ponerlos bajo el microscopio y buscar errores en el proceso
de backtesting o en la estrategia misma. Por ejemplo, al realizar una prueba retrospectiva de
una estrategia de cartera de acciones con posiciones tanto largas como cortas, ¿hemos
tenido en cuenta el hecho de que algunas acciones eran difíciles de pedir prestado y no se
pueden vender fácilmente en corto en un tamaño razonable? Al realizar una prueba
retrospectiva de una estrategia de negociación de pares entre mercados en futuros, ¿nos
hemos asegurado de que los precios de cierre de los dos mercados se produzcan al mismo
tiempo? La lista completa de errores es larga y tediosa, pero destacaré algunos comunes en
la sección "Errores comunes del backtesting". A menudo, cada mercado y cada estrategia
presenta su propio conjunto de escollos muy específicos. Por lo general, una trampa tiende a
inflar el desempeño de una estrategia en el backtest en relación con su desempeño real en el
pasado, lo cual es particularmente peligroso.
Incluso si nos hemos satisfecho de haber entendido e implementado todos los detalles
de una estrategia en un programa de backtesting, y de que no hay ningún peligro que
podamos descubrir, el backtesting de una estrategia publicada puede generar beneficios
importantes.
El backtesting de una estrategia publicada le permite realizar pruebas verdaderas fuera

de la muestra en el período posterior a la publicación. Si ese desempeño fuera de la muestra
resulta pobre, entonces uno debe preocuparse de que la estrategia haya funcionado solo en
un conjunto de datos limitado. En realidad, este es un punto más importante de lo que la
gente cree. Muchos autores afirmarán en sus artículos que los resultados del backtest fueron
"verificados con datos fuera de la muestra". Pero, en realidad, si los resultados de las pruebas
fuera de la muestra fueran pobres, los autores podrían haber cambiado simplemente algunos
parámetros, o podrían haber modificado sustancialmente el modelo para que los resultados
se vean bien con los datos "fuera de la muestra". Por lo tanto, las verdaderas pruebas fuera
de muestra no pueden comenzar realmente hasta que se publique una estrategia y se grabe
en piedra.
Finalmente, al hacer backtesting de una estrategia nosotros mismos, a menudo

podemos encontrar formas de refinar y mejorar la estrategia para hacerla más rentable o
menos arriesgada. El proceso de backtesting en el comercio debe seguir el "método
científico". Deberíamos comenzar con una hipótesis sobre una oportunidad de arbitraje, tal
vez basándonos en nuestra propia intuición sobre el mercado o en alguna investigación
publicada. Luego confirmamos o refutamos esta hipótesis mediante un backtest. Si los
resultados del backtest no son lo suficientemente buenos, podemos modificar nuestra
hipótesis y repetir el proceso.
Como enfaticé anteriormente, el desempeño de una estrategia a menudo es muy

TRADUCCIÓN 8
sensible a los detalles, y pequeños cambios en estos detalles pueden generar mejoras
sustanciales. Estos cambios pueden ser tan simples como cambiar el período de tiempo
retroactivo para determinar el promedio móvil o ingresar órdenes en la apertura en lugar de
en el cierre. Hacer backtesting de una estrategia nos permite experimentar con cada detalle.
■ Errores comunes del backtesting

Aunque casi todas las estrategias permiten oportunidades únicas para cometer errores
en el backtesting, hay una serie de temas comunes, algunos generalmente aplicables a todos
los mercados, otros pertenecen a algunos específicos.
Sesgo de anticipación
Como su nombre lo indica, el sesgo de anticipación significa que su programa de
backtest utiliza los precios de mañana para determinar las señales comerciales de hoy. O, de
manera más general, está utilizando información futura para hacer una "predicción" en el
momento actual. Un ejemplo común de sesgo de anticipación es utilizar el precio máximo o
mínimo de un día para determinar la señal de entrada durante el mismo día durante el
backtesting. (Antes del cierre de un día de negociación, no podemos saber cuál es el precio
máximo y mínimo del día). El sesgo de anticipación es esencialmente un error de
programación y puede infectar solo un programa de backtest pero no un programa de
negociación en vivo porque no existe No hay forma de que un programa de operaciones en
vivo pueda obtener información futura. Esta diferencia entre el backtesting y un programa de
operaciones en vivo también apunta a una forma obvia de evitar el sesgo de anticipación. Si
sus programas de backtesting y trading en vivo son uno y el mismo, y la única diferencia
entre el backtesting y el trading en vivo es qué tipo de datos está introduciendo en el
programa (datos históricos en el primero y datos de mercado en vivo en el segundo),
entonces no puede haber sesgo de anticipación en el programa. Más adelante en este
capítulo, veremos qué plataformas permiten que se use el mismo código fuente tanto para
backtest como para ejecución en vivo.
Sesgo de búsqueda de datos y la belleza de la linealidad

El sesgo de búsqueda de datos se debe a tener demasiados parámetros libres que se
ajustan a patrones de mercado etéreos aleatorios en el pasado para que el rendimiento
histórico se vea bien. Es poco probable que estos patrones de mercado aleatorios se repitan
en el futuro, por lo que es poco probable que un modelo que se ajuste a estos patrones tenga
mucho poder de predicción.
TRADUCCIÓN 9
La forma de detectar el sesgo de búsqueda de datos es bien conocida: debemos probar

el modelo con datos fuera de la muestra y rechazar un modelo que no pase la prueba fuera
de la muestra. Pero esto es más fácil decirlo que hacerlo. ¿Estamos realmente dispuestos a
renunciar a posibles semanas de trabajo y desechar el modelo por completo? Pocos de
nosotros hemos sido bendecidos con tal decisión. En su lugar, muchos de nosotros
modificaremos el modelo de una u otra forma para que finalmente funcione razonablemente
bien tanto en el resultado dentro como fuera de la muestra. ¡Pero voilà! Al hacer esto,
acabamos de convertir los datos fuera de la muestra en datos dentro de la muestra.
Si no está dispuesto a descartar un modelo debido a su rendimiento en un conjunto de

datos fijos fuera de la muestra (después de todo, el rendimiento deficiente en estos datos
fuera de la muestra puede deberse simplemente a la mala suerte), o si tiene un pequeño
conjunto de datos para empezar y realmente necesita modificar el modelo utilizando la
mayoría de estos datos, debe considerar la idea de la validación cruzada. Es decir, debe
seleccionar varios subconjuntos diferentes de datos para entrenar y ajustar su modelo y, lo
que es más importante, asegurarse de que el modelo funcione bien en estos diferentes
subconjuntos. Una de las razones por las que preferimos modelos con una relación de
Sharpe alta y una duración de reducción máxima corta es que esto garantiza casi
automáticamente que el modelo pasará la prueba de validación cruzada: los únicos
subconjuntos en los que el modelo no pasará la prueba son esos raros períodos de
reducción.
Existe un enfoque general para la construcción de estrategias comerciales que puede

minimizar el sesgo de búsqueda de datos: haga que el modelo sea lo más simple posible, con
la menor cantidad de parámetros posible. Muchos comerciantes aprecian el segundo edicto,
pero no se dan cuenta de que un modelo con pocos parámetros pero muchas reglas
comerciales complicadas es igualmente susceptible al sesgo de búsqueda de datos. Ambos
edictos llevan a la conclusión de que los modelos no lineales son más susceptibles al sesgo
de búsqueda de datos que los modelos lineales porque los modelos no lineales no solo son
más complicados sino que generalmente tienen más parámetros libres que los modelos
lineales.
Suponga que intentamos predecir el precio mediante una simple extrapolación de la

serie histórica de precios. Un modelo no lineal sin duda se ajustaría mejor a los datos
históricos, pero eso no garantiza que pueda predecir mejor un valor futuro. Pero incluso si
fijamos que el número de parámetros sea el mismo para un modelo no lineal frente a su
competidor lineal, hay que recordar que normalmente podemos aproximar un modelo no
lineal mediante la expansión de la serie de Taylor familiar del cálculo. Eso significa que, por lo
general, existe una aproximación lineal más simple que corresponde a cada modelo no lineal,
y se debe dar una buena razón por la cual este modelo lineal no se puede usar. (Las
excepciones son aquellos casos singulares donde los términos de orden inferior
TRADUCCIÓN 10
desaparecen. Pero tales casos rara vez describen series de tiempo financieras realistas). Se
puede hacer un razonamiento equivalente en el contexto de las distribuciones de
probabilidad que deberíamos asumir para los rendimientos. Hemos escuchado a menudo
que la distribución gaussiana no logra capturar los eventos extremos en el mercado
financiero. Pero el problema de ir más allá de la distribución gaussiana es que nos
enfrentaremos a muchas opciones de distribuciones alternativas. ¿Debería ser una
distribución t de Student la que nos permita capturar el sesgo y la curtosis de los retornos, o
debería ser una distribución de Pareto que prescinda por completo de un segundo momento
finito? Cualquier elección tendrá algún elemento de arbitrariedad y la decisión se basará en
un número finito de observaciones. Por lo tanto, la navaja de Occam dicta que, a menos que
existan fuertes razones teóricas y empíricas para apoyar una distribución no gaussiana, debe
asumirse una forma gaussiana.
Los modelos lineales implican no solo una fórmula lineal de predicción de precios, sino
también una fórmula lineal de asignación de capital. Digamos que estamos considerando un
modelo de reversión a la media para una serie de precios tal que el cambio en el precio dy en
el siguiente período de tiempo dt es proporcional a la diferencia entre el precio medio y el
precio actual: dy (t) = (λy (t - 1) + μ) dt + dε, la fórmula denominada "Ornstein-Uhlenbeck", que
se explica y examina con mayor detalle en el Capítulo 2. A menudo, un comerciante utilizará
un modelo de bandas de Bollinger para capturar beneficios de esta media. -revertir las series
de precios, para que vendamos (o compremos) siempre que el precio supere (o descienda)
un determinado umbral. Sin embargo, si nos vemos obligados a ceñirnos a los modelos
lineales, nos veríamos obligados a vender (o comprar) en cada incremento de precio, de
modo que el valor de mercado total es aproximadamente proporcional a la desviación
negativa de la media. En el lenguaje común de los comerciantes, esto se puede llamar
"promediar hacia adentro" o "escalar hacia adentro", una técnica que se analiza en el Capítulo
3.
Encontrará varios ejemplos de modelos de comercio lineal en este libro porque la

simplicidad de esta técnica nos permite ilustrar el punto de que las ganancias no se derivan
de una inteligencia sutil y complicada de la estrategia, sino de una ineficacia intrínseca en el
mercado que es oculto a la vista. El lector impaciente puede mirar hacia adelante al Ejemplo
4.2, que muestra una estrategia lineal de reversión de la media entre un fondo cotizado en
bolsa (ETF) y las acciones que lo componen, o los Ejemplos 4.3 y 4.4, que muestra dos
estrategias lineales de arbitraje estadístico largo-corto sobre acciones.
La forma más extrema de modelos predictivos lineales es aquella en la que todos los
coeficientes son iguales en magnitud (pero no necesariamente en signo). Por ejemplo,
suponga que ha identificado una serie de factores (f) que son útiles para predecir si el
rendimiento de mañana de un índice bursátil es positivo. Un factor puede ser el rendimiento
de hoy, con un rendimiento de hoy positivo que predice un rendimiento futuro positivo. Otro
TRADUCCIÓN 11
factor puede ser el cambio de hoy en el índice de volatilidad (VIX), con un cambio negativo
que predice un rendimiento futuro positivo. Puede tener varios de estos factores. Si
normaliza estos factores convirtiéndolos primero en puntuaciones Z (¡utilizando datos de la
muestra!):
donde f (i) es el i-ésimo factor, puede predecir el rendimiento R de mañana mediante
(1.
2)
Las cantidades media (f) y std (f) son el promedio histórico y la desviación estándar de
los distintos f (i), el signo (i) es el signo de la correlación histórica entre f (i) y R, y la media (R)
y std (R) son el promedio histórico y la desviación estándar de los rendimientos de un día,
respectivamente. Daniel Kahneman, el economista ganador del Premio Nobel, escribió en su
bestseller Thinking, Fast and Slow que "las fórmulas que asignan pesos iguales a todos los
predictores suelen ser superiores, porque no se ven afectadas por accidentes de muestreo"
(Kahneman, 2011). . La ecuación 1.2 es una versión simplificada del modelo factorial habitual
utilizado en la predicción del rendimiento de las acciones. Si bien su predicción de los
rendimientos absolutos puede o no ser muy precisa, su predicción de los rendimientos
relativos entre acciones suele ser suficientemente buena. Esto significa que si lo usamos
para clasificar las acciones y luego formamos una cartera larga-corta comprando las
acciones en el decil superior y acortando las del decil inferior, el rendimiento promedio de la
cartera suele ser positivo. En realidad, si su objetivo es simplemente clasificar las acciones
en lugar de obtener un rendimiento esperado, existe una forma aún más sencilla de combinar
los factores f sin utilizar las ecuaciones 1.1 y 1.2. Primero podemos calcular el rango s (i) de
una acción s basado en un factor f (i). Luego multiplicamos estos rangos por el signo de la
correlación entre f (i) y el rendimiento esperado de la acción. Finalmente, sumamos todos
estos rangos firmados para formar el rango de una acción:
(1,3)
Como ejemplo, Joel Greenblatt ha utilizado un modelo de dos factores como una
"fórmula mágica" para clasificar las acciones: f (1) = rendimiento del capital yf (2) =
rendimiento de las ganancias (Greenblatt, 2006). Se supone que debemos comprar las 30
acciones mejor clasificadas y mantenerlas durante un año. La tasa de porcentaje anual (APR)
de esta estrategia fue del 30,8 por ciento entre 1988 y 2004, en comparación con el 12,4 por
ciento del S&P 500. ¡Todo un triunfo de la linealidad! Sin embargo, al final, no importa cuán
cuidadosamente haya tratado de evitar el sesgo de espionaje de datos en su proceso de
prueba, de alguna manera se infiltrará en su modelo. Por lo tanto, debemos realizar una
prueba de avance como una prueba final y verdadera fuera de la muestra. Esta prueba de
TRADUCCIÓN 12
avance se puede realizar en forma de comercio de papel, pero, mejor aún, el modelo debe
negociarse con dinero real (aunque con un apalancamiento mínimo) para probar aquellos
aspectos de la estrategia que eludieron incluso el comercio de papel. A la mayoría de los
traders les agradaría descubrir que el trading en vivo genera una relación de Sharpe mejor
que la mitad de su valor de backtest.
Divisiones de acciones y ajustes de dividendos

Siempre que las acciones de una empresa tengan una división de N a 1, el precio de las
acciones se dividirá por N veces. Sin embargo, si posee varias acciones de las acciones de
esa empresa antes de la división, poseerá N veces más acciones después de la división, por
lo que, de hecho, no hay ningún cambio en el valor total de mercado. Pero en una prueba
retrospectiva, normalmente miramos solo la serie de precios para determinar nuestras
señales comerciales, no la serie de valor de mercado de alguna cuenta hipotética. Entonces,
a menos que ajustemos los precios antes de la fecha ex de la división dividiéndolos por N,
veremos una caída repentina en el precio en la fecha ex, y eso podría desencadenar algunas
señales comerciales erróneas. Esto es tan cierto en el trading en vivo como en el backtesting,
por lo que también tendría que dividir los precios históricos por N justo antes de que el
mercado abra en la fecha ex durante el trading en vivo. (Si se trata de una división inversa de
1 a N, tendríamos que multiplicar los precios históricos antes de la fecha ex por N.)
De manera similar, cuando una empresa paga un dividendo en efectivo (o en acciones)

de $ d por acción, el precio de las acciones también bajará $ d (sin otros movimientos del
mercado). Esto se debe a que si posee esas acciones antes de la fecha ex-dividendo,
obtendrá distribuciones en efectivo (o acciones) en su cuenta de corretaje, por lo que
nuevamente no debería haber ningún cambio en el valor total de mercado. Si no ajusta hacia
atrás la serie histórica de precios antes de la fecha ex, la caída repentina del precio también
puede desencadenar una señal de negociación errónea. Este ajuste también debe aplicarse a
cualquier dato histórico utilizado en el modelo de negociación en vivo justo antes de que se
abra el mercado en una fecha anterior. (Esta discusión se aplica también a los ETF. Es
necesario aplicar un tratamiento un poco más complicado a los precios de las opciones).
Puede encontrar información histórica sobre partidas y dividendos en muchos sitios

web, pero encuentro que ganancias.com es un excelente recurso gratuito. No solo registra
dichos números históricos, sino que también muestra los montos de división y dividendos
anunciados y las fechas de vencimiento en el futuro, para que podamos anticipar dichos
eventos en nuestro software de negociación automatizado. Si está interesado en datos
históricos de acciones que ya están ajustados para divisiones de acciones y dividendos, y
que son fáciles de descargar, pruebe csidata.com.
TRADUCCIÓN 13
Sesgo de supervivencia en la base de datos de existencias

Si está realizando una prueba retrospectiva de un modelo de negociación de acciones,
sufrirá un sesgo de supervivencia si sus datos históricos no incluyen las acciones excluidas
de la lista. Imagine un caso extremo: suponga que su modelo le pide que solo compre la
acción que más cayó el día anterior y la mantenga para siempre. En realidad, esta estrategia
seguramente funcionará mal porque, en muchos casos, la empresa cuyas acciones cayeron
más el día anterior pasará a la quiebra, lo que resultará en una pérdida del 100 por ciento de
la posición de las acciones. Pero si sus datos históricos no incluyen acciones excluidas de la
lista, es decir, solo contienen acciones que sobreviven hasta el día de hoy, entonces el
resultado del backtest puede parecer excelente. Esto se debe a que habría comprado una
acción cuando fue derrotada gravemente pero posteriormente sobrevivió, aunque no podría
haber predicho su eventual supervivencia si estuviera operando la estrategia en vivo.
El sesgo de supervivencia es más peligroso para las estrategias de acciones de reversión

a la media solo a largo que para las estrategias de reversión de la media a largo-corto o solo
a corto. Esto se debe a que, como vimos anteriormente, este sesgo tiende a inflar el
rendimiento de backtest de una estrategia de sólo largo plazo que primero compra bajo y
luego vende alto, mientras que deflactará el rendimiento de backtest de una estrategia de
sólo corto que fije Primero vende caro y luego compra bajo. Aquellas acciones que bajaron a
cero habrían funcionado muy bien con una estrategia de solo corto, pero no estarían
presentes en los datos de backtest con sesgo de supervivencia. Para las estrategias largas-
cortas con reversión a la media, los dos efectos son de signos opuestos, pero la inflación del
rendimiento de la estrategia larga tiende a superar la deflación del rendimiento de la cartera
corta, por lo que el peligro se reduce pero no se elimina. El sesgo de supervivencia es menos
peligroso para los modelos de impulso. El comercio de momentum corto rentable tenderá a
omitirse en los datos con sesgo de supervivencia y, por lo tanto, se desviará el rendimiento
del backtest.
Puede comprar datos históricos a precios razonables sin sesgo de supervivencia en

csidata.com (que proporciona una lista de acciones excluidas de la lista). Otros proveedores
incluyen kibot.com, tickdata.com y crsp.com. O, de hecho, puede recopilar sus propios datos
sin sesgos de supervivencia guardando los precios históricos de todas las acciones en un
índice todos los días. Finalmente, en ausencia de tales datos libres de sesgos de
supervivencia, puede limitarse a realizar pruebas retrospectivas solo de los datos históricos
más recientes, digamos, tres años para reducir el daño.
Precios de acciones primarios versus consolidados

Muchas acciones estadounidenses se negocian en múltiples bolsas, redes de
comunicación electrónica (ECN) y grupos oscuros: The New York Stock Exchange (NYSE),
TRADUCCIÓN 14
NYSE Arca, Nasdaq, Island, BATS, Instinet, Liquidnet, Bloomberg Tradebook, Sigma X de
Goldman Sachs. y CrossFinder de Credit Suisse son solo algunos de los mercados de
ejemplo. Cuando busca el precio de cierre diario histórico de una acción, este refleja el último
precio de ejecución en cualquiera de estos lugares durante el horario de negociación
habitual. De manera similar, un precio de apertura diario histórico refleja el precio de primera
ejecución en cualquiera de estos lugares. Pero cuando envía una orden de mercado al cierre
(MOC) o de mercado abierto (MOO), siempre se enrutará solo al intercambio principal. Por
ejemplo, una orden de MOC en IBM se enviará a NYSE, una orden de MOC en SPY se enviará a
NYSE Arca y una orden de MOC en Microsoft (MSFT) se enviará a Nasdaq. Por lo tanto, si
tiene una estrategia que se basa en órdenes de apertura de mercado o de cierre de mercado,
necesita los precios históricos del intercambio principal para realizar una prueba
retrospectiva precisa de su modelo. Si utiliza los precios históricos consolidados habituales
para el backtesting, los resultados pueden ser poco realistas. En particular, si utiliza precios
históricos consolidados para realizar un backtest de un modelo de reversión a la media, es
probable que genere un rendimiento de backtest inflado porque una pequeña cantidad de
acciones pueden ejecutarse fuera del mercado primario a un precio bastante diferente del
precio de subasta. en el intercambio principal. Los precios de transacción en el siguiente día
de negociación generalmente se revertirán a partir de este precio atípico difícil de lograr. (Los
precios de cierre y apertura en las bolsas primarias de EE. UU. Siempre se determinan
mediante una subasta, mientras que una transacción al cierre de una bolsa secundaria no es
el resultado de una subasta).
Una consideración similar se aplica al uso de precios altos o bajos para su estrategia. Lo
que se registró en los datos históricos suelen ser los máximos o mínimos consolidados, no
los del intercambio primario. A menudo son números exagerados y no representativos que
resultan de transacciones de pequeño tamaño en bolsas secundarias. El rendimiento de las
pruebas retrospectivas también se inflará si se utilizan estos precios históricos.
¿Dónde podemos encontrar precios históricos de las bolsas primarias? Los usuarios de
Bloomberg tienen acceso a eso como parte de su suscripción. Por supuesto, al igual que en
el caso de almacenar y usar datos libres de sesgos de supervivencia discutidos
anteriormente, también podemos suscribirnos a transmisiones directas en vivo de los
intercambios (primarios) y almacenar esos precios en nuestras propias bases de datos en
tiempo real. Luego, podemos usar estas bases de datos en el futuro como nuestra fuente de
datos de intercambio primario. Suscribirse a dichos feeds de forma independiente puede ser
una propuesta costosa, pero si su corredor tiene tales suscripciones y redistribuye dichos
datos a sus clientes que se ubican dentro de su centro de datos, el costo puede ser mucho
menor. Desafortunadamente, la mayoría de los corredores minoristas no redistribuyen las
fuentes directas de los intercambios, pero los corredores institucionales como Lime
Brokerage a menudo lo hacen.
TRADUCCIÓN 15
Si no tenemos acceso a esos datos, todo lo que podemos hacer es mantener un

escepticismo saludable sobre los resultados de nuestras pruebas retrospectivas.
Dependencia del lugar de las cotizaciones de divisas

En comparación con el mercado de valores, los mercados de divisas están aún más
fragmentados y no existe una regla que diga que una operación ejecutada en un lugar tiene
que ser la mejor oferta o demanda en todos los diferentes lugares. Por lo tanto, una prueba
retrospectiva será realista solo si usamos datos históricos extraídos de los mismos lugares
en los que esperamos operar.
Hay agregadores de cotizaciones como Streambase que consolidan las fuentes de datos
de diferentes lugares en una cartera de pedidos. En este caso, puede utilizar los datos
históricos consolidados para backtesting, siempre que pueda ejecutar en el lugar que formó
parte de la cartera de pedidos consolidada.
Otra característica de las cotizaciones de divisas en vivo y los datos históricos es que los
precios y tamaños de las operaciones, a diferencia de las cotizaciones de oferta y demanda,
no están generalmente disponibles, al menos no sin una pequeña demora. Esto se debe a
que no existe una regulación que diga que el distribuidor o ECN debe informar el precio
comercial a todos los participantes del mercado. De hecho, muchos distribuidores ven la
información de las transacciones como información valiosa y de propiedad exclusiva.
(Pueden ser inteligentes al hacerlo porque hay estrategias de alta frecuencia que dependen
de la información del flujo de pedidos y que requieren precios de negociación, como se
menciona en el Capítulo 7. Las mesas de negociación de divisas patentadas de los bancos
sin duda prefieren guardar esta información para sí mismos. .) Pero de todos modos se
recomienda usar cotizaciones de oferta y demanda para backtesting de estrategias de forex,
ya que los diferenciales de oferta y demanda para el mismo par de divisas pueden variar
significativamente entre lugares. Como resultado, los costos de transacción también
dependen en gran medida del lugar y deben tenerse en cuenta en un backtest.
Restricciones de venta corta

Un modelo de negociación de acciones que implica vender acciones en corto asume que
esas acciones pueden estar en corto, pero a menudo hay dificultades para vender algunas
acciones en corto. Para vender una acción en corto, su corredor debe poder "localizar" una
cantidad de estas acciones de otros clientes u otras instituciones (generalmente fondos
mutuos u otros administradores de activos que tienen grandes posiciones largas en muchas
acciones) y tramitar un préstamo de acciones para usted. . Si ya existe un gran interés corto,
por lo que muchas de las acciones de una empresa ya han sido tomadas en préstamo, o si la
TRADUCCIÓN 16
flotación de las acciones es limitada, entonces su acción puede ser "difícil de pedir prestada".
La dificultad de pedir prestado puede significar que usted, como vendedor en corto, tendrá
que pagar intereses al prestamista de acciones, en lugar de al revés en una situación normal.
En casos más extremos, un préstamo difícil puede significar que no puede pedir prestado el
stock en la cantidad que desea o en absoluto. Después del colapso de Lehman Brothers
durante la crisis financiera de 2008-2009, la Comisión de Bolsa y Valores de EE. UU. (SEC)
prohibió las ventas al descubierto en todas las acciones de la industria financiera durante
varios meses. Por lo tanto, si su modelo de backtesting corta acciones que eran difíciles o
imposibles de pedir prestado, puede mostrar un rendimiento maravilloso porque nadie más
pudo venderlas y bajar su precio cuando su modelo las vendió en corto. Pero este regreso es
completamente irreal. Esto hace que las restricciones de venta corta sean peligrosas para el
backtesting. Sin embargo, no es fácil encontrar una lista históricamente precisa de acciones
difíciles de pedir prestada para su backtest, ya que esta lista depende del corredor que utilice.
Como regla general, las acciones de pequeña capitalización se ven mucho más afectadas por
la restricción de las ventas en descubierto que las acciones de gran capitalización, por lo que
los rendimientos de sus posiciones cortas son mucho más sospechosos. Tenga en cuenta
también que, a veces, los ETF son tan difíciles de pedir prestado como las acciones.
¡Descubrí, por ejemplo, que ni siquiera podía pedir prestado SPY a corto en los meses
posteriores al colapso de los Lehman Brothers! Una restricción adicional de la venta corta es
la llamada "regla de aumento" impuesta por la SEC. La regla del repunte original estuvo en
vigor desde 1938 hasta 2007, cuando la venta corta tenía que ejecutarse a un precio más alto
que el último precio negociado, o al último precio negociado si ese precio era más alto que el
precio de la operación antes de la operación. el último. (Para las acciones de Nasdaq, el
precio de venta corta debe ser más alto que la última oferta en lugar de la última operación).
La regla alternativa al alza que entró en vigencia en 2010 también requiere que una venta
corta tenga un precio de operación más alto que la mejor oferta nacional. pero solo cuando
se ha activado un disyuntor. Un disyuntor para una acción se activa cuando esa acción cotiza
a un 10 por ciento más bajo que su cierre anterior. El disyuntor también está en vigor para el
día siguiente después del disparo inicial. Esto evita eficazmente que se llenen las órdenes de
mercado a corto. Entonces, nuevamente, una prueba retrospectiva realmente precisa que
involucre ventas en corto debe tomar en cuenta si estas restricciones estaban vigentes
cuando se suponía que ocurría el comercio histórico. De lo contrario, se inflará el rendimiento
del backtest.
Contratos continuos de futuros

Los contratos de futuros tienen fechas de vencimiento, por lo que una estrategia
comercial en, por ejemplo, futuros de petróleo crudo, es realmente una estrategia comercial
en muchos contratos diferentes. Por lo general, la estrategia se aplica a los contratos de
primer mes. Qué contrato es el "mes delantero" depende exactamente de cuándo planea
"transferir" al mes siguiente; es decir, cuando planea vender el contrato frontal actual y
TRADUCCIÓN 17
comprar el contrato con la próxima fecha de vencimiento más cercana (asumiendo que tiene
un contrato largo para empezar). Algunas personas pueden decidir renovar 10 días antes de
que expire el contrato inicial actual; otros pueden decidir renovarse cuando hay un "cruce de
intereses abierto"; es decir, cuando el interés abierto del siguiente contrato excede al del
contrato frontal actual. No importa cómo decida su fecha de reinversión, es una molestia
adicional tener que incorporar eso en su estrategia comercial, ya que esta compra y venta es
independiente de la estrategia y debería resultar en un rendimiento adicional mínimo o
ganancias y pérdidas (P&L). . (P&L, o retorno, ciertamente se ve afectado por el llamado
"retorno de rollo", pero como discutimos extensamente en el Capítulo 5, el retorno de rollo
está en vigencia todos los días en todos los contratos y no es una consecuencia de
reinversión). Afortunadamente, la mayoría de los proveedores de datos históricos de futuros
también reconocen esto y, por lo general, ponen a disposición lo que se conoce como datos
de "contrato continuo".
No discutiremos aquí cómo puede crear un contrato continuo usted mismo porque
puede leer sobre eso en los sitios web de muchos proveedores de datos históricos de
futuros. Pero hay un matiz en este proceso que debe conocer. El primer paso para crear un
contrato continuo es concatenar los precios del contrato del primer mes, dado un cierto
conjunto de fechas de renovación. Pero esto da como resultado una serie de precios que
puede tener brechas de precios significativas desde la última fecha antes de la reinversión
hasta la fecha de reinversión, y creará una devolución o pérdidas y ganancias falsas en la
fecha de reinversión en su backtest.
Para ver esto, digamos que el precio de cierre del contrato inicial en la fecha T es p (T), y
el precio de cierre de este mismo contrato en la fecha T + 1 es p (T + 1). Además, digamos
que el precio de cierre del próximo contrato cercano (también llamado contrato "atrasado")
en la fecha T + 1 es q (T + 1). Suponga que T + 1 es la fecha de reinversión, por lo que si
estamos largos en el contrato inicial, deberíamos vender este contrato al cierre en p (T + 1) y
luego comprar el siguiente contrato en q (T + 1). ¿Cuáles son las pérdidas y ganancias (en
puntos, no en dólares) y el rendimiento de esta estrategia en T + 1? El P&L es solo p (T + 1) -
p (T), y el retorno es (p (T + 1) - p (T)) / p (T). Pero la serie de precios continuos sin ajustar
mostrará un precio de p (T) en T, y q (T + 1) en T + 1. Si calcula P&L y devuelve la forma
habitual, habría calculado los valores erróneos de q ( T + 1) - p (T) y (q (T + 1) - p (T)) / p (T),
respectivamente. Para evitar este error, el proveedor de datos normalmente puede
retroajustar la serie de datos para eliminar la brecha de precios, de modo que la P&L en T + 1
sea p (T + 1) - p (T). Esto se puede hacer sumando el número (q (T + 1) - p (T + 1)) a cada
precio p (t) en cada fecha t en o antes de T, de modo que el precio cambie y las pérdidas y
ganancias de T a T + 1 se calcula correctamente como q (T + 1) - (p (T) + q (T + 1) - p (T + 1))
= p (T + 1) - p (T). (Por supuesto, para ocuparse de cada vuelco, tendría que aplicar este
ajuste hacia atrás varias veces, a medida que retroceda en la serie de datos). ¿Nuestro
problema está resuelto? No exactamente. Compruebe cuál es el rendimiento en T + 1 dada
TRADUCCIÓN 18
esta serie de precios ajustados: (p (T + 1) - p (T)) / (p (T) + q (T + 1) - p (T + 1)) , no (p (T + 1) -

p (T)) / p (T). Si realiza un retroajuste para que el cálculo de pérdidas y ganancias sea
correcto, dejará el cálculo de retorno incorrecto. Por el contrario, puede retroajustar la serie
de precios para que el cálculo de la rentabilidad sea correcto (multiplicando cada precio p (t)
en cada fecha t en o antes de T por el número q (T + 1) / p (T + 1)) , pero entonces el cálculo
de P&L será incorrecto. Realmente no puedes tener ambos. Siempre que desee la
conveniencia de utilizar una serie de contratos continuos, debe elegir una sola medición de
desempeño, P&L o retorno. (Si se molesta en realizar una prueba retrospectiva de su
estrategia en los distintos contratos individuales, ocupándose usted mismo de la renovación
de la compra y la venta, tanto las pérdidas como las ganancias se pueden calcular
correctamente de forma simultánea).
Se produce una dificultad adicional cuando elegimos el ajuste por retroceso de precios
en lugar del método de ajuste por retorno: los precios pueden volverse negativos en el
pasado distante. Esto puede crear problemas para su estrategia comercial y ciertamente
creará problemas en el cálculo de los rendimientos. Un método común para lidiar con esto es
agregar una constante a todos los precios para que ninguno sea negativo.
Esta sutileza a la hora de elegir el método de retroajuste correcto es más importante

cuando tenemos una estrategia que implica negociar diferenciales entre diferentes
contratos. Si su estrategia genera señales comerciales basadas en la diferencia de precio
entre dos contratos, entonces debe elegir el método de ajuste por retroceso del precio; de lo
contrario, la diferencia de precio puede ser incorrecta y generar una señal comercial
incorrecta. Cuando una estrategia implica diferenciales de calendario (diferenciales en
contratos con el mismo subyacente pero diferentes fechas de vencimiento), este ajuste
retroactivo es aún más importante. Esto se debe a que el margen del calendario es un
número pequeño en comparación con el precio de un tramo del margen, por lo que cualquier
error debido al rollover será un porcentaje significativo del margen y es muy probable que
active una señal incorrecta tanto en el backtest como en vivo. comercio. Sin embargo, si su
estrategia genera señales comerciales basadas en la relación de precios entre dos contratos,
entonces debe elegir el método de ajuste de retorno.
Como puede ver, al elegir un proveedor de datos para los precios históricos de futuros,
debe comprender exactamente cómo han abordado el problema del ajuste hacia atrás, ya que
ciertamente afecta su backtest. Por ejemplo, csidata.com usa solo el ajuste por retroceso de
precio, pero con una constante aditiva opcional para evitar que los precios se vuelvan
negativos, mientras que tickdata.com le permite la opción de elegir el ajuste por retroceso de
precio versus retorno, pero no hay opción para agregar un constante para evitar precios
negativos.
TRADUCCIÓN 19
Precios de cierre de futuros frente a precios de liquidación

El precio de cierre diario de un contrato de futuros proporcionado por un proveedor de
datos suele ser el precio de liquidación, no el último precio negociado del contrato durante
ese día. Tenga en cuenta que un contrato de futuros tendrá un precio de liquidación cada día
(determinado por el intercambio), incluso si el contrato no se ha negociado en todo ese día. Y
si el contrato se ha negociado, el precio de liquidación es, en general, diferente del último
precio negociado. La mayoría de los proveedores de datos históricos proporcionan el precio
de liquidación como precio de cierre diario. Pero algunos, como los proveedores que
proporcionan datos tick por tick, pueden proporcionar solo el precio de transacción real y, por
lo tanto, el precio de cierre será el último precio negociado, si ha habido una transacción ese
día. ¿Qué precio deberíamos usar para hacer backtesting de nuestras estrategias?
En la mayoría de los casos, deberíamos usar el precio de liquidación, porque si hubiera

operado en vivo cerca del cierre, ese habría sido más cercano al precio de su transacción. El
último precio comercial registrado podría haber ocurrido varias horas antes y tener poca
relación con el precio de su transacción cerca del cierre. Esto es especialmente importante si
estamos construyendo una estrategia de negociación de pares sobre futuros. Si utiliza los
precios de liquidación para determinar los diferenciales de futuros, se le garantiza que
utilizará dos precios contemporáneos. (Esto es cierto siempre que los dos contratos de
futuros tengan el mismo subyacente y, por lo tanto, la misma hora de cierre. Si está
negociando diferenciales entre mercados, consulte la discusión al final de esta sección). Sin
embargo, si utiliza los últimos precios negociados para determinar el diferencial, es posible
que esté utilizando precios generados en dos momentos muy diferentes y, por lo tanto,
incorrectos. Esta incorrección puede significar que su programa de backtest generará
operaciones erróneas debido a un spread irrealmente grande, y estas operaciones pueden ser
rentables de manera poco realista en backtest cuando los spreads regresen a un valor
correcto y menor en el futuro, tal vez cuando se realicen transacciones casi simultáneas.
ocurrir. Como de costumbre, un resultado de backtest inflado es peligroso.
Si tiene una estrategia de diferencial intradiario o está utilizando precios de futuros

intradiarios para realizar una prueba retrospectiva de una estrategia de diferencial, necesitará
datos históricos con precios de oferta y demanda de ambos contratos o los datos
intradiarios sobre el propio diferencial cuando es nativo de la bolsa. Esto es necesario porque
muchos contratos de futuros no son muy líquidos. Entonces, si usamos el último precio de
cada barra para formar el diferencial, podemos encontrar que los últimos precios del contrato
A y el contrato B de la misma barra pueden referirse a transacciones que están bastante
separadas en el tiempo. Un margen formado por precios últimos asincrónicos no podría en
realidad comprarse o venderse a esos precios. Las pruebas retrospectivas de las estrategias
de spread intradiarias que utilizan el último precio de cada tramo del spread en lugar del
último precio del spread en sí inflarán nuevamente los rendimientos resultantes. Un
proveedor que vende datos de spread del calendario histórico intradiario (tanto cotizaciones
TRADUCCIÓN 20
como precios comerciales) es cqgdatafactory.com.
Hay un detalle general en el backtesting de diferenciales entre mercados que no debe

pasarse por alto. Si los contratos se negocian en diferentes bolsas, es probable que tengan
diferentes horarios de cierre. Por lo tanto, sería incorrecto formar un diferencial entre
mercados utilizando sus precios de cierre. Esto también es cierto si intentamos formar un
diferencial entre un futuro y un ETF. El remedio obvio para esto es obtener datos de oferta y
demanda intradía para garantizar la sincronicidad. La otra posibilidad es negociar un ETF que
tenga un futuro en lugar del futuro en sí. Por ejemplo, en lugar de negociar el GC futuro de oro
(precio de liquidación establecido a la 1:30 p.m. ET) contra el ETF GDX de los mineros de oro,
podemos intercambiar el fideicomiso de oro GLD por GDX. Debido a que ambos operan en
Arca, sus precios de cierre se establecen a las mismas 4:00 p.m. ET.
■ Significación estadística del backtesting: prueba de hipótesis

En cualquier backtest, nos enfrentamos al problema del tamaño de muestra finito:
cualquier medida estadística que calculemos, como los rendimientos promedio o las
reducciones máximas, está sujeta a la aleatoriedad. En otras palabras, podemos tener suerte
de que nuestra estrategia resulte rentable en una pequeña muestra de datos. Los
estadísticos han desarrollado una metodología general llamada prueba de hipótesis para
abordar este problema.
El marco general de la prueba de hipótesis aplicada al backtesting sigue estos pasos:
1. Basándonos en una prueba retrospectiva de una muestra finita de datos, calculamos

una determinada medida estadística llamada estadística de prueba. Para ser más concretos,
digamos que la estadística de prueba es el rendimiento diario promedio de una estrategia
comercial en ese período. 2. Suponemos que el verdadero rendimiento promedio diario
basado en un conjunto de datos infinito es en realidad cero. Esta suposición se llama
hipótesis nula. 3. Suponemos que se conoce la distribución de probabilidad de los
rendimientos diarios. Esta distribución de probabilidad tiene una media cero, basada en la
hipótesis nula. Más adelante describimos cómo determinamos esta distribución de
probabilidad. 4. Con base en esta distribución de probabilidad de hipótesis nula, calculamos
la probabilidad p de que los rendimientos diarios promedio sean al menos tan grandes como
el valor observado en el backtest (o, para un estadístico de prueba general, tan extremo,
permitiendo la posibilidad de una estadística de prueba negativa). Esta probabilidad p se
llama valor p, y si es muy pequeña (digamos menor que 0.01), eso significa que podemos
"rechazar la hipótesis nula" y concluir que el rendimiento diario promedio comprobado es
estadísticamente significativo.
El paso de este procedimiento que requiere más reflexión es el paso 3. ¿Cómo

TRADUCCIÓN 21
determinamos la distribución de probabilidad bajo la hipótesis nula? Quizás podamos

suponer que los rendimientos diarios siguen una distribución de probabilidad paramétrica
estándar como la distribución gaussiana, con una media de cero y una desviación estándar
dada por la desviación estándar muestral de los rendimientos diarios. Si hacemos esto, está
claro que si el backtest tiene un ratio de Sharpe alto, sería muy fácil para nosotros rechazar la
hipótesis nula. Esto se debe a que el estadístico de prueba estándar para una distribución
gaussiana no es otro que el promedio dividido por la desviación estándar y multiplicado por
la raíz cuadrada del número de puntos de datos (Berntson, 2002). Los valores p para varios
valores críticos se enumeran en la Tabla 1.1. Por ejemplo, si el índice de Sharpe diario
multiplicado por la raíz cuadrada del número de días (n) en el backtest es mayor o igual al
valor crítico 2.326, entonces el valor p es menor o igual a 0.01.
Este método de prueba de hipótesis es coherente con nuestra creencia de que las
estrategias de ratio de Sharpe alto son más significativas desde el punto de vista estadístico.
Otra forma de estimar la distribución de probabilidad de la hipótesis nula es utilizar los

métodos de Monte Carlo para generar datos de precios históricos simulados e incorporar
estos datos simulados a nuestra estrategia para determinar la distribución de probabilidad
empírica de las ganancias. Creemos que la rentabilidad de la estrategia comercial capturó
algunos patrones sutiles o correlaciones de la serie de precios, y no solo debido a los
primeros momentos de las distribuciones de precios. Entonces, si generamos muchas series
de precios simuladas con los mismos primeros momentos y la misma duración que los datos
de precios reales, y ejecutamos la estrategia comercial sobre todas estas series de precios
simuladas, podemos averiguar en qué fracción p de estas series de precios son el promedio.
devuelve mayor o igual que el retorno de backtest. Idealmente, p será pequeño, lo que nos
permite rechazar la hipótesis nula. De lo contrario, el rendimiento promedio de la estrategia
puede deberse simplemente a los rendimientos del mercado. Andrew Lo y sus colaboradores
(Lo, Mamaysky y Wang, 2000) sugieren una tercera forma de estimar la distribución de
probabilidad de la hipótesis nula. En este método, en lugar de generar datos de precios
simulados, generamos conjuntos de operaciones simuladas, con la restricción de que el
número de operaciones de entrada larga y corta es el mismo que en el backtest y con el
mismo período de tenencia promedio para las operaciones. Estas operaciones se distribuyen
aleatoriamente sobre la serie histórica real de precios. Luego medimos qué fracción de tales
conjuntos de operaciones tiene un rendimiento promedio mayor o igual que el rendimiento
promedio del backtest.
En el ejemplo 1.1, comparo estas tres formas de probar la importancia estadística de un

backtest en una estrategia. No debería sorprendernos que nos den respuestas diferentes, ya
que la distribución de probabilidad es diferente en cada caso, y cada distribución asumida
compara nuestra estrategia con un punto de referencia diferente de aleatoriedad.
TRADUCCIÓN 22
Ejemplo 1.1: Prueba de hipótesis en una estrategia de impulso de

futuros
Aplicamos las tres versiones de la prueba de hipótesis, cada una con una distribución de
probabilidad diferente para la hipótesis nula, en los resultados del backtest de la estrategia
de impulso de TU descrita en el Capítulo 6. Esa estrategia compra (vende) el futuro de TU si
tiene un ( negativo) retorno a 12 meses, y mantiene la posición durante 1 mes. Elegimos esta
estrategia no solo por su simplicidad, sino porque tiene un período de mantenimiento fijo.
Entonces, para la versión 3 de la prueba de hipótesis, necesitamos aleatorizar solo los días
de inicio de las operaciones largas y cortas, sin necesidad de aleatorizar los períodos de
tenencia. La primera prueba de hipótesis es muy sencilla. Suponemos que la distribución de
probabilidad de los rendimientos diarios es gaussiana, con una media cero como resultado
de una hipótesis nula, y con la desviación estándar dada por la desviación estándar de los
rendimientos diarios dada por nuestro backtest. Entonces, si ret es la matriz Tx1 MATLAB ©
que contiene los rendimientos diarios de la estrategia, la estadística de prueba es solo el
Ejemplo 1.1 (Continuación) que resulta ser 2.93 para nuestro conjunto de datos. La
comparación de este estadístico de prueba con los valores críticos de la tabla 1.1 nos dice
que podemos rechazar la hipótesis nula con una probabilidad superior al 99 por ciento.
La segunda prueba de hipótesis implica generar un conjunto de datos de rendimientos

diarios simulados aleatorios para el futuro de TU (no los rendimientos diarios de la
estrategia) para el mismo número de días que nuestro backtest. Estos datos de rendimientos
diarios aleatorios tendrán la misma media, desviación estándar, sesgo y curtosis que los
rendimientos de futuros observados, pero, por supuesto, no tendrán las mismas
correlaciones incrustadas en ellos. Si encontramos que hay una buena probabilidad de que la
estrategia pueda generar un rendimiento tan bueno o mejor en esta serie de rendimientos
aleatorios como la serie de rendimientos observados, significaría que la estrategia de
impulso no está realmente capturando ningún impulso o correlaciones en serie en la serie.
devuelve en absoluto y es rentable sólo porque tuvimos la suerte de que la distribución de
probabilidad de los rendimientos observados tiene una cierta media y una cierta forma. Para
generar estos retornos aleatorios simulados con los momentos prescritos, usamos la
función pearsrnd de MATLAB Statistics Toolbox. Una vez que se generan los rendimientos
simulados marketRet_sim, se procede a construir una serie de precios simulados cl_sim
utilizando esos rendimientos. Finalmente, ejecutamos la estrategia sobre estos precios
simulados y calculamos el rendimiento promedio de la estrategia. Repetimos esto 10,000
veces y contamos cuántas veces la estrategia produce un rendimiento promedio mayor o
igual al producido en el conjunto de datos observados.
Suponiendo que marketRet es la matriz Tx1 que contiene los rendimientos diarios
observados de TU, el fragmento del programa se muestra a continuación. (Descubrimos que
de 10,000 conjuntos de retornos aleatorios, 1,166 tienen un retorno de estrategia promedio
TRADUCCIÓN 23
mayor o igual al retorno promedio observado. Por lo tanto, la hipótesis nula se puede
rechazar con solo un 88 por ciento de probabilidad. Claramente, la forma de la curva de
distribución de retornos tiene algo que ver con el éxito de la estrategia. (Es menos probable
que el éxito se deba a la media de la distribución, ya que la posición puede ser larga o corta
en diferentes momentos). La tercera prueba de hipótesis implica aleatorizar la entrada larga
y corta fechas, mientras se mantiene el mismo número de operaciones largas y cortas que en
el backtest, respectivamente.Podemos lograr esto con bastante facilidad mediante la función
de MATLAB randperm: numSampleAvgretBetterOrEqualObserved = 0;
para muestra = 1: 100000
P = randperm (longitud (largos)); No hay una sola muestra de 100.000 en la que el

rendimiento medio de la estrategia sea mayor o igual al rendimiento observado. Claramente,
la tercera prueba es mucho más débil para esta estrategia.
El hecho de que una hipótesis nula no sea única y de que diferentes hipótesis nulas
puedan dar lugar a diferentes estimaciones de importancia estadística es una de las razones
por las que muchos críticos creen que la prueba de hipótesis es una metodología defectuosa
(Gill, 1999). La otra razón es que en realidad queremos conocer la probabilidad condicional
de que la hipótesis nula sea verdadera dado que hemos observado el estadístico de prueba
R: P (H 0 | R). Pero el procedimiento que describimos anteriormente en realidad solo calculó
la probabilidad condicional de obtener un estadístico de prueba R dado que la hipótesis nula
es verdadera: P (R | H 0). Rara vez es P (R | H 0) = P (H 0 | R).
Aunque la prueba de hipótesis y el rechazo de una hipótesis nula pueden no ser una
forma muy satisfactoria de estimar la importancia estadística, el hecho de no rechazar una
hipótesis nula puede inspirar ideas muy interesantes. Nuestro ejemplo 1.1 muestra que
cualquier distribución de retornos aleatorios con alta curtosis puede ser favorable a las
estrategias de impulso.
■ Cuándo no realizar una prueba retrospectiva de una estrategia

Hemos trabajado mucho antes para convencerlo de que debe realizar una prueba
retrospectiva de todas las estrategias que se le presenten antes de negociarlas. ¿Por qué
recomendaríamos no realizar pruebas retrospectivas de algunas estrategias? El hecho es que
hay algunas estrategias publicadas que son tan obviamente defectuosas que sería una
pérdida de tiempo incluso considerarlas. Teniendo en cuenta lo que sabe ahora acerca de los
errores comunes del backtesting, está en una buena posición para juzgar si le gustaría
realizar un backtesting de una estrategia sin siquiera conocer los detalles. Veremos algunos
ejemplos aquí.
TRADUCCIÓN 24
Ejemplo 1: Una estrategia que tiene un rendimiento anualizado backtest del 30 por ciento
y un índice de Sharpe de 0.3, y una duración máxima de reducción de dos años. Muy pocos
traders (a diferencia de los "inversores") tienen el estómago para una estrategia que
permanece "sumergida" durante dos años. La baja proporción de Sharpe junto con la larga
duración de la reducción indica que la estrategia no es consistente. El alto rendimiento
promedio puede ser solo un error, y no es probable que se repita cuando comencemos a
operar con la estrategia en vivo. Otra forma de decir esto es que el alto rendimiento es
probablemente el resultado de un sesgo de búsqueda de datos, y la larga duración de la
reducción hará que sea poco probable que la estrategia pase una prueba de validación
cruzada. No se moleste en realizar pruebas retrospectivas de las estrategias de alto
rendimiento pero bajo índice de Sharpe. Además, no se moleste en realizar pruebas
retrospectivas de estrategias con una duración máxima de reducción más larga de lo que
usted o sus inversores puedan soportar.
Ejemplo 2: Una estrategia de futuros de petróleo crudo a largo plazo arrojó un

rendimiento del 20 por ciento en 2007, con un índice de Sharpe de 1,5. Una revisión rápida del
rendimiento total de mantener los futuros del petróleo crudo del primer mes en 2007 revela
que fue del 47 por ciento, con un índice de Sharpe de 1,7. Por lo tanto, esta estrategia
comercial no es de ninguna manera superior a una simple estrategia de compra y retención.
Moraleja de la historia: Siempre debemos elegir el punto de referencia apropiado para medir
una estrategia comercial. El punto de referencia apropiado de una estrategia a largo plazo es
el retorno de una posición de compra y retención: el índice de información en lugar del índice
de Sharpe.
Ejemplo 3: Una estrategia simple de "compra baja, vende alta" elige las 10 acciones con
el precio más bajo al comienzo del año y las mantiene durante un año. El rendimiento del
backtest en 2001 es del 388 por ciento. La primera pregunta que debe surgir al leer esta
estrategia es: ¿Se probó la estrategia utilizando una base de datos de existencias libre de
sesgos de supervivencia? En otras palabras, ¿la base de datos de acciones incluye aquellas
acciones que desde entonces se han eliminado de la lista? Si la base de datos incluye solo
las poblaciones que han sobrevivido hasta hoy, entonces la estrategia probablemente
seleccionará a los sobrevivientes afortunados que resultaron ser muy baratos a principios de
2001. Con el beneficio de la retrospectiva, la prueba retrospectiva puede, por supuesto, lograr
un Rendimiento del 388 por ciento. Por el contrario, si la base de datos incluye acciones
excluidas de la lista, lo más probable es que la estrategia elija esas acciones para formar la
cartera, lo que resultará en una pérdida de casi el 100 por ciento. Esta pérdida del 100 por
ciento sería el rendimiento realizado si hubiéramos intercambiado la estrategia en 2001, y el
rendimiento del 388 por ciento es un rendimiento de backtest inflado que nunca se podrá
realizar. Si el autor no mencionó específicamente que los datos utilizados incluyen acciones
excluidas de la lista, entonces podemos suponer que el backtest sufre un sesgo de
supervivencia y es probable que el rendimiento esté inflado.
TRADUCCIÓN 25
Ejemplo 4: Un modelo de comercio de red neuronal que tiene alrededor de 100 nodos
genera un índice de Sharpe de backtest de 6. Mis alarmas siempre se disparan cuando
escucho el término modelo de comercio de red neuronal, sin mencionar uno que tiene 100
nodos. Todo lo que necesita saber sobre los nodos en una red neuronal es que el número de
parámetros que se ajustarán con los datos de entrenamiento en la muestra es proporcional
al número de nodos. Con al menos 100 parámetros, ciertamente podemos ajustar el modelo
a cualquier serie temporal que queramos y obtener una fantástica relación de Sharpe. No
hace falta decir que tendrá poco o ningún poder predictivo en el futuro debido al sesgo de
búsqueda de datos.
Ejemplo 5: Una estrategia de negociación de futuros de E-mini S&P 500 de alta

frecuencia tiene un rendimiento promedio anual de backtest del 200 por ciento y un índice de
Sharpe de 6. Su período de tenencia promedio es de 50 segundos. ¿Realmente podemos
probar una estrategia comercial de alta frecuencia? El rendimiento de una estrategia de
negociación de alta frecuencia depende de los tipos de órdenes utilizados y del método de
ejecución en general. Además, depende fundamentalmente de la microestructura del
mercado. Incluso si tenemos datos históricos de toda la cartera de pedidos, el beneficio de
una estrategia de alta frecuencia sigue dependiendo en gran medida de las reacciones de
otros participantes del mercado. Uno tiene que preguntarse si existe un "principio de
incertidumbre de Heisenberg" en funcionamiento: el acto de colocar o ejecutar una orden
podría alterar el comportamiento de los otros participantes del mercado. Por lo tanto, sea
muy escéptico con el llamado backtest de una estrategia de alta frecuencia.
La vida es demasiado corta para realizar pruebas retrospectivas de todas y cada una de
las estrategias sobre las que leemos, por lo que esperamos que el conocimiento de los
errores comunes de las pruebas retrospectivas lo ayude a seleccionar qué estrategias
probar.
■ ¿Una prueba retrospectiva podrá predecir los rendimientos

futuros?
Incluso si logramos evitar todas las trampas comunes descritas anteriormente y hay
suficientes operaciones para garantizar la importancia estadística del backtest, el poder
predictivo de cualquier backtest se basa en el supuesto central de que las propiedades
estadísticas de la serie de precios no cambian, de modo que las reglas comerciales que
fueron rentables en el pasado serán rentables en el futuro. Por supuesto, esta suposición se
invalida a menudo en diversos grados: cambia la perspectiva económica de un país, cambia
la administración de una empresa y cambia la estructura del mercado financiero. En la última
década en los Estados Unidos, hemos sido testigos de numerosos casos de la última
categoría de cambios. Entre ellos:
TRADUCCIÓN 26
■ Decimalización de las cotizaciones de las acciones de EE. UU. El 9 de abril de 2001.

(Antes de esta fecha, las acciones de EE. UU. Se cotizaban en un octavo o un dieciseisavo de
un centavo). liquidez "a la mejor oferta y demanda de precios que disminuyan (Arnuk y
Saluzzi, 2012). Esto, a su vez, provocó que la rentabilidad de muchas estrategias de arbitraje
estadístico disminuyera al tiempo que aumentaba la rentabilidad de muchas estrategias de
alta frecuencia.
■ La crisis financiera de 2008 que provocó un posterior colapso del 50 por ciento del
volumen promedio diario de transacciones (Durden, 2012). El comercio minorista y la
propiedad de acciones ordinarias se reducen particularmente. Esto ha llevado a una
disminución de la volatilidad promedio de los mercados, pero con una frecuencia cada vez
mayor de estallidos repentinos como el que ocurrió durante la crisis repentina en mayo de
2010 y la rebaja de la calificación crediticia de la deuda federal de EE. UU. En agosto de 2011.
El efecto general ha sido un Disminución general de las utilidades de las estrategias de
reversión a la media, que prosperan en un nivel alto pero constante de volatilidad.
■ La misma crisis financiera de 2008, que también inició un mercado bajista de varios
años en las estrategias de impulso, como se analiza en el Capítulo 6. ■ El NMS de la
Regulación de la SEC se implementó en julio de 2007, lo que también contribuyó a la drástica
disminución en los tamaños promedio de las operaciones y la obsolescencia. del comercio
de bloques de la NYSE (Arnuk y Saluzzi, 2012). Las estrategias que funcionaron de manera
excelente antes de cada uno de estos "cambios de régimen" pueden dejar de funcionar y
viceversa. Las pruebas retrospectivas realizadas con datos antes de dichos cambios de
régimen pueden ser bastante inútiles, mientras que las pruebas realizadas con datos
recientes pueden no ser más indicativas de beneficios futuros si se produce un cambio de
régimen futuro. El punto general de esto es que el comercio algorítmico no se trata solo de
algoritmos, programación y matemáticas: también se necesita un conocimiento de estos
temas fundamentales económicos y de mercado para informarnos sobre si un backtest es
predictivo y seguirá siendo predictivo.
■ Elección de una plataforma de ejecución automatizada y

backtesting
Las empresas de software han trabajado muy duro para proporcionar a los operadores
una amplia variedad de backtesting y plataformas de ejecución automatizada que se adaptan
a todos los niveles posibles de habilidades de programación. Nos enfrentamos a dos
opciones básicas a la hora de decidirnos por una plataforma de negociación:
1. Comprar una plataforma de ejecución y backtesting de propósito especial, e

implementar su estrategia utilizando la interfaz gráfica de usuario (GUI) de propósito especial
TRADUCCIÓN 27
de esa plataforma o el lenguaje de programación. 2. Escribir su propio programa de ejecución

y backtest en un lenguaje de programación genérico como C ++, ya sea de manera
completamente independiente con compras parciales de bibliotecas de software para
facilitar la tarea o dentro de un entorno de desarrollo integrado (IDE) que viene con una
biblioteca completa. atendiendo al comercio algorítmico.
A continuación, consideramos algunos criterios para tomar esta decisión.
¿Qué tan buena es su habilidad de programación?

Si tiene poca habilidad en la programación, entonces la única opción es elegir una
plataforma de operaciones especial. Estas plataformas alivian al usuario de tener que
aprender un lenguaje de programación al presentar una interfaz gráfica de usuario de
"arrastrar y soltar" para construir una estrategia comercial. Ejemplos de estos productos son
Deltix y Progress Apama. Sin embargo, he descubierto que estas GUI pueden ser bastante
limitantes en la variedad de estrategias que puede construir y, a la larga, es mucho más
eficiente convertirse en un experto en un lenguaje de programación para poder expresar su
estrategia. (Tenga en cuenta que Deltix y Progress Apama también permiten otras formas de
especificar una estrategia, como se explica a continuación). Los operadores que posean el
siguiente nivel de habilidad en programación deberían considerar implementar tanto
backtesting como ejecución automatizada usando uno de los lenguajes de scripting. Estos
lenguajes no requieren compilación y puede ver instantáneamente los resultados en el
momento en que termine de escribir las expresiones matemáticas o lógicas. La plataforma
de backtesting favorita de muchos comerciantes, Microsoft Excel, quizás utilizada junto con
macros de Visual Basic (VB), pertenece a esta categoría. Pero en realidad es bastante difícil
construir una estrategia razonablemente complicada en Excel, y aún más difícil depurarla.
Excel tampoco es un lenguaje particularmente de alto rendimiento, por lo que si su estrategia
es muy intensiva en computación, no funcionará. Si usa Excel para ejecuciones
automatizadas, puede encontrar que tiene que usar enlaces DDE proporcionados por su
corretaje para actualizaciones de datos de mercado, y probablemente necesitará agregar
macros de Visual Basic para manejar una lógica comercial más complicada, que es bastante
ineficaz. . (Sin embargo, consulte el recuadro 1.1 para ver una plataforma de negociación
similar a Excel que está sobrealimentada para la eficiencia).
RECUADRO 1.1
Excel con esteroides: la plataforma de ejecución automatizada

FXone
TRADUCCIÓN 28
Existe una plataforma de comercio de divisas llamada FXone que se parece a Excel, pero
el motor computacional subyacente está escrito en un lenguaje de alto rendimiento como C
++ en lugar de depender de macros VB. Es una verdadera aplicación basada en ticks: cada
tick (en el caso de FX, un tick es una nueva cotización) activa un nuevo cálculo de todos los
valores en todas las celdas de la hoja de cálculo. Además, tiene una memoria caché interna
para datos en tiempo real, de modo que diferentes celdas que requieren los mismos datos
para computar pueden simplemente recuperarlos de la memoria caché, en lugar de duplicar
suscripciones de los mismos datos. También es una verdadera plataforma multiproceso en
dos niveles diferentes. Primero, diferentes estrategias escritas en diferentes libros de Excel
pueden obtener actualizaciones de datos de mercado y enviar pedidos simultáneamente. En
segundo lugar, diferentes celdas dentro del mismo libro de trabajo también pueden obtener
actualizaciones y actuar sobre nuevos datos simultáneamente. Es decir, incluso si el cálculo
en una celda tarda mucho en completarse, no evitará que otras celdas respondan a un nuevo
tick, por ejemplo, enviando un pedido. En la Figura 1 se muestra una captura de pantalla de
FXone.Muchas plataformas comerciales de propósito especial, incluidas QuantHouse y RTD
Tango y las ya mencionadas Deltix y Progress Apama, también incluyen formas de codificar
una estrategia con sus propios lenguajes de programación patentados, que suelen ser
bastante simples y fáciles. de aprender, tal vez tan fácil como Visual Basic. Aparte de las
plataformas institucionales mencionadas aquí, muchos comerciantes minoristas están
familiarizados con MetaTrader, NinjaTrader, Trading Blox o TradeStation Easy Language. No
he probado todas estas plataformas personalmente, pero tengo la sospecha persistente de
que, a pesar de la aparente facilidad de uso y otras ventajas que menciono más adelante,
todas de alguna manera imponen algunas limitaciones en el tipo de estrategias que se
pueden probar y ejecutar.
Al requerir solo un poco más de habilidades que la programación en VB, los operadores
encontrarán que los lenguajes de scripting de MATLAB, R y Python ofrecen mucha más
facilidad de depuración, mucha mayor flexibilidad en el tipo de estrategias que se pueden
probar y una mayor eficiencia. en backtesting de grandes conjuntos de datos. Estos son los
que llamamos lenguajes "REPL". REPL significa "Read-Eval-Print-Loop" en lenguaje de
programador. Es decir, puede escribir una expresión matemática y el programa la evaluará
inmediatamente, imprimirá la respuesta y se preparará para que ingrese la siguiente
expresión. Funciona exactamente como una calculadora de mano, pero mejor: también
puede guardar todas estas expresiones en un archivo y hacer que el programa las ejecute
automáticamente de forma secuencial. La sintaxis de estos lenguajes está diseñada para ser
más intuitiva y más fácil de entender que los lenguajes de programación convencionales
como C ++ y mucho más fl exible en cuanto al tipo de variables que se pueden utilizar en un
programa. Los escalares, matrices y cadenas se tratan básicamente con una sintaxis similar
y se pasan a las funciones de la misma manera.
MATLAB también puede utilizar bibliotecas Java, C ++ o C # o interfaces de

TRADUCCIÓN 29
programación de aplicaciones (API) y llamar a funciones implementadas en esas bibliotecas

o API. Esto permite que MATLAB aproveche las implementaciones más eficientes en esos
lenguajes convencionales cuando una tarea es particularmente intensiva desde el punto de
vista informático. Además, hay muchas más bibliotecas y API que están escritas en esos
lenguajes convencionales que las escritas en MATLAB, R o Python, por lo que esta
característica suele ser esencial.
Muchos operadores algorítmicos son conscientes de que MATLAB, R y Python son

lenguajes excelentes para realizar backtesting. Pero menos conocido es el hecho de que
también se pueden convertir en plataformas de ejecución con la adición de algunas cajas de
herramientas. La mayoría de las corredurías tienen API escritas en Java, C ++ o C #; y, como
dije antes, MATLAB puede llamar a funciones en API escritas en dichos lenguajes, aunque se
necesita algo de familiaridad con estos lenguajes para saber cómo llamar a estas funciones.
Si prefiere una solución que evite realizar llamadas a API en "idiomas extranjeros" en
MATLAB, hay varios productos comerciales disponibles. La propia caja de herramientas
Datafeed de MATLAB puede enviar órdenes a X_TRADER de Trading Technologies. Para
conectar MATLAB a Interactive Brokers, undocumentedmatlab.com ha desarrollado una API
llamada IB-Matlab. Otro proveedor, www.exchangeapi.com, tiene una API similar llamada
quant2ib, así como una llamada quant2tt para conectar MATLAB a Trading Technologies.
Para otras corredurías, www. pracplay.com ofrece un puente de MATLAB o R a 15 o más
corredores por una tarifa mensual. Jev Kuznetsov desarrolló una API de MATLAB de código
abierto y gratuita para conectarse a Interactive Brokers y está disponible para su descarga
desde el intercambio de archivos de MATLAB Central. Mientras tanto, el software MAT-FIX de
agoratron.com permite que su programa MATLAB envíe pedidos utilizando el protocolo
Financial Information eXchange (FIX) a corredores o bolsas. También puede utilizar MATLAB
para llamar a las funciones Java o .NET en QuickFIX, un motor FIX de código abierto (Kozola,
2012). Para los usuarios de Python, el software gratuito de código abierto IbPy conectará su
programa de comercio de Python a Interactive Brokers. Si bien estos complementos para
MATLAB y Python permiten conectarse a un intermediario, no lo protegen de toda la
complejidad de dichas conexiones. Y, lo que es más importante, es engorroso utilizar el
mismo programa tanto para el backtesting como para la ejecución.
Si usted es un programador empedernido, por supuesto, no tendrá problemas para

realizar backtesting y automatizar la ejecución directamente en los lenguajes de
programación más flexibles, eficientes y robustos, como el trío mencionado de Java, C ++ o
C#. Como dije anteriormente, todas las casas de bolsa o intercambios que atienden a
comerciantes algorítmicos proporcionan API en uno o más de estos lenguajes, o le permiten
enviar pedidos utilizando los mensajes FIX, que a su vez pueden crearse y transmitirse
utilizando un programa escrito en uno. de estos idiomas. (Por ejemplo, QuickFIX, mencionado
anteriormente, está disponible en C ++, C #, VB, Python y Ruby). Pero incluso aquí, la industria
del software ha llegado a hacer que la implementación de nuestra estrategia sea más fácil y
TRADUCCIÓN 30
más robusta al proporcionar IDE diseñados solo para backtesting. De hecho, muchas de las
plataformas comerciales de propósito especial (Deltix, Progress Apama, QuantHouse, RTD
Tango, etc.) incluyen formas de codificar estrategias utilizando lenguajes de programación
avanzados de propósito general que los hacen parecerse a los IDE. También hay librerías de
clases de código abierto o IDE que describo en la siguiente sección.
¿Pueden el backtesting y la ejecución utilizar el mismo programa?

Las plataformas de ejecución de propósito especial generalmente ocultan la
complejidad de conectarse a un corretaje o bolsa, recibir datos de mercado en vivo, enviar
órdenes y recibir confirmaciones de órdenes, actualizar posiciones de cartera, etc. del
programador. Mientras tanto, las plataformas de backtesting de propósito especial
generalmente vienen integradas con datos históricos. Entonces, para muchas plataformas
comerciales de propósito especial, el programa de backtest se puede hacer lo mismo que el
programa de ejecución en vivo al factorizar la lógica comercial pura en una función, libre de
detalles sobre cómo recuperar datos o dónde enviar órdenes, y cambiando entre El modo de
backtesting y el modo de ejecución en vivo se pueden realizar presionando un botón para
cambiar entre la alimentación de datos históricos y los datos de mercado en vivo.
Esta facilidad para cambiar entre backtesting y ejecución en vivo es más que simple
conveniencia: elimina cualquier posibilidad de discrepancias o errores al transcribir una
estrategia de backtest en una estrategia en vivo, discrepancias que a menudo plagan las
estrategias escritas en un lenguaje de programación general, ya sea C ++ o MATLAB . Igual
de importante, elimina la posibilidad de sesgo de anticipación. Como se explicó
anteriormente, el sesgo de anticipación significa incorporar por error información futura
desconocida como parte de la entrada de datos históricos al motor de backtest. Las
plataformas de propósito especial alimentan los datos históricos del mercado en el motor de
generación de comercio, un tic o una barra a la vez, tal como lo harían con los datos del
mercado en vivo. Por lo tanto, no hay posibilidad de que se pueda utilizar información futura
como entrada. Esta es una de las principales ventajas de utilizar una plataforma de
negociación con fines especiales.
Existe una ventaja más en el uso de una plataforma donde los programas de backtesting
y ejecución en vivo son uno y el mismo: permite el backtesting de estrategias de trading de
alta frecuencia basadas en ticks. Esto se debe a que la mayoría de los programas de
ejecución en vivo de nivel industrial están "controlados por eventos"; es decir, una operación
se desencadena por la llegada de un nuevo tick, no por el final de una barra de tiempo
arbitraria. Entonces, si los datos históricos de entrada también se basan en ticks, también
podemos probar una estrategia de alta frecuencia que depende del cambio de cada tick o
incluso de cada cambio en la cartera de pedidos. (Dije "en teoría" asumiendo que su
hardware es lo suficientemente potente. De lo contrario, consulte la discusión más adelante
TRADUCCIÓN 31
en este capítulo en la sección "¿Qué tipo de clases de activos o estrategias admite la

plataforma?") estrategias basadas en MATLAB introduciendo cada tick en el programa
también, aunque es un procedimiento bastante engorroso.
Si es un programador competente que prefiere la flexibilidad de un lenguaje de

programación de propósito general, pero desea utilizar el mismo programa tanto para
backtesting como para operaciones en vivo debido a las consideraciones anteriores, aún
puede usar las plataformas de propósito especial de grado institucional. como IDE, o puede
utilizar los muchos IDE de código abierto disponibles: Marketcetera, Trade-Link, Algo-Trader,
ActiveQuant. Los llamo IDE, pero son más que un entorno de desarrollo de estrategias
comerciales: vienen con bibliotecas que se ocupan de los aspectos básicos de la conexión e
intercambio de datos con su corredor, al igual que lo hace una plataforma de propósito
especial. Muchos de ellos también están integrados con datos históricos, lo que supone un
importante ahorro de tiempo. Como ventaja adicional, estos IDE de código abierto son
gratuitos o de bajo costo en comparación con las plataformas de propósito especial. En la
Tabla 1.2 muestro los idiomas, mercados y corredores que admiten. (FIX como intermediario
significa que el sistema puede acceder directamente a cualquier lugar de ejecución a través
del protocolo FIX, independientemente del intermediario de compensación). También indico
si el IDE está basado en ticks (a veces llamado basado en eventos o basado en flujo).
Uno debe notar que
¿Qué tipo de clases de activos o estrategias admite la plataforma?

Si bien el uso de una plataforma de propósito especial para estrategias comerciales tiene
varias ventajas importantes descritas anteriormente, pocas, pero la más alta de estas
plataformas, admiten todas las clases de activos posibles, incluidas acciones, futuros,
divisas y opciones. Por ejemplo, el popular MetaTrader es solo para el comercio de divisas.
Es especialmente difícil para estas plataformas negociar estrategias que implican arbitraje
entre diferentes clases de activos, como entre futuros y acciones o divisas y futuros. Los IDE
de código abierto pueden manejar mejor estas situaciones. Como indica la Tabla 1.2, la
mayoría de los IDE pueden negociar con una variedad de clases de activos. Pero, como de
costumbre, la solución más fl exible a este respecto es un programa independiente escrito
fuera de cualquier IDE. Más allá de las clases de activos, muchas plataformas de propósito
especial también imponen restricciones sobre el tipo de estrategias que admiten incluso
dentro de una clase de activos. A menudo, las estrategias de negociación de pares simples
requieren módulos especiales para su manejo. La mayoría de las plataformas de gama baja
no pueden manejar estrategias de negociación de cartera o arbitraje estadístico común que
involucran muchos símbolos. Los IDE de código abierto no tienen tales restricciones y, por
supuesto, tampoco los programas independientes.
TRADUCCIÓN 32
¿Qué pasa con el comercio de alta (más) frecuencia? ¿Qué tipo de plataformas pueden
soportar esta exigente estrategia comercial? La respuesta sorprendente es que la mayoría de
las plataformas pueden manejar la parte de ejecución del comercio de alta frecuencia sin
demasiada latencia (siempre que su estrategia pueda tolerar latencias en el rango de 1 a 10
milisegundos), y desde plataformas de propósito especial así como Los IDE suelen utilizar el
mismo programa tanto para el backtesting como para la ejecución; en teoría, el backtesting
tampoco debería ser un problema.
Para entender por qué la mayoría de las plataformas no tienen problemas para manejar
ejecuciones de alta frecuencia, tenemos que darnos cuenta de que la mayor parte de la
latencia que debe superarse en el comercio de alta frecuencia se debe a la latencia de datos
del mercado en vivo o la latencia de confirmación de órdenes de corretaje.
Latencia de datos de mercado en vivo:

Para que su programa reciba una nueva cotización o precio comercial dentro de 1 a 10
milisegundos (ms), debe colocar su programa en la bolsa o en el centro de datos de su
corredor (ver Cuadro 1.2); además, debe recibir una fuente de datos directa de los
intercambios involucrados, no de una fuente de datos consolidada como el Consolidated
Tape System (CTS) de SIAC. (Por ejemplo, los datos de Interactive Brokers solo ofrecen
instantáneas de los datos del mercado cada 250 ms). 2. Latencia de confirmación de la orden
de corretaje:
Si una estrategia envía órdenes limitadas, dependerá de una confirmación oportuna del
estado de la orden antes de que pueda decidir qué hacer a continuación. En el caso de
algunas corredurías minoristas, pueden transcurrir hasta seis segundos entre la ejecución de
una orden y la recepción de la confirmación de ejecución por parte del programa,
prácticamente RECUADRO 1.2
Colocación de programas comerciales

El término general colocación puede significar varias formas de ubicar físicamente su
programa de operaciones fuera de su computadora de escritorio. Extendiendo un poco la
definición, puede significar instalar su programa de operaciones en un servidor en la nube o
VPS (servidor privado virtual) como EC2 de Amazon, slicehost.com o gogrid. com. La ventaja
de hacerlo es evitar cortes de energía o de Internet que es más probable que afecten a una
casa u oficina privada que a un centro de datos comercial, con su fuente de alimentación de
respaldo y conectividad de red redundante. Colocarse en un servidor en la nube no
necesariamente acorta el tiempo que tardan los datos en viajar entre su corretaje o un
intercambio a su programa comercial, ya que muchos hogares u oficinas ahora están
TRADUCCIÓN 33
equipados con una conexión de fibra óptica a su proveedor de servicios de Internet (por
ejemplo, Verizon's FiOS en los Estados Unidos y Bell's Fibe Internet en Canadá). Para verificar
si la colocación en un servidor privado virtual (VPS) realmente reduce esta latencia,
necesitaría realizar una prueba usted mismo haciendo "ping" al servidor de su corredor para
ver cuál es el tiempo promedio de ida y vuelta. Ciertamente, si su VPS está ubicado
físicamente cerca de su corredor o intercambio, y si están conectados directamente a una
red troncal de Internet, esta latencia será menor. (Por ejemplo, hacer ping al servidor de
cotizaciones de Interactive Brokers desde mi computadora de escritorio doméstica produce
un tiempo de ida y vuelta promedio de aproximadamente 55 ms, hacer ping al mismo
servidor desde EC2 de Amazon tarda unos 25 ms, y hacer ping desde varios VPS ubicados
cerca de Interactive Brokers lleva alrededor de 16 a 34 ms.) Menciono VPS solo porque
muchos programas comerciales no son tan intensivos en computación como para requerir
sus propios servidores dedicados. Pero si lo están, ciertamente puede actualizar a dichos
servicios en muchas de las empresas de alojamiento familiarizadas con los requisitos de la
industria del comercio financiero, como Equinix y Telx, que operan centros de datos en las
proximidades de los distintos intercambios.
Si su servidor ya se encuentra en una ubicación segura (ya sea su oficina o un centro de

datos) y es inmune a cortes de energía, entonces todo lo que necesita es una conexión rápida
con su corredor o el intercambio. Puede considerar el uso de una "extranet", que es como
Internet pero operada por una empresa privada, que garantizará una velocidad de
comunicación mínima. BT Radianz, Savvis y TNS son ejemplos de este tipo de empresas. Si
tiene un gran presupuesto, también puede pedirles a estas empresas que creen una línea de
comunicación dedicada desde su servidor a su corredor o intercambio.
El siguiente paso en la jerarquía de colocación es ubicarse dentro del centro de datos de

su corretaje, de modo que las cotizaciones o la confirmación de órdenes generadas por su
corredor se transmitan a su programa a través de una red interna, sin ser molestados por el
ruido y los caprichos de la Internet pública. Varios corredores que atienden a comerciantes
profesionales han puesto a disposición el servicio de colocación: ejemplos son Lime
Brokerage y FXCM. (Debido a la colocación, los clientes de Lime Brokerage pueden incluso
recibir datos directos de la NYSE en un (Continuación)
RECUADRO 1.2 (continuación)

tasa relativamente baja, que, como mencioné antes, es más rápida que la fuente de
datos SIAC CTS consolidada).
La colocación definitiva es, por supuesto, ubicar su servidor de operaciones en el

intercambio o ECN en sí. Es probable que esta sea una propuesta costosa (excepto para las
ECN de forex) y útil solo si tiene una relación de corredor principal, lo que le permite tener
TRADUCCIÓN 34
"acceso patrocinado" para conectarse al intercambio sin pasar por la infraestructura del
corredor (Johnson, 2010 ). Dichas relaciones con los principales corredores generalmente se
pueden establecer solo si puede generar comisiones de nivel institucional o si tiene una
cuenta multimillonaria. Los requisitos y los gastos para establecer la colocación son más
bajos para los corredores principales de divisas y las ECN. La mayoría de ECN de forex,
incluidos Currenex, EBS, FXall y Hotspot, operan dentro de grandes centros de datos
comerciales, como la instalación NY4 de Equinix, y no es demasiado costoso ubicarse en esa
instalación o registrarse con un VPS que lo haga.
Algunos comerciantes han expresado su preocupación de que la ubicación de sus

programas comerciales en un servidor remoto los exponga a un posible robo de su propiedad
intelectual. La forma más sencilla de eliminar este riesgo es simplemente almacenar
"ejecutables" (códigos informáticos binarios que parecen un galimatías para los humanos) en
estos servidores remotos, y no el código fuente de su algoritmo comercial. (Incluso con un
programa MATLAB, puede convertir todos los archivos .m a archivos .p antes de cargarlos en
el servidor remoto). Sin códigos fuente, nadie puede conocer las instrucciones de
funcionamiento para ejecutar el programa comercial, ni nadie será lo suficientemente tonto
como para arriesgar capital en el comercio de una estrategia de caja negra de la que saben
poco. Para los verdaderamente paranoicos, también puede requerir una contraseña en
constante cambio que depende de la hora actual para iniciar un programa.
garantizar que no se puedan realizar transacciones de alta frecuencia. Incluso si su

corretaje tiene una latencia de confirmación de la orden por debajo de 10 ms, o si le permiten
tener acceso directo al mercado a los intercambios para que pueda obtener la confirmación
del estado de su pedido directamente de los intercambios, aún deberá colocar su programa
con su corredor en el primer caso, o con el intercambio en el último caso.
Prácticamente cualquier programa de software (que no sea Excel que se ejecuta con una
macro VB) tarda menos de 10 ms en enviar un nuevo pedido después de recibir los últimos
datos del mercado y las actualizaciones del estado del pedido, por lo que la latencia del
software o hardware no suele ser el cuello de botella para el comercio de alta frecuencia. , a
menos que esté usando un programa para monitorear miles de símbolos. (Con respecto a
este último punto, consulte el Recuadro 1.3 para conocer las cuestiones relacionadas con el
subproceso múltiple). Pero realizar una prueba retrospectiva de una estrategia de alta
frecuencia es un asunto completamente diferente. Para hacer esto, se le pedirá que ingrese
muchos meses de datos de ticks (operaciones y cotizaciones), tal vez en muchos símbolos,
en la plataforma de backtesting. Peor aún, a veces también debe ingresar cotizaciones de
nivel 2. Solo la cantidad de datos abrumará la memoria de la mayoría de las máquinas, si no
se manejan de formas especiales (como el uso de algoritmos de computación en paralelo).
La mayoría de las plataformas de backtesting de propósito especial no están diseñadas para
ser especialmente inteligentes al manejar esta cantidad de datos, y la mayoría de ellas no
TRADUCCIÓN 35
están equipadas para realizar backtesting de datos con todos los precios (y tamaños) de
oferta / demanda / último tick ni cotizaciones de nivel 2 ya sea. Por lo tanto, realizar una
prueba retrospectiva de una estrategia de alta frecuencia generalmente requiere que escriba
su propio programa independiente con personalización especial. En realidad, el backtesting
de una estrategia de alta frecuencia puede no decirle mucho sobre su rentabilidad en la vida
real de todos modos debido al principio de incertidumbre de Heisenberg que mencioné antes.
Además del comercio de alta frecuencia, el comercio impulsado por noticias a menudo
hace que todas las plataformas con fines especiales, excepto las de alto nivel, tropiecen. El
comercio impulsado por noticias por definición requiere como entrada una fuente de noticias
legible por máquina. La mayoría de las plataformas de propósito especial no tienen esta
capacidad, y tampoco la mayoría de los IDE de código abierto. Las excepciones incluyen
Progress Apama, que incorpora fuentes de noticias legibles por máquina de Dow Jones y
Reuters, y Deltix, que integra la fuente de datos News Sentiment de Ravenpack. Entre los IDE,
Marketcetera ofrece un suministro de noticias de benzinga.com (que es poco probable que
coincida con la velocidad de entrega de Bloomberg, Dow Jones y Reuters). Si está
escribiendo su propio recuadro de negociación independiente RECUADRO 1.3
Intercambio de múltiples subprocesos y alta frecuencia de varios

símbolos
El multiproceso para una plataforma comercial significa que puede responder a múltiples
eventos (generalmente la llegada de un nuevo tick) simultáneamente. Esto es
particularmente importante si el programa intercambia varios símbolos simultáneamente, lo
que suele ser el caso de un programa de negociación de acciones. ¡Ciertamente no desea
que su orden de compra de AAPL se retrase solo porque el programa está decidiendo si
vender BBRY! Si escribe su propio programa de negociación independiente utilizando un
lenguaje de programación moderno como Java o Python, no tendrá ningún problema con el
subproceso múltiple porque esta capacidad es nativa de dichos lenguajes. Sin embargo, si
utiliza MATLAB, también deberá adquirir Parallel Computing Toolbox; de lo contrario, no hay
subprocesos múltiples. (Incluso si compra esa Caja de herramientas, está limitado a 12
subprocesos independientes, ¡apenas lo suficiente para negociar 500 acciones
simultáneamente!) Pero no confunda la falta de subprocesos múltiples en MATLAB con la
"pérdida de ticks". Si escribe dos "oyentes", A y B, en MATLAB para recibir datos de tick de
dos símbolos separados, porque el hecho de que el oyente A esté ocupado procesando un
evento activado por tick no significa que el oyente B sea "sordo". Una vez que el oyente A ha
terminado de procesar, el oyente B comenzará a procesar los eventos tick que recibió
mientras A estaba ocupado, sin tics perdidos (Kuznetsov, 2010).
programa, tiene la fl exibilidad de conectarse a estas fuentes de noticias utilizando la API

TRADUCCIÓN 36
del proveedor de noticias (por ejemplo, tanto Dow Jones como Thomson Reuters han puesto
a disposición sus noticias legibles por máquina a través de una API) o simplemente leer un
archivo XML de noticias ftp ' periódicamente a su disco duro por el proveedor de noticias. Si
está negociando noticias con alta frecuencia, la antigua y costosa solución es una necesidad
absoluta. De lo contrario, existen soluciones mucho más asequibles de proveedores como
Newsware. Discutiré más sobre el tema del comercio impulsado por eventos en el Capítulo 7.
¿Tiene la plataforma un procesamiento de eventos complejo?

El procesamiento de eventos complejos (CEP) es un término de moda para describir un
programa que responde a un evento instantáneamente y toma la acción apropiada. Los
hechos que nos preocupan suelen ser la llegada de un nuevo tick, o la entrega de una noticia.
Para un trader algorítmico, un punto importante es que el programa se basa en eventos y no
en barras. Es decir, el programa no realiza encuestas de precios o noticias al final de cada
barra y luego decide qué hacer. Debido a que el CEP está impulsado por eventos, no hay
demora entre la ocurrencia de un evento y la respuesta al mismo.
Si la instantaneidad es la única fortaleza de CEP, entonces podemos usar las llamadas

funciones de devolución de llamada que proporcionan casi todas las API de corretaje. Una
función de devolución de llamada también se activa cada vez que llega un nuevo tick o
noticia, y en base a estos nuevos datos podemos realizar todo tipo de cálculos y determinar
si enviar un pedido. Esto es fácil cuando la regla requerida es simplemente "promedio móvil
del precio durante la última hora".
Pero, ¿qué pasa si las reglas son "complejas", como "vender cuando el flujo de órdenes
en la última media hora es positivo, el precio está por encima de la media móvil, la volatilidad
es baja y acaba de llegar una noticia importante"?
¿Qué pasa si la regla involucra muchas cláusulas como durante, entre, después, en
paralelo cuando se aplica a la secuencia de eventos? Según los aficionados al CEP, es mucho
más sucinto expresar estas complicadas reglas utilizando un lenguaje CEP que un lenguaje
de programación tradicional. Pero, ¿qué pasa con el argumento de que las reglas
comerciales deberían ser simples para evitar el sesgo de espionaje de datos? Su respuesta
es que no están extrayendo datos para encontrar reglas arbitrarias, sino simplemente
implementando reglas que los comerciantes experimentados ya saben que son rentables. •
El backtesting es inútil si no predice el desempeño futuro de una estrategia, pero los
obstáculos en el backtesting disminuirán su poder predictivo.
• Eliminando trampas:
• Una plataforma que utiliza el mismo programa para backtesting y ejecuciones en vivo
TRADUCCIÓN 37
puede eliminar el sesgo de anticipación.
• Las pruebas fuera de muestra, la validación cruzada y las altas proporciones de Sharpe
son buenas prácticas para reducir el sesgo de búsqueda de datos, pero ninguna es más
definitiva que las pruebas de avance.
• Los modelos simples son una cura simple para el sesgo de espionaje de datos.
• "¿Por qué mi modelo generó una señal 'corta' para THQI el 9 de julio de 2012? ¡Oh, eso
es porque olvidé ajustar sus precios históricos para una división inversa de acciones de 1:10!"
• "¿Su modelo acaba de comprar las acciones de CMC? ¿Está seguro de que no se olvidó
de ajustar sus precios históricos porque hoy es la fecha límite para los dividendos?"
• "Veo que su modelo es solo largo. ¿Se aseguró de que sus datos no tengan sesgo de
supervivencia?"
• "La prueba retrospectiva de su modelo de negociación de acciones con reversión a la

media usando precios de cierre es excelente, pero espere una deflación de los resultados si
lo prueba nuevamente con datos de intercambio primario".
• "Su modelo se desempeñó de manera brillante durante noviembre de 2008. Pero,

¿estaba corto en muchas acciones financieras en ese entonces? No olvide que las ventas al
descubierto de esas acciones estaban prohibidas".
• "Este modelo de negociación de acciones de alta frecuencia se ve bien en las pruebas

retrospectivas, pero me pregunto si incorporó reglas de aumento para sus operaciones en
corto".
• "Su modelo de margen de calendario de futuros utiliza las diferencias de precio para
formar el margen. ¿Por qué está ajustando hacia atrás sus precios utilizando la brecha de
rentabilidad?"
• "¿Por qué mi diferencial de futuros intradía con reversión a la media se desempeñó tan
bien en el backtest pero tan mal en el trading en vivo? Oh, debería haber utilizado datos
basados en ticks en lugar de datos basados en barras para mi backtest".
• "Su backtest de esta estrategia de impulso parece estar libre de obstáculos. Pero el
hecho de que haya funcionado bien antes de 2008 no significa que lo hará bien después".
• Significado estadístico de los backtests:

TRADUCCIÓN 38
• "¿Qué quiere decir con que la APR esperada de esta estrategia es del 10 por ciento y es
estadísticamente significativa dentro del 1 por ciento?" Respuesta: "Significa que al ejecutar
la estrategia en 10,000 series de precios simulados con la misma longitud y los mismos
primeros tres momentos que la serie histórica de precios, solo hay 100 series de muestra
donde la APR es igual o superior al 10 por ciento".
PUNTOS CLAVE
(Continuacion)
• "¿Qué quiere decir con que la APR esperada de esta estrategia es del 10 por ciento y es
estadísticamente significativa dentro del 1 por ciento?" Respuesta alternativa: "Significa que
al aleatorizar las fechas de entrada de mis operaciones, solo hay 1 de cada 100
permutaciones aleatorias en las que la APR es igual o superior al 10 por ciento".
• ¿Qué plataforma de backtest elegir?
• "Soy un matemático brillante que inicia un fondo con 50 millones de dólares para
invertir, pero no sé cómo programar. ¿Qué plataforma de negociación debo utilizar?" Elija una
plataforma institucional de propósito especial como Deltix, QuantHouse, Progress Apama o
RTD Tango.
• "Soy un comerciante independiente, discrecional y con experiencia y quiero automatizar

mis estrategias. ¿Qué plataforma de negociación debo utilizar?" Elija una plataforma
minorista de propósito especial como MetaTrader, NinjaTrader, Trading Blox o TradeStation.
• "Soy un cuant que es excelente con la investigación de estrategias utilizando MATLAB.

Pero, ¿cómo debo implementar estas estrategias y ponerlas en marcha?" Pruebe la API
quant2ib de exchangeapi.com para Interactive Brokers, quant2tt para Trading Technologies,
www.pracplay.com para otros corredores o MATFIX para conexiones FIX.
• "Soy un buen programador de C ++, C # y Java, pero odio tener que lidiar con
conexiones de bajo nivel con la correduría, y odio tener que reescribir mis conexiones cada
vez que cambio de corredor". Pruebe uno de los IDE como Marketcetera, TradeLink,
AlgoTrader o ActiveQuant.
• Automatización de ejecuciones:
• "Quiero colocar mi programa de operaciones en un centro de datos para reducir la

latencia de confirmación de mi pedido por debajo de 10 ms". ¿Está seguro de que su corredor
tiene una latencia de confirmación de pedido inferior a 10 ms?
TRADUCCIÓN 39
• "Estoy ubicado en el EC2 de Amazon. Los datos de mercado que se envían a mis
programas comerciales deberían estar mucho más actualizados que si los obtuve en mi PC
de escritorio". No necesariamente: el servidor de EC2 puede estar más lejos (en la distancia
de Internet) del servidor de datos de su corredor que su PC de escritorio.
• "Estoy usando Parallel Computing Toolbox de MATLAB y ejecuto mi programa en una

GPU. Por lo tanto, puedo negociar las 500 acciones en SPX simultáneamente". Incluso con
Parallel Computing Toolbox de MATLAB, está limitado a manejar 12 papeles
simultáneamente. Escribir su propio programa Java o Python permitirá un verdadero
multiproceso en una unidad de procesamiento de gráficos (GPU).
• "Mi IDE no está habilitado para CEP. Realmente no puedo ejecutar una estrategia
comercial basada en ticks". Incluso las plataformas que no están habilitadas para CEP a
menudo tienen funciones de devolución de llamada que permiten que su programa sea
activado por ticks.
Los fundamentos de la reversión a la media Sea que nos demos cuenta o no, la
naturaleza está llena de ejemplos de reversión a la media. La figura 2.1 muestra el nivel del
agua del Nilo desde el 622 d.C. hasta el 1284 d.C., claramente una serie de tiempo de
reversión a la media. La reversión a la media prevalece igualmente en las ciencias sociales.
Daniel Kahneman citó un ejemplo famoso: la "maldición de Sports Illustrated", que es la
afirmación de que "un atleta cuya imagen aparece en la portada de la revista está condenado
a rendir mal la siguiente temporada" (Kahneman, 2011). La razón científica es que se puede
pensar que el rendimiento de un atleta se distribuye aleatoriamente alrededor de una media,
por lo que es muy probable que un rendimiento excepcionalmente bueno durante un año (que
coloca al atleta en la portada de Sports Illustrated) sea seguido por actuaciones más
cercanas. a la media. ¿La reversión a la media también prevalece en las series de precios
financieros? Si es así, ¡nuestra vida como comerciantes sería muy simple y rentable! Todo lo
que tenemos que hacer es comprar bajo (cuando el precio está por debajo de la media),
esperar la reversión al precio medio y luego vender a este precio más alto durante todo el día.
Lamentablemente, la mayoría de las series de precios no son reversibles, sino paseos
geométricos aleatorios. Los rendimientos, no los precios, son los que generalmente se
distribuyen aleatoriamente alrededor de una media de cero. Desafortunadamente, no
podemos operar con la reversión media de los rendimientos. (No se debe confundir la
reversión media de los rendimientos con la contracorrelación en serie de los rendimientos,
con la que definitivamente podemos negociar. Pero la contracorrelación en serie de los
rendimientos es lo mismo que la reversión media de los precios.) Esas pocas series de
precios que se encuentran que son reversibles a la media se denominan estacionarias, y en
este capítulo describiremos las pruebas estadísticas (prueba ADF y prueba de exponente de
Hurst y razón de varianza) para la estacionariedad. No hay demasiadas series de precios
TRADUCCIÓN 40
prefabricadas que sean estacionarias. Por prefabricados me refiero a aquellas series de

precios que representan activos negociados en las bolsas o mercados públicos.
Afortunadamente, podemos fabricar muchas más series de precios con reversión a la

media que activos negociados porque a menudo podemos combinar dos o más series de
precios individuales que no tienen una reversión media en una cartera cuyo valor de mercado
neto (es decir, el precio) es una reversión media. Las series de precios que se pueden
combinar de esta manera se denominan cointegración, y también describiremos las pruebas
estadísticas (prueba CADF y prueba de Johansen) para la cointegración. Además, como un
subproducto de la prueba de Johansen, podemos determinar las ponderaciones exactas de
cada activo para crear una cartera de reversión media. Debido a esta posibilidad de crear de
forma artificial carteras estacionarias, existen numerosas oportunidades disponibles para los
traders de reversión a la media.
Como ilustración de lo fácil que es sacar provecho de las series de precios con reversión
a la media, también describiré una estrategia comercial lineal simple, una estrategia que
realmente "no tiene parámetros".
Una aclaración: el tipo de reversión a la media que veremos en este capítulo puede
denominarse reversión a la media de series de tiempo porque se supone que los precios
están volviendo a una media determinada por sus propios precios históricos. Las pruebas y
las estrategias comerciales que describo en este capítulo están diseñadas para la reversión
de la media de las series de tiempo. Existe otro tipo de reversión a la media, denominada
reversión a la media "transversal". La reversión de la media transversal significa que los
rendimientos acumulados de los instrumentos en una canasta se revertirán al rendimiento
acumulado de la canasta. Esto también implica que los rendimientos relativos a corto plazo
de los instrumentos están en serie anticorrelacionados. (El rendimiento relativo de un
instrumento es el rendimiento de ese instrumento menos el rendimiento de la canasta). Dado
que este fenómeno ocurre con mayor frecuencia en las canastas de valores, analizaremos
cómo aprovecharlo en el capítulo 4 cuando analicemos las estrategias de reversión de la
media para acciones y ETF.
■ Inversión media y estacionariedad

La reversión media y la estacionariedad son dos formas equivalentes de considerar el
mismo tipo de serie de precios, pero estas dos formas dan lugar a dos pruebas estadísticas
diferentes para tales series.
La descripción matemática de una serie de precios con reversión a la media es que el

cambio de la serie de precios en el período siguiente es proporcional a la diferencia entre el
precio medio y el precio actual. Esto da lugar a la prueba ADF, que comprueba si podemos
TRADUCCIÓN 41
rechazar la hipótesis nula de que la constante de proporcionalidad es cero.
Sin embargo, la descripción matemática de una serie de precios estacionaria es que la

varianza del logaritmo de los precios aumenta más lentamente que la de una caminata
aleatoria geométrica. Es decir, su varianza es una función sublineal del tiempo, en lugar de
una función lineal, como en el caso de una caminata aleatoria geométrica. Esta función
sublineal generalmente se aproxima por τ 2H, donde τ es el tiempo que separa dos
mediciones de precios, y H es el llamado exponente de Hurst, que es menor que 0.5 si la serie
de precios es de hecho estacionaria (e igual a 0.5 si el precio la serie es un paseo geométrico
aleatorio). La prueba de la razón de varianza se puede utilizar para ver si podemos rechazar
la hipótesis nula de que el exponente de Hurst es en realidad 0,5.
Tenga en cuenta que la estacionariedad es un nombre poco apropiado: no significa que

los precios estén necesariamente dentro del rango, con una varianza que es independiente
del tiempo y, por lo tanto, un exponente de Hurst de cero. Simplemente significa que la
varianza aumenta más lentamente que la difusión normal.
En las notas del curso de Walter Beckert se puede encontrar una exposición matemática
clara de las pruebas de ADF y de razón de varianza (Beckert, 2011). Aquí, solo nos interesan
sus aplicaciones a estrategias comerciales prácticas.
Prueba Dickey-Fuller aumentada

Si una serie de precios tiene una reversión media, entonces el nivel de precios actual nos
dirá algo sobre cuál será el próximo movimiento del precio: si el nivel de precios es más alto
que la media, el siguiente movimiento será un movimiento descendente; si el nivel de precios
es más bajo que la media, el próximo movimiento será un movimiento ascendente. La prueba
ADF se basa solo en esta observación.
Podemos describir los cambios de precio usando un modelo lineal:
, y así. La prueba ADF determinará si λ = 0. Si la hipótesis λ = 0 puede ser rechazada, eso

significa que el siguiente movimiento Δy (t) depende del nivel actual y (t - 1), y por lo tanto no
es aleatorio. caminar. El estadístico de prueba es el coeficiente de regresión λ (con y (t - 1)
como variable independiente y Δy (t) como variable dependiente) dividido por el error
estándar de la regresión fi t: λ / SE (λ). Los estadísticos Dickey y Fuller nos han averiguado
amablemente la distribución de este estadístico de prueba y nos han tabulado los valores
críticos, de modo que podamos buscar cualquier valor de λ / SE (λ) si la hipótesis puede
rechazarse en, digamos, el nivel de probabilidad del 95 por ciento. Observe que, dado que
esperamos una regresión media, λ / SE (λ) tiene que ser negativo, y tiene que ser más
negativo que el valor crítico para que la hipótesis sea rechazada. Los valores críticos en sí
TRADUCCIÓN 42
dependen del tamaño de la muestra y de si suponemos que la serie de precios tiene una
media distinta de cero −μ / λ o una deriva constante −βt / λ. En el comercio práctico, la
variación constante del precio, si la hay, tiende a ser de una magnitud mucho menor que las
fluctuaciones diarias del precio. Entonces, para simplificar, asumiremos que este término de
deriva es cero (β = 0).
En el Ejemplo 2.1, aplicamos la prueba ADF a una serie de tipos de cambio USD.CAD.
Ejemplo 2.1: Uso de la prueba ADF para la reversión de la media

La prueba ADF está disponible como una función adftest de MATLAB Econometrics, o
desde la función adf del paquete MATLAB de código abierto espacial-econometrics.com.
Usaremos adf a continuación, y mi código está disponible para descargar como
stationarityTests.m desde http://epchan.com/book2.
(Una vez que haya descargado la carpeta jplv7 de space-econometrics.com en su

computadora, recuerde agregar todas las subcarpetas de este paquete a su ruta de MATLAB
antes de usarlo). (Continuación) La función adf tiene tres entradas. La primera es la serie de
precios en orden ascendente de tiempo (el orden cronológico es importante). El segundo es
un parámetro que indica si debemos asumir la compensación μ y si la deriva β en la Ecuación
2.1 debe ser cero. Debemos suponer que la compensación es distinta de cero, ya que el
precio medio hacia el que se revierten los precios rara vez es cero. Sin embargo, deberíamos
asumir que la desviación es cero, porque la desviación constante del precio tiende a ser de
una magnitud mucho menor que las fluctuaciones diarias del precio. Estas consideraciones
significan que el segundo parámetro debe ser 0 (según la convención del diseñador del
paquete). La tercera entrada es el retraso k. Puede comenzar probando k = 0, pero a menudo
solo estableciendo k = 1 podemos rechazar la hipótesis nula, lo que significa que el cambio
en los precios a menudo tiene correlaciones en serie. Intentaremos la prueba con el tipo de
cambio USD.CAD (cuántos dólares canadienses a cambio de un dólar estadounidense).
Suponemos que los precios diarios a las 17:00 ET se almacenan en una matriz MATLAB γ. El
archivo de datos es el de las barras de un minuto, pero solo extraeremos los precios al final
del día a las 17:00 ET. El muestreo de datos con frecuencia intradiaria no aumentará la
importancia estadística de la prueba ADF. Podemos ver en la Figura 2.2 que no parece muy
estacionario.
GRÁFICO 2.2 Serie de precios USD.CAD
Ejemplo 2.1 (continuación)

TRADUCCIÓN 43
Y, de hecho, debe encontrar que el estadístico de la prueba ADF es aproximadamente -

1.84, pero el valor crítico al nivel del 90 por ciento es -2.594, por lo que no podemos rechazar
la hipótesis de que λ es cero. En otras palabras, no podemos demostrar que el USD.CAD esté
estacionario, lo que quizás no sea sorprendente, dado que el dólar canadiense se conoce
como una moneda de materias primas, mientras que el dólar estadounidense no lo es. Pero
tenga en cuenta que λ es negativo, lo que indica que la serie de precios al menos no tiene
tendencia.
Prueba de coeficiente de varianza y exponente de Hurst

Hablando intuitivamente, una serie de precios "estacionaria" significa que los precios
difieren de su valor inicial más lentamente de lo que lo haría una caminata aleatoria
geométrica. Matemáticamente, podemos determinar la naturaleza de la serie de precios
midiendo esta velocidad de difusión. La velocidad de difusión se puede caracterizar por la
varianza
donde z son los precios logarítmicos (z = log (y)), τ es un desfase de tiempo arbitrario y
… es un promedio de todas las t. Para un paseo geométrico aleatorio, sabemos que
El ∼ significa que esta relación se convierte en una igualdad con alguna constante de
proporcionalidad para τ grande, pero puede desviarse de una línea recta para τ pequeño.
Pero si la serie de precios (logarítmica) tiene una reversión media o una tendencia (es decir,
tiene correlaciones positivas entre movimientos secuenciales de precios), la Ecuación 2.3 no
se mantendrá. En cambio, podemos escribir:
donde hemos definido el exponente de Hurst H. Para una serie de precios que exhibe una
caminata aleatoria geométrica, H = 0.5. Pero para una serie de reversión a la media, H <0,5, y
para una serie de tendencia, H> 0,5. A medida que H desciende hacia cero, la serie de precios
se revierte más a la media y, a medida que H aumenta hacia 1, la serie de precios tiende cada
vez más; por tanto, H sirve también como indicador del grado de reversión media o
tendencia. En el ejemplo 2.2, calculamos el exponente de Hurst para la misma serie de tipos
de cambio USD.CAD que usamos en la sección anterior utilizando el código MATLAB. Genera
una H de 0,49, lo que sugiere que la serie de precios está revertiendo débilmente a la media.
Debido al tamaño de muestra finito, necesitamos conocer la significación estadística y

MacKinlay de un valor estimado de H para estar seguros de si podemos rechazar la hipótesis
nula de que H es realmente 0.5. Esta prueba de hipótesis es proporcionada por la prueba de
razón de varianza (Lo, 2001).
La prueba de razón de varianza simplemente prueba si

TRADUCCIÓN 44
es igual a 1. Hay otra función de MATLAB Econometrics Toolbox lista para usar,
vratiotest para esto, cuyo uso demuestro en el Ejemplo 2.3.
Ejemplo 2.2: Calcular el exponente de Hurst

Usando la misma serie de precios USD.CAD en el ejemplo anterior, ahora calculamos el
exponente de Hurst usando una función llamada genhurst que podemos descargar de
MATLAB Central (www.mathworks.com / matlabcentral / fi leexchange / 30076-generalized-
hurst-exponent) . Esta función calcula una versión generalizada del exponente de Hurst
definido por
donde q es un número arbitrario. Pero aquí solo nos interesa q = 2, que especificamos
como el segundo parámetro de entrada para genhurst.
H = genhurst (log (y), 2);
Si aplicamos esta función a USD.CAD, obtenemos H = 0.49, lo que indica que puede ser
una reversión débil a la media.
Vida media de la reversión media

Las pruebas estadísticas que describí para la reversión a la media o la estacionariedad
son muy exigentes, con requisitos de al menos un 90 por ciento de certeza. Pero en el
comercio práctico, a menudo podemos ser rentables con mucha menos certeza. En esta
sección, encontraremos otra forma de interpretar el coeficiente λ en la Ecuación 2.1 de modo
que sepamos si es lo suficientemente negativo como para hacer práctica una estrategia
comercial, incluso si no podemos rechazar la hipótesis nula de que su valor real es cero con
90 por ciento de certeza en una prueba ADF. Encontraremos que λ es una medida del tiempo
que tarda un precio en significar revertir.
Para revelar esta nueva interpretación, solo es necesario transformar la serie temporal
discreta Ecuación 2.1 a una forma diferencial de modo que los cambios en los precios se
conviertan en cantidades infinitesimales. Además, si ignoramos la deriva (βt) y las
diferencias rezagadas (Δy (t - 1),…, Δy (t - k)) en la Ecuación 2.1, entonces se vuelve
reconocible en cálculo estocástico como la fórmula de Ornstein-Uhlenbeck para proceso de
reversión de la media:
donde dε es algo de ruido gaussiano. En la forma discreta de 2.1, la regresión lineal de

Δy (t) contra y (t - 1) nos dio λ, y una vez determinado, este valor de λ se traslada a la forma
diferencial de 2.5. Pero la ventaja de escribir el
TRADUCCIÓN 45
Ejemplo 2.3: Uso de la prueba de relación de varianza para

estacionariedad
El vratiotest de MATALB Econometric Toolbox se aplica a la misma serie de precios y
USD.CAD que se han utilizado en los ejemplos anteriores de este capítulo. Las salidas son hy
pValue: h = 1 significa rechazo de la hipótesis de caminata aleatoria al nivel de confianza del
90 por ciento, h = 0 significa que puede ser una caminata aleatoria. pValue da la probabilidad
de que la hipótesis nula (paseo aleatorio) sea verdadera.
[h, pValue] = vratiotest (log (y));
Encontramos que h = 0 y pValue = 0.367281 para USD.CAD, lo que indica que hay un 37
por ciento de probabilidad de que sea un paseo aleatorio, por lo que no podemos rechazar
esta hipótesis. ecuación en la forma diferencial es que permite una solución analítica para el
valor esperado de y (t):
Recordando que λ es negativo para un proceso de reversión a la media, esto nos dice
que el valor esperado del precio decae exponencialmente al valor −μ / λ con la vida media de
decaimiento igual a −log (2) / λ. Esta conexión entre un coeficiente de regresión λ y la vida
media de la reversión media es muy útil para los traders. Primero, si encontramos que λ es
positivo, esto significa que la serie de precios no tiene una reversión media, y ni siquiera
deberíamos intentar escribir una estrategia de reversión media para negociarla. En segundo
lugar, si λ está muy cerca de cero, esto significa que la vida media será muy larga y una
estrategia de negociación con reversión a la media no será muy rentable porque no
podremos completar muchas operaciones de ida y vuelta en una período de tiempo
determinado. En tercer lugar, esta λ también determina una escala de tiempo natural para
muchos parámetros de nuestra estrategia. Por ejemplo, si la vida media es de 20 días, no
deberíamos utilizar una revisión retrospectiva de 5 días para calcular una media móvil o una
desviación estándar para una estrategia de reversión a la media. A menudo, establecer el
retroceso para que sea igual a un pequeño múltiplo de la vida media es casi óptimo, y hacerlo
nos permitirá evitar la optimización por fuerza bruta de un parámetro libre basado en el
rendimiento de una estrategia comercial. Demostraremos cómo calcular la vida media en el
ejemplo 2.4.
Ejemplo 2.4: Calcular la vida media para la reversión media

Concluimos en el ejemplo anterior que la serie de precios USD.CAD no es estacionaria
con al menos un 90 por ciento de probabilidad. Pero eso no significa necesariamente que
debamos dejar de operar con esta serie de precios utilizando un modelo de reversión a la
media porque la mayoría de las estrategias de negociación rentable no requieren un nivel tan
alto de certeza. Para determinar si USD.CAD es un buen candidato para el comercio de
TRADUCCIÓN 46
reversión a la media, ahora determinaremos su vida media de reversión a la media.
Para determinar λ en las ecuaciones 2.1 y 2.5, podemos ejecutar un ajuste de regresión
con y (t) - y (t - 1) como variable dependiente e y (t - 1) como variable independiente. Tanto la
función de regresión ols como la función lag son parte del paquete jplv7. (También puede
utilizar el (Continuación)
Una estrategia comercial lineal con reversión a la media

Una vez que determinamos que una serie de precios tiene reversión media, y que la vida
media de reversión media para una serie de precios lo suficientemente corta para nuestro
horizonte comercial, podemos negociar fácilmente esta serie de precios de manera rentable
utilizando una estrategia lineal simple: determinar la desviación normalizada de la precio
(desviación estándar móvil dividida por la desviación estándar móvil del precio) de su
promedio móvil y mantener el número de unidades en este activo en proporción negativa a
esta desviación normalizada. La retrospectiva de la media móvil y la desviación estándar se
puede establecer para que sea igual a la vida media. En el ejemplo 2.5 vemos cómo funciona
esta reversión a la media lineal para USD.CAD.
Quizás se pregunte por qué es necesario utilizar una media móvil o una desviación
estándar para una estrategia de reversión de la media. Si una serie de precios es estacionaria,
¿no deberían fijarse para siempre su media y su desviación estándar? Aunque generalmente
asumimos que la media de una serie de precios es fija, en la práctica puede cambiar
lentamente debido a cambios en la economía o la gestión empresarial. En cuanto a la
desviación estándar, recuerde que la ecuación 2.4 implica que incluso una serie de precios
"estacionaria" con 0 <H <0.5 tiene una varianza que aumenta con el tiempo, aunque no tan
rápidamente como una caminata aleatoria geométrica. Por lo tanto, es apropiado utilizar la
media móvil y la desviación estándar para permitirnos adaptarnos a una media y una
desviación estándar en constante evolución, y también para capturar beneficios más
rápidamente. Este punto se explorará más a fondo en el Capítulo 3, particularmente en el
contexto del "escalado". El resultado es de unos 115 días. Dependiendo de su horizonte
comercial, esto puede ser demasiado largo o no. Pero al menos sabemos qué retrospectiva
usar y qué período de espera esperar.
Ejemplo 2.5: Backtesting de una estrategia comercial lineal con

reversión a la media
En esta estrategia simple, buscamos poseer una cantidad de unidades de USD.CAD igual
a la desviación normalizada negativa de su promedio móvil. El valor de mercado (en USD) de
una unidad de un par de divisas USD.X no es más que la cotización USD.X, por lo que en este
TRADUCCIÓN 47
caso la reversión de la media lineal es equivalente a establecer el valor de mercado de la

cartera en el negativo de la Puntuación Z de USD.CAD. Las funciones MovingAvg y MovingStd
se pueden descargar desde mi sitio web. (Este fragmento de código es parte de
stationaryTests.m.) Lookback = round (halflife); % que establece la conversión retrospectiva a
la vida media% que se encuentra arriba de mktVal = - (y-movingAvg (y, lookback)) ./
movingStd (y, lookback); pnl = lag (mktVal, 1). * (y-lag (y, 1)) ./ lag (y, 1); % de pérdidas y
ganancias diarias del% de la estrategia
Las pérdidas y ganancias acumuladas de esta estrategia se representan en la Figura 2.3.

A pesar de la larga vida media, las ganancias y pérdidas totales (P&L) logran ser positivas,
aunque con una gran reducción. Como ocurre con la mayoría de las estrategias de ejemplo
en este libro, no incluimos los costos de transacción. Además, hay un sesgo de anticipación
involucrado en este ejemplo particular debido a (Continuación) el uso de datos en la muestra
para encontrar la vida media y, por lo tanto, la retrospectiva. Además, es posible que se
necesite una cantidad ilimitada de capital para generar las pérdidas y ganancias porque no se
impuso un máximo sobre el valor de mercado de la cartera. Por tanto, no lo recomiendo
como una estrategia comercial práctica. (Hay una versión más práctica de esta estrategia de
reversión a la media en el Capítulo 5). Pero sí ilustra que una serie de precios no estacionaria
no tiene por qué desanimarnos de operar con una estrategia de reversión a la media, y que no
necesitamos estrategias muy complicadas o técnicas. indicadores para extraer beneficios de
una serie de reversión a la media.

Dado que el objetivo de los comerciantes es, en última instancia, determinar si el
rendimiento esperado o el índice de Sharpe de una estrategia comercial de reversión a la
media es lo suficientemente bueno, ¿por qué nos molestamos en pasar por las pruebas de
estacionariedad (ADF o índice de varianza) y el cálculo de la vida media? ¿en absoluto? ¿No
podemos simplemente ejecutar una prueba retrospectiva de la estrategia comercial
directamente y terminar con ella? La razón por la que pasamos por todas estas pruebas
preliminares es que su significado estadístico suele ser más alto que un backtest directo de
una estrategia comercial. Estas pruebas preliminares hacen uso de los datos de precios de
todos los días (o, más generalmente, de cada barra) para la prueba, mientras que un backtest
generalmente genera un número significativamente menor de operaciones de ida y vuelta
para que podamos recopilar estadísticas de rendimiento. Además, el resultado de un
backtest depende de las especificaciones de una estrategia comercial, con un conjunto
específico de parámetros comerciales. Sin embargo, dada una serie de precios que pasó las
pruebas estadísticas de estacionariedad, o al menos una con una vida media lo
suficientemente corta, podemos estar seguros de que eventualmente podremos encontrar
una estrategia de negociación rentable, tal vez no la que hemos probado. .
TRADUCCIÓN 48
■ Cointegración
Como dijimos en la introducción de este capítulo, la mayoría de las series de precios
financieros no son estacionarias ni tienen reversión media. Pero, afortunadamente, no
estamos limitados a negociar esas series de precios financieros "prefabricadas": podemos
crear de forma proactiva una cartera de series de precios individuales de modo que la serie
de valor de mercado (o precios) de esta cartera sea estacionaria. Ésta es la noción de
cointegración: si podemos encontrar una combinación lineal estacionaria de varias series de
precios no estacionarias, estas series de precios se denominan cointegradas. La
combinación más común es la de dos series de precios: apostamos por un activo y,
simultáneamente, por otro activo, con una asignación adecuada de capital a cada activo.
Ésta es la conocida estrategia de "comercio de pares". Pero el concepto de cointegración se
extiende fácilmente a tres o más activos. Y en esta sección, veremos dos pruebas de
cointegración comunes: la CADF y la prueba de Johansen. El primero es adecuado solo para
un par de series de precios, mientras que el segundo es aplicable a cualquier número de
series.
Prueba Dickey-Fuller aumentada cointegrada

Un lector curioso puede preguntarse: ¿Por qué necesitamos nuevas pruebas para la
estacionariedad de la serie de precios de la cartera, cuando ya tenemos las confiables
pruebas de ADF y de razón de varianza para estacionariedad? La respuesta es que, dada una
serie de series de precios, no sabemos a priori qué ratios de cobertura deberíamos utilizar
para combinarlos y formar una cartera estacionaria. (El coeficiente de cobertura de un activo
en particular es el número de unidades de ese activo que deberíamos ser largos o cortos en
una cartera. Si el activo es una acción, entonces el número de unidades corresponde al
número de acciones. Un coeficiente de cobertura negativo indica deberíamos estar cortos en
ese activo). El hecho de que un conjunto de series de precios se cointegra no significa que
cualquier combinación lineal aleatoria de ellas forme una cartera estacionaria. Pero si
seguimos con esta línea de pensamiento, ¿qué pasa si primero determinamos el índice de
cobertura óptimo ejecutando un ajuste de regresión lineal entre dos series de precios,
usamos este índice de cobertura para formar una cartera y, finalmente, ejecutamos una
prueba de estacionariedad en esta cartera? serie de precios? Esto es esencialmente lo que
hicieron Engle y Granger (1987). Para nuestra comodidad, el paquete jplv7 de Spatial-
econometrics.com ha proporcionado una función cadf que realiza todos estos pasos. El
ejemplo 2.6 demuestra cómo utilizar esta función aplicándola a los dos fondos cotizados en
bolsa (ETF) EWA y EWC. Los ETF proporcionan un terreno fértil para encontrar series de
precios cointegradas y, por lo tanto, buenos candidatos para el comercio de pares. Por
ejemplo, tanto las economías canadienses como las australianas se basan en productos
básicos, por lo que parece probable que se cointegran. El programa cointegrationTest.m se
puede descargar desde mi sitio web. Suponemos que la serie de precios de EWA es el
TRADUCCIÓN 49
Ejemplo 2.6: Uso de la prueba CADF para la cointegración (continuación) contenida en la

matriz x, y la de EWC está contenida en la matriz y. En la Figura 2.4, podemos ver que se ven
bastante cointegrados.
Un diagrama de dispersión de EWA versus EWC en la Figura 2.5 es aún más convincente,
ya que los pares de precios caen en línea recta.
Podemos usar la función ols que se encuentra en el paquete jplv7 para encontrar el
índice de cobertura óptimo. Como era de esperar, la gráfica del EWC-hedgeRatio * EWA
residual en la Figura 2.6 parece muy estacionaria.
Usamos la función cadf del paquete jplv7 para nuestra prueba. Aparte de una entrada
adicional para la segunda serie de precios, las entradas son las mismas que las de la función
adf. Nuevamente asumimos que puede haber una compensación distinta de cero de la serie
de precios de la cartera de pares, pero la deriva es cero. Tenga en cuenta que tanto en la
regresión como en la prueba CADF hemos elegido EWA como la variable independiente x, y
EWC como la variable dependiente y. Si cambiamos los roles de EWA y EWC, ¿será diferente
el resultado de la prueba CADF? Por desgracia, la respuesta es sí." El índice de cobertura
derivado de elegir EWC como variable independiente no será el recíproco exacto del derivado
de elegir EWA como variable independiente. En muchos casos (aunque no para EWA-EWC,
como confirmaremos más adelante con la prueba de Johansen), solo uno de esos índices de
cobertura es "correcto", en el sentido de que solo un índice de cobertura conducirá a una
cartera estacionaria. Si usa la prueba CADF, tendría que probar cada variable como
independiente y ver qué orden da el mejor (más negativo) estadístico t, y usar ese orden para
obtener el Ejemplo 2.6 (Continuación) (Continuación) FIGURA 2.6 Estacionariedad de
Residuos de regresión lineal entre ratio de cobertura EWA versus EWC. En aras de la
brevedad, simplemente asumiremos que EWA es independiente y ejecutaremos la prueba
CADF. Encontramos que el estadístico de la prueba ADF es de aproximadamente -3.64,
ciertamente más negativo que el valor crítico en el nivel del 95 por ciento de -3.359. Entonces
podemos rechazar la hipótesis nula de que λ es cero. En otras palabras, EWA y EWC se están
cointegrando con un 95 por ciento de certeza.
Prueba de Johansen
Para probar la cointegración de más de dos variables, necesitamos usar la prueba de
Johansen. Para entender esta prueba, generalicemos la Ecuación 2.1 al caso donde la
variable de precio y (t) son en realidad vectores que representan múltiples series de precios, y
TRADUCCIÓN 50
los coeficientes λ y α son en realidad matrices. (Debido a que no creo que sea práctico
permitir una variación constante en el precio de una cartera estacionaria, asumiremos βt = 0
para simplificar). Usando letras mayúsculas en inglés y griego para representar vectores y
matrices respectivamente, podemos reescribir la ecuación 2.1 como
Al igual que en el caso univariado, si Λ = 0, no tenemos cointegración. (Recuerde que si el

siguiente movimiento de Y no depende del nivel de precios actual, no puede haber reversión a
la media.) Denotemos el rango (¿recuerdas este pintoresco término algebraico lineal?) De Λ
como r, y el número de precio serie n. El número de carteras independientes que pueden
formarse mediante varias combinaciones lineales de las series de precios cointegrantes es
igual a r. La prueba de Johansen calculará r para nosotros de dos formas diferentes, ambas
basadas en la descomposición de vectores propios de Λ. Una prueba produce la llamada
estadística de trazas y otra produce la estadística propia. (Se puede encontrar una buena
exposición en Sorensen, 2005.) No debemos preocuparnos de qué son exactamente, ya que
el paquete jplv7 proporcionará valores críticos para cada estadística para permitirnos probar
si podemos rechazar las hipótesis nulas de que r = 0 ( sin relación de cointegración), r ≤ 1,…,
hasta r ≤ n -1. Si se rechazan todas estas hipótesis, entonces claramente tenemos r = n.
Como subproducto útil, los autovectores encontrados se pueden utilizar como nuestros
coeficientes de cobertura para las series de precios individuales para formar una cartera
estacionaria. Mostramos cómo ejecutar esta prueba en el par EWA-EWC en el Ejemplo 2.7,
donde encontramos que la prueba de Johansen confirma la conclusión de la prueba CADF de
que este par se cointegra. Pero, lo que es más interesante, agregamos otro ETF a la
combinación: IGE, un ETF que consta de acciones de recursos naturales. Veremos cuántas
relaciones de cointegración se pueden encontrar a partir de estas tres series de precios.
También usamos los autovectores para formar una cartera estacionaria y encontramos su
vida media para la reversión a la media.
Tomamos las series de precios EWA y EWC que usamos en el ejemplo 2.6 y les
aplicamos la prueba de Johansen. Hay tres entradas para la función johansen del paquete
jplv7: y, p y k. y es la matriz de entrada, y cada vector de columna representa una serie de
precios. Como en las pruebas ADF y CADF, establecemos p = 0 para permitir que la Ecuación
2.7 tenga una compensación constante (M ≠ 0), pero no un término de deriva constante (β =
0). La entrada k es el número de rezagos, que nuevamente establecemos en. Vemos que para
la prueba del estadístico de seguimiento, la hipótesis r = 0 se rechaza al nivel del 99%, y r ≤ 1
se rechaza al nivel del 95 por ciento. La prueba de Estadística Eigen concluye que la hipótesis
r = 0 se rechaza al nivel del 95 por ciento, y r ≤ 1 también se rechaza al 95 por ciento. Esto
significa que de ambas pruebas, concluimos que hay dos relaciones de cointegración entre
EWA y EWC. ¿Qué significa tener dos relaciones de cointegración cuando solo tenemos dos
series de precios? ¿No hay un solo coeficiente de cobertura que asignará capital entre EWA y
EWC para formar una cartera estacionaria? En realidad no. Recuerde que cuando hablamos
de la prueba CADF, señalamos que depende del orden. Si cambiamos el papel de la EWA de la
TRADUCCIÓN 51
variable independiente a la dependiente, podemos llegar a una conclusión diferente. De

manera similar, cuando usamos EWA como variable dependiente en una regresión contra
EWC, obtendremos un índice de cobertura diferente que cuando usamos EWA como variable
independiente. Estos dos diferentes ratios de cobertura, que no son necesariamente
recíprocos entre sí, nos permiten formar dos carteras estacionarias independientes. Con la
prueba de Johansen, no necesitamos ejecutar la regresión dos veces para obtener esas
carteras: ejecutarla una vez generará todas las relaciones de cointegración independientes
que existen. La prueba de Johansen, en otras palabras, es independiente del orden de la serie
de precios. Ahora introduzcamos otro ETF en la cartera: IGE, que consiste en acciones de
recursos naturales. Suponiendo que su serie de precios está contenida en una matriz z,
ejecutaremos la prueba de Johansen en las tres series de precios para averiguar cuántas
relaciones de cointegración podemos obtener de este trío. el más fuerte"; es decir, tienen la
vida media más corta para la reversión a la media. Naturalmente, elegimos este vector propio
para formar nuestra cartera estacionaria (el vector propio determina las acciones de cada
ETF), y podemos encontrar su vida media por el mismo método que antes cuando
tratábamos con una serie de precios estacionaria. La única diferencia es que ahora tenemos
que calcular el puerto de matriz T × 1, que representa el valor de mercado neto (precio) de la
cartera, que es igual al número de acciones de cada ETF multiplicado por el precio de la
acción de cada ETF. , luego resumió todos los ETF. yport asume el papel de y en el ejemplo
2.4. La vida media de 23 días es considerablemente más corta que los 115 días del USD.CAD,
por lo que esperamos que una estrategia comercial de reversión a la media funcione mejor
para este triplete.
Negociación lineal con reversión a la media en una cartera

En el ejemplo 2.7, determinamos que la cartera EWA-EWC-IGE formada con el "mejor"
vector propio de la prueba de Johansen tiene una vida media corta. Ahora podemos proceder
con confianza a realizar una prueba retrospectiva de nuestra estrategia simple de reversión
de media lineal en esta cartera. La idea es la misma que antes cuando poseemos una
cantidad de unidades en USD.CAD proporcional a su desviación normalizada negativa de su
promedio móvil (es decir, su Z-Score). Aquí, también acumulamos unidades de la cartera
proporcionales a la puntuación Z negativa del precio de la cartera "unidad". Una cartera de
unidades es aquella con acciones determinadas por el vector propio de Johansen. El precio
de las acciones de una cartera unitaria es como el precio de las acciones de un fondo mutuo
o ETF: es el mismo que su valor de mercado. Cuando una cartera de unidades tiene solo una
posición larga y una corta en dos instrumentos, generalmente se denomina diferencial.
(Expresamos esto en una forma más matemática en el Capítulo 3.) Tenga en cuenta que por
TRADUCCIÓN 52
una estrategia "lineal" sólo queremos decir que el número de unidades invertidas es
proporcional al Z-Score, no que el valor de mercado de nuestra inversión sea proporcional.
Esta estrategia lineal de reversión de la media, obviamente, no es una estrategia

práctica, al menos en su versión más simple, ya que no conocemos el capital máximo
requerido.
Ejemplo 2.8: Backtesting de una estrategia de reversión de la media

lineal en una cartera
El puerto y es una matriz Tx1 que representa el valor de mercado neto de la cartera de
"unidades" calculada en el fragmento de código anterior. numUnits es una matriz Tx1 que
representa los múltiplos de esta cartera de unidades que deseamos comprar. pnl = suma
(rezago (posiciones, 1). * (y3-rezago (y3, 1)) ./ rezago (y3, 1), 2); % de pérdidas y ganancias
diarias de la estrategia ret = pnl. / sum (abs (lag (posiciones, 1)), 2); El% de rendimiento es
el% de pérdidas y ganancias dividido por el valor bruto de mercado de la cartera. La Figura
2.7 muestra la curva de rendimientos acumulados de esta estrategia lineal de reversión de la
media para una cartera estacionaria de EWA, EWC e IGE. Encontramos que APR = 12.6 por
ciento con un índice de Sharpe de 1.4 para la estrategia.

al principio y realmente no podemos entrar y salir de un número infinitesimal de acciones
siempre que el precio se mueva en una cantidad infinitesimal. A pesar de estos
inconvenientes, la importancia de realizar una prueba retrospectiva de una serie de precios
con reversión a la media con esta estrategia lineal simple es que muestra que podemos
extraer ganancias sin ningún sesgo de búsqueda de datos, ya que la estrategia no tiene
parámetros para optimizar. (Recuerde que incluso la retrospectiva se establece igual a la vida
media, una cantidad que depende de las propiedades de la serie de precios en sí, no de
nuestra estrategia comercial específica). Además, como la estrategia entra y sale
continuamente de posiciones, Es probable que tenga más importancia estadística que
cualquier otra estrategia comercial que tenga reglas de entrada y salida más complicadas y
selectivas.
■ Pros y contras de las estrategias de reversión a la media

A menudo es bastante fácil construir estrategias de reversión de la media porque no
estamos limitados a instrumentos comerciales que son intrínsecamente estacionarios.
Podemos elegir entre una gran variedad de acciones cointegradas y ETF para crear nuestra
TRADUCCIÓN 53
propia cartera estacionaria con reversión a la media. El hecho de que cada año se creen
nuevos ETF que pueden diferir ligeramente de los existentes ciertamente también ayuda a
nuestra causa.
Además de la plétora de opciones, a menudo hay una buena historia fundamental detrás
de una pareja que revierte la media. ¿Por qué EWA se cointegra con EWC? Eso es porque
tanto las economías canadienses como las australianas están dominadas por las materias
primas. ¿Por qué GDX se cointegra con GLD? Eso es porque el valor de las empresas mineras
de oro se basa en gran medida en el valor del oro. Incluso cuando un par de cointegración se
desmorona (deja de cointegrarse), a menudo podemos entender la razón. Por ejemplo, como
explicamos en el Capítulo 4, la razón por la que GDX y GLD se derrumbaron a principios de
2008 fueron los altos precios de la energía, lo que provocó que la extracción de oro fuera
anormalmente cara. Esperamos que con la comprensión llegue el remedio. Esta
disponibilidad de razonamiento fundamental contrasta con muchas estrategias de impulso
cuya única justificación es que hay inversores que reaccionan más lentamente que nosotros
a las noticias. Más sin rodeos, debemos creer que hay más tontos por ahí. Pero esos tontos
eventualmente nos alcanzan, y la estrategia de impulso en cuestión puede dejar de funcionar
sin explicación algún día.
Otra ventaja de las estrategias de reversión de la media es que abarcan una gran
variedad de escalas de tiempo. En un extremo, las estrategias de creación de mercado se
basan en precios cuya media se revierte en cuestión de segundos. En el otro extremo, los
inversores fundamentales invierten en acciones infravaloradas durante años y esperan
pacientemente a que sus precios vuelvan a su valor "justo". El extremo corto de la escala de
tiempo es particularmente beneficioso para los traders como nosotros, ya que una escala de
tiempo corta significa un mayor número de operaciones por año, lo que a su vez se traduce
en una mayor confianza estadística y un mayor índice de Sharpe para nuestro backtest y
operaciones en vivo. y, en última instancia, una mayor rentabilidad compuesta de nuestra
estrategia.
Desafortunadamente, es debido a la aparente alta consistencia de la estrategia de

revertir la media que puede conducir a su eventual caída. Como señaló Michael Dever, esta
alta coherencia a menudo arrulla a los traders en un exceso de confianza y un exceso de
apalancamiento como resultado (Dever, 2011). (Piense en la gestión del capital a largo
plazo). Cuando una estrategia de reversión a la media se rompe repentinamente, tal vez por
una razón fundamental que solo se percibe en retrospectiva, a menudo ocurre cuando la
negociamos con el apalancamiento máximo después de una serie ininterrumpida de éxitos.
Por eso, la pérdida poco común suele ser muy dolorosa y, a veces, catastrófica. Por lo tanto,
la gestión de riesgos para la reversión de la media es particularmente importante y
particularmente difícil, ya que los límites de pérdidas habituales no se pueden implementar
de manera lógica. En el Capítulo 8, analizo por qué este es el caso, así como las técnicas para
TRADUCCIÓN 54
la gestión de riesgos que son adecuadas para las estrategias de reversión de la media.
• La reversión a la media significa que el cambio en el precio es proporcional a la

diferencia entre el precio medio y el precio actual.
• Estacionariedad significa que los precios se difunden más lentamente que una
caminata geométrica aleatoria.
• La prueba ADF está diseñada para probar la reversión a la media.
• Las pruebas de exponente de Hurst y razón de varianza están diseñadas para probar la
estacionariedad.
• La vida media de la reversión de la media mide la rapidez con la que una serie de
precios vuelve a su media y es un buen predictor de la rentabilidad o el índice de Sharpe de
una estrategia de negociación con reversión de la media cuando se aplica a esta serie de
precios.
• Una estrategia comercial lineal aquí significa que el número de unidades o acciones de
una cartera de unidades que poseemos es proporcional al puntaje Z negativo de la serie de
precios de esa cartera.
• Si podemos combinar dos o más series de precios no estacionarios para formar una
cartera estacionaria, estas series de precios se denominan cointegrantes.
• La cointegración se puede medir mediante la prueba CADF o la prueba de Johansen.
• Los autovectores generados a partir de la prueba de Johansen se pueden usar como

razones de cobertura para formar una cartera estacionaria a partir de la serie de precios de
entrada, y el que tiene el valor propio más grande es el que tiene la vida media más corta.
Implementación de estrategias de reversión a la media
CAPÍTULO 3
En el capítulo anterior, describimos las pruebas estadísticas para determinar si una serie
de precios es estacionaria y, por lo tanto, adecuada para el comercio de reversión a la media.
Esta serie de precios puede ser el valor de mercado de un solo activo, aunque es raro que
existan tales activos estacionarios, o puede ser el valor de mercado de una cartera de activos
TRADUCCIÓN 55
cointegrados, como el familiar par de acciones largo-corto.
En la práctica, sin embargo, debemos recordar que no necesariamente necesitamos una

verdadera estacionariedad o cointegración para implementar una estrategia de reversión a la
media exitosa: si somos inteligentes, podemos capturar la reversión de la media a corto
plazo o estacional, y liquidar nuestras posiciones antes los precios van a su próximo nivel de
equilibrio. (La reversión de la media estacional significa que una serie de precios se revertirá
a la media solo durante períodos específicos del día o bajo condiciones específicas). Por el
contrario, no todas las series estacionarias generarán grandes ganancias, no si su vida media
para la reversión de la media es de 10 años. largo.
También describimos una estrategia de reversión de media lineal simple que

simplemente "escala" en un activo en proporción a la desviación de su precio de la media. No
es una estrategia muy práctica debido al constante reequilibrio infinitesimal y la demanda de
poder adquisitivo ilimitado. En este capítulo, discutimos una estrategia de reversión a la
media más práctica, pero aún simple, las bandas de Bollinger. Describimos las variaciones de
esta técnica, incluidos los pros y los contras de usar múltiples niveles de entrada y salida
("escalado") y el uso del filtro de Kalman para estimar el índice de cobertura y el precio medio.
Finalmente, destacamos el peligro que representan los errores de datos para las estrategias
de reversión de la media.
Al presentar los backtests de cualquier estrategia en este libro, no incluimos los costos
de transacción. A veces incluso cometemos un error más atroz al introducir un sesgo de
anticipación al usar los mismos datos para la optimización de parámetros (como encontrar
la mejor relación de cobertura) y para la prueba retrospectiva. Todas estas son trampas
sobre las que advertimos en el Capítulo 1. La única excusa para hacer esto es que hace que
la presentación y los códigos fuente sean más fáciles de entender. Insto a los lectores a que
emprendan la ardua tarea de eliminar esos errores al implementar sus propias pruebas
retrospectivas de estas estrategias prototipo.
■ Intercambio de pares utilizando diferenciales de precios,

diferenciales de precios logarítmicos o ratios
Al construir una cartera para el comercio de reversión a la media en el capítulo 2,
simplemente usamos el valor de mercado de la cartera "unitaria" como señal de negociación.
Este valor de mercado o precio son solo las sumas ponderadas de la serie de precios
constituyentes, donde las ponderaciones son las razones de cobertura que encontramos a
partir de la regresión lineal o de los vectores propios de la prueba de Johansen:
y es, por construcción, una serie de tiempo estacionaria, y las h i nos dicen el número de
TRADUCCIÓN 56
acciones de cada acción constituyente (asumiendo que estamos negociando una cartera de
acciones). En el caso de solo dos acciones, esto se reduce a un diferencial familiar para
muchos operadores de pares:
Insertamos un signo menos en la Ecuación 3.2 para anticipar el hecho de que

usualmente estaremos largos en una acción y cortos en otra, de modo que h, tal como se
define de esta manera, será positivo.) Suponga que en lugar de series de precios,
encontramos que el logaritmo de los precios están cointegrando, de modo que
es estacionario para algún conjunto de h derivado de un ajuste de regresión o de

vectores propios de Johansen. ¿Cómo interpretamos esta ecuación, ya que q (para
"consulta") es solo un nombre que se le da a una serie de tiempo estacionaria que puede ser
o no el valor de mercado de una cartera? Para conocer sus propiedades, tomemos su primera
diferencia en el tiempo:
x para pequeños cambios en x, el lado derecho de la ecuación 3.4 se convierte en h 1 Δ y

1 / y 1 + h 2 Δ y 2 / y 2 +… + hn Δ yn / yn, que no es otro que los rendimientos de un cartera
formada por los n activos con ponderaciones h's. Pero a diferencia de la razón de cobertura h
de la Ecuación 3.1, donde se referían al número de acciones de cada activo, aquí podemos
establecer el valor de mercado de cada activo en h. Entonces podemos interpretar q como el
valor de mercado de una cartera de activos con precios y 1, y 2,…, yn y con ponderaciones de
capital constantes h 1, h 2,…, hn, junto con un componente de efectivo implícitamente
incluido, y esto El valor de mercado formará una serie de tiempo estacionaria. Tenga en
cuenta que un componente de efectivo debe incluirse implícitamente en la cartera q porque
si las ponderaciones de capital h se mantienen constantes, no hay otra forma de que el valor
de mercado de la cartera pueda variar con el tiempo. Este efectivo no aparece en la Ecuación
3.4 porque su valor de mercado, por supuesto, no cambia de t - 1 a t como resultado del
movimiento del mercado, pero su valor cambiará en t cuando el operador reequilibre la
cartera para mantener el constancia de las ponderaciones de capital, realizando algunas de
las ganancias o pérdidas y sumando o restando del saldo de caja. Por lo tanto, mantener el
valor de mercado de esta cartera estacionario (¡pero no constante!) Requiere mucho trabajo
para los comerciantes, ya que necesitan reequilibrar constantemente la cartera, lo cual es
necesario mediante el uso del registro de precios.
El resultado de todo esto es que el comercio de reversión media utilizando diferenciales

de precios es más simple que usar diferenciales de precios logarítmicos, pero ambos pueden
justificarse teóricamente si las series de precios y precios logarítmicos están cointegradas.
Pero, ¿qué pasa con la relación de precios y 1 / y 2 que muchos comerciantes prefieren como
señal para un par? Si observamos la Ecuación 3.1 en el caso de solo dos series de precios,
notamos que si h 1 = −h 2, entonces log (y 1 / y 2) o y 1 / y 2 es estacionario. Pero este es un
caso especial: normalmente no esperamos que las razones de cobertura sean iguales en
TRADUCCIÓN 57
magnitud, o iguales a -1 si las normalizamos. Entonces, la razón y 1 / y 2 no necesariamente

forma una serie estacionaria. Pero como mencionó un lector, el uso de proporciones puede
tener una ventaja cuando el par subyacente no se cointegra realmente (http:
//epchan.blogspot .com / 2012/02 / ideas-from-psychologist.html? ShowComment = 132980
1874131 # c3278677864367113894) . Suponga que el precio A = $ 10 y el precio B = $ 5
inicialmente, por lo que la razón es 2. Después de un tiempo, el precio A aumenta a $ 100 y el
precio B a $ 50. El diferencial ha pasado de $ 5 a $ 50 y probablemente encontraremos que
no es estacionario. Pero la relación sigue siendo 2, y una estrategia de reversión a la media
que opere en función de la relación puede ser igualmente eficaz si sus precios son de $ 10
frente a $ 5 o de $ 100 frente a $ 50. En otras palabras, si sus dos activos no se están
cointegrando realmente, pero cree que su diferencial todavía significa revertir en un corto
período de tiempo, entonces usar la relación como indicador puede funcionar mejor que los
diferenciales de precios o los diferenciales de precios de registro. (Esta es la misma idea que
usar la media móvil y la desviación estándar en nuestra estrategia de reversión de media
lineal).
Hay otra buena razón para usar la proporción cuando un par no se está cointegrando
realmente. Para tales pares, a menudo necesitamos usar un índice de cobertura que cambia
dinámicamente para construir el diferencial. Pero podemos prescindir de este problema si
usamos la relación como señal en esta situación. Pero, ¿funciona mejor una relación que una
relación de cobertura adaptativa con diferenciales de precio (o precio logarítmico)? No
conozco una respuesta general a esto, pero podemos ver el Ejemplo 3.1, donde comparamos
el uso de diferenciales de precios, diferenciales de precios logarítmicos y relaciones en la
estrategia de reversión de media lineal que involucra GLD y USO, el oro y el crudo. fondos
cotizados en bolsa (ETF) de petróleo. Encontrará, al menos en ese ejemplo, que los
diferenciales de precios con un coeficiente de cobertura adaptable funcionan mucho mejor
que el coeficiente.
Un caso especial interesante es el comercio de divisas. Si operamos con el par de divisas

EUR.GBP, estamos usando la relación porque es exactamente igual a operar con EUR.USD /
GBP.USD. Ya demostramos una estrategia simple de reversión a la media en el comercio de
dichos pares de divisas en el Ejemplo 2.5 por USD.CAD usando la relación como señal. Pero,
¿acerca de esos pares que no tienen tasas cruzadas predefinidas en muchas casas de bolsa
o intercambios, como MXN.NOK? ¿Deberíamos utilizar la relación USD.NOK / USD.MXN
como señal, o el diferencial USD.NOK-USD .MXN en su lugar? Nuevamente, debido a que
MXN.NOK no es realmente estacionario, usar la relación MXN.NOK puede ser más efectivo.
Esto es cierto a pesar de que no podemos operar directamente con MXN.NOK y tenemos que
operar con USD.NOK y USD.MXN en su lugar. (Operar con USD.NOK y USD.MXN generará
ganancias y pérdidas [P&L] denominadas tanto en NOK como en MXN. Operar con MXN.NOK
habría generado P&L denominadas solo en NOK. Por lo tanto, los dos métodos no son
idénticos).
TRADUCCIÓN 58
Ejemplo 3.1: Margen del precio de negociación, Margen del precio

logarítmico y ratio
Aplicamos la estrategia de reversión de media lineal de los Ejemplos 2.5 y 2.8 a los ETF
GLD y USO. Pero probamos esta estrategia en el diferencial de precios, el diferencial de
precios logarítmico y la relación para comparar. Algunos comerciantes creen que cuando los
precios del petróleo suben, también lo hacen los precios del oro. La lógica es que los altos
precios del petróleo aumentan la inflación y los precios del oro están correlacionados
positivamente con la inflación. Pero puede verificar usando una de las pruebas de
cointegración que estudiamos en el Capítulo 2 que el oro (representado por ETF GLD) y los
precios del petróleo (representado por USO) no están, de hecho, cointegrados. (Pasaremos
por alto la diferencia entre los precios al contado del petróleo y los futuros del petróleo, que
en realidad constituyen la OSU. Volveremos a esta diferencia en el capítulo 5). No obstante,
veremos si hay suficiente reversión de la media a corto plazo para hacer rentable una
estrategia de reversión de la media.
Primero probaremos el diferencial de precios como señal. Pero necesitamos recalcular

dinámicamente el índice de cobertura todos los días utilizando un período de retroceso corto
(establecido en 20 días de negociación casi óptimos con el beneficio de la retrospectiva)
para adaptarnos a los niveles cambiantes de los ETF a lo largo del tiempo. El método que
usamos para calcular el índice de cobertura es la regresión lineal, usando la función ols del
paquete jplv7 como antes. Por supuesto, puede utilizar el primer vector propio de la prueba
de Johansen en su lugar.
El código fuente de MATLAB se puede descargar de mi sitio web como PriceSpread.m.

Suponemos que la serie de precios de GLD está contenida en la matriz Tx1 x, y la de USO
está contenida en la matriz Tx1 y. Tenga en cuenta que lo que generalmente se conoce como
USO-hedgeRatio * GLD "diferencial" es igual al precio de la cartera de unidades, que
denotamos como yport en el programa. Al graficar este margen en la Figura 3.1 se muestra
que parece muy estacionario. Ahora veremos si podemos crear una estrategia de reversión
de media lineal de rentabilidad. Una vez más, el número de unidades (acciones) de la cartera
de unidades que deberíamos poseer se establece en el Z-Score negativo, y la matriz de
posiciones Tx2 representa el valor de mercado (en dólares) de cada uno de los ETF
constituyentes en los que deberíamos invertir. pulg. (y2, 1)) ./lag (y2, 1), 2); % de pérdidas y
ganancias diarias de la estrategia% ret = pnl. / sum (abs (lag (posiciones, 1)), 2); El% de
retorno es el% de pérdidas y ganancias dividido por el valor de mercado bruto de la cartera
Obtenemos una tasa de porcentaje anual (APR) de aproximadamente 10,9 por ciento y
un índice de Sharpe de aproximadamente 0,59 utilizando un diferencial de precios con un
índice de cobertura dinámica, aunque GLD y USO no están cointegrados de ninguna manera.
TRADUCCIÓN 59
A continuación, veremos si el uso de precios de registro hará alguna diferencia. El código

fuente para esto está en LogPriceSpread.m, pero mostraremos aquí las únicas dos líneas que
son diferentes de PriceSpread.m: regression_result = ols (log (y (t-lookback + 1: t)), ...
[log (x (t-lookback + 1: t)) unos (lookback, 1)]); e yport = sum ([- hedgeRatio ones (size
(hedgeRatio))]. * log (y2), ... 2); % El valor de mercado neto de la cartera es el mismo% del
"margen"
El APR del 9 por ciento y el índice de Sharpe de 0.5 son en realidad más bajos que los
que utilizan la estrategia de diferencial de precios, y esto es antes de tener en cuenta los
costos de transacción adicionales asociados con el reequilibrio de la cartera todos los días
para mantener la asignación de capital a cada ETF.
A continuación, intentaremos usar la relación como señal. En este caso, también

exigiremos que el lado largo y el corto tengan el mismo capital en dólares. El código fuente
está en Ratio.m. Es interesante observar primero una gráfica de la razón en la Figura 3.2.
Puede ver que la relación en realidad no parece muy estacionaria en absoluto, en

comparación con el diferencial de precios o la relación de cobertura adaptativa. Por lo tanto,
no debería sorprendernos si encontramos que la estrategia de reversión a la media tiene un
desempeño deficiente, con una APR negativa.
(Continuacion)
■ Bandas de Bollinger
La única estrategia de inversión media que he descrito hasta ahora es la estrategia lineal:
simplemente escale el número de unidades invertidas en una cartera de unidades
estacionarias para que sea proporcional a la desviación del valor de mercado (precio) de la
cartera de unidades de una media móvil. Se elige esta estrategia simple porque
prácticamente no tiene parámetros y, por lo tanto, está menos sujeta al sesgo de búsqueda
de datos. Si bien esta estrategia lineal es útil para demostrar si el comercio de reversión a la
media puede ser rentable para una cartera determinada, no es práctico porque no sabemos
de antemano cuál será el capital máximo desplegado, ya que no hay límite para la desviación
temporal de el precio de su promedio.
Para el comercio práctico, podemos usar la banda de Bollinger, donde ingresamos en

una posición solo cuando el precio se desvía en más de las desviaciones estándar de la
media. entryZscore es un parámetro libre para ser optimizado en un conjunto de
entrenamiento, y tanto la desviación estándar como la media se calculan dentro de un
período de retroceso, cuya longitud nuevamente puede ser un parámetro libre para ser
TRADUCCIÓN 60
optimizado, o puede establecerse igual a la mitad vida de reversión a la media. Podemos salir
cuando la media del precio vuelve a las desviaciones estándar de exitZscore de la media,
donde exitZscore <entryZscore. Tenga en cuenta que si exitZscore = 0, esto significa que
saldremos cuando la media del precio vuelva a la media actual. Si exitZscore = −entryZscore,
saldremos cuando el precio se mueva más allá de la banda opuesta para activar una señal
comercial del signo opuesto. En cualquier momento, podemos tener cero o una unidad (larga
o corta) invertida, por lo que es muy fácil asignar capital a esta estrategia o administrar su
riesgo. Si ponemos la mirada atrás
Ejemplo 3.2: Estrategia de reversión de la media de la banda de

Bollinger
Negociamos GLD-USO en el ejemplo 3.1 usando el diferencial de precios USO-hedgeRatio
* GLD como la señal con una estrategia de reversión a media lineal.
Aquí, simplemente cambiamos a una estrategia de banda de Bollinger, usando

entryZscore = 1 y exitZscore = 0, con la primera parte del programa idéntica a PriceSpread.m.
zScore = (yport-movingAvg (yport, lookback)) ./ movingStd (yport, ... lookback); longsEntry =
zScore <-entryZscore; % una posición larga significa que% deberíamos comprar EWC
longsSalir = zScore> = -exitZscore;
shortsEntry = zScore> entradaZscore;
cortos Salir = zScore <= exitZscore;
numUnitsLong = NaN (longitud (puerto y), 1);
(Continuación) a un período corto, y una pequeña magnitud de puntaje de entrada Z y

puntaje de salida Z, obtendremos un período de tenencia más corto y más operaciones de ida
y vuelta y, en general, mayores ganancias. Ilustramos la técnica de la banda de Bollinger en el
Ejemplo 3.2 usando el par GLD-USO que discutimos anteriormente. La estrategia de la banda
de Bollinger tiene una APR = 17,8 por ciento y un índice de Sharpe de 0,96, ¡una gran mejora
con respecto a la estrategia de inversión de media lineal! La curva de rentabilidad acumulada
se muestra en la Figura 3.3. La noción de escalar a una posición con una estrategia de
reversión a la media es familiar para muchos traders. (Otro nombre para esto es
promediación). A medida que el precio (de un activo, un diferencial o una cartera) se desvía
cada vez más de su media, la ganancia potencial que se puede obtener de una eventual
reversión también aumenta; por tanto, tiene sentido aumentar el capital invertido. Esto es
exactamente lo que hace nuestra estrategia lineal de inversión de media. Tenga en cuenta
también que este tipo de estrategias de escalado también se escalan gradualmente: no
TRADUCCIÓN 61
tenemos que esperar hasta que el precio vuelva a su media antes de obtener beneficios. La
ventaja de poder salir cada vez que el precio se revierte en un pequeño incremento es que
incluso si la serie de precios no es realmente estacionaria y, por lo tanto, nunca vuelve a su
media, podemos ser rentables obteniendo constantemente pequeñas ganancias. Un
beneficio adicional es que si está operando con tamaños grandes, el escalado hacia adentro
y hacia afuera reducirá el impacto en el mercado de las operaciones de entrada y salida. Si
queremos implementar escalado usando bandas de Bollinger, podemos tener múltiples
entradas y salidas: por ejemplo, entryZscore = 1, 2, 3,…, N y exitZscore = 0, 1, 2,…, N - 1. Por
supuesto , N es otro parámetro que se optimizará utilizando un conjunto de datos de
entrenamiento.
Todo esto parecía muy de sentido común hasta que la investigación de Schoenberg y
Corwin demostró que entrar o salir en dos o más bandas de Bollinger nunca es óptimo; es
decir, siempre puede encontrar un único nivel de entrada / salida que generará un
rendimiento promedio más alto en una prueba retrospectiva (Schoenberg y Corwin, 2010). A
este método óptimo de entrada única lo llaman "todo incluido".
Para ilustrar su punto, digamos que un contrato futuro ha bajado recientemente a un

precio L 1, y usted espera que vuelva a un precio final más alto F> L 1 (tenemos que asumir la
reversión media para comparar el promedio de entrada con el total) in), aunque existe una
probabilidad p de que el precio baje a L 2 <L 1 antes de rebotar a F. Estas posibilidades se
ilustran en la Figura 3.4. Tenemos suficiente poder adquisitivo para invertir en un total de dos
contratos, ya sea a precios L 1, L 2 o F. Comparemos los tres diferentes métodos de entrada:
I. Todo incluido en L 1: Invertimos todo nuestro capital cuando el precio llega a L 1, sin
importar si bajará a L 2.
FIGURA 3.4 Dos posibles trayectorias de la media

Reversión. La ruta 1 (con probabilidad p) tiene caídas de precio más de L 1 a L 2 antes de
volver a F.La ruta 2 (con probabilidad 1 - p) tiene el precio inmediatamente vuelve a F. (Tenga
en cuenta que la reversión media está garantizada de una forma u otra en este ejemplo.)
II. Todo incluido en L 2: Esperamos hasta que el precio alcance L 2 antes de invertir todo
nuestro capital. (Por lo tanto, no invertimos nada y obtenemos cero ganancias si el precio
nunca llega a L 2). III. Entrada media: Invertimos en un contrato cuando el precio alcanza L 1,
y en otro contrato si el precio alcanza L 2.
En todos los casos, salimos de todos los contratos solo cuando el precio alcanza F (por
lo que no hay promedio de salida, incluso si hay promedio de entrada). ¿Cuáles son los
beneficios esperados de cada alternativa? Las ganancias esperadas en puntos son:
TRADUCCIÓN 62
Obviamente, si p = 0, el método I es el más rentable. Si p = 1, el método II es el más

rentable. De hecho, existe una probabilidad de transición p = (F - L 1) / (F - L 2) tal que si p <p,
el método I es más rentable que el II, y viceversa si p> p.
También es fácil demostrar que si p <p, el método I también es más rentable que el III, y
si p> p, el método II es más rentable que el III. ¡Así que no hay ninguna situación en la que la
estrategia de entrada promedio sea la más rentable! Entonces, ¿eso significa que toda la idea
de escalar / promediar ha sido desacreditada? No necesariamente. Observe la suposición
implícita hecha en mi ilustración: la probabilidad de desviarse a L 2 antes de volver a F es
constante a lo largo del tiempo. En la vida real, podemos encontrar o no que esta
probabilidad sea constante. De hecho, la volatilidad no suele ser constante, lo que significa
que p tampoco será constante. En esta circunstancia, es probable que la ampliación resulte
en una mejor relación de Sharpe realizada, si no en beneficios. Otra forma de decirlo es que,
aunque encontrará que el escalado nunca es óptimo dentro de la muestra, es muy posible
que descubra que supera al método todo incluido fuera de la muestra.
■ Filtro de Kalman como regresión lineal dinámica

Para un par de series de precios verdaderamente cointegrantes, la determinación del
índice de cobertura es bastante fácil: simplemente tome todos los datos históricos que
pueda encontrar y use mínimos cuadrados ordinarios (MCO) para un ajuste de regresión o
use la prueba de Johansen para determinar Encuentra los autovectores. Pero como hemos
enfatizado antes, la estacionariedad y la cointegración son ideales que pocas series de
precios reales pueden alcanzar. Entonces, ¿cuál es la mejor manera de estimar el índice de
cobertura actual para un par de series de precios reales cuando puede variar con el tiempo?
En todas las estrategias de reversión de la media que hemos discutido hasta ahora,
simplemente tomamos un período retrospectivo móvil y calculamos el coeficiente de
regresión o el vector propio de Johansen sobre los datos de ese período únicamente. Esto
tiene la desventaja de que si el período retrospectivo es corto, la eliminación de la primera
barra y la inclusión de la última barra a medida que avanza el tiempo pueden tener un
impacto abrupto y artificial en el índice de cobertura. Nos enfrentamos al mismo problema si
utilizamos promedios móviles o desviaciones estándar móviles para calcular la media actual
y la desviación estándar de una serie de precios. En todos los casos, es posible que podamos
mejorar la estimación mediante el uso de un esquema de ponderación que dé más peso a los
datos más recientes y menos peso a los datos anteriores, sin un punto de corte arbitrario. El
conocido promedio móvil exponencial (EMA) es uno de esos esquemas de ponderación, pero
tampoco está claro por qué una disminución exponencial en los pesos es óptima. Aquí,
describiremos un esquema de actualización del índice de cobertura utilizando el filtro de
Kalman que evita el problema de elegir un esquema de ponderación de manera arbitraria
(Montana, Triantafyllopoulos y Tsagaris, 2009). El filtro de Kalman es un algoritmo lineal
óptimo que actualiza el valor esperado de una variable oculta en función del último valor de
TRADUCCIÓN 63
una variable observable. (Para una buena exposición de este tema, ver Kleeman, 2007). Es
lineal porque asume que la variable observable es una función lineal de la variable oculta con
ruido. También asume que la variable oculta en el tiempo t es una función lineal de sí misma
en el tiempo t - 1 con ruido, y que los ruidos presentes en estas funciones tienen
distribuciones gaussianas (y por lo tanto se pueden especificar con una matriz de covarianza
evolutiva, asumiendo sus medias a ser cero.) Debido a todas estas relaciones lineales, el
valor esperado de la variable oculta en el tiempo t también es una función lineal de su valor
esperado antes de la observación en t, así como una función lineal del valor de la observada
variable en t. El filtro de Kalman es óptimo en el sentido de que es el mejor estimador
disponible si asumimos que los ruidos son gaussianos y minimiza el error cuadrático medio
de las variables estimadas.
Para cada aplicación del filtrado de Kalman, primero debemos averiguar cuáles son
estas variables y matrices:
En realidad, esta es la única parte creativa de la aplicación porque una vez que se
especifican estas cantidades, el resto es solo una aplicación robótica de un algoritmo
existente. Como comerciantes, no necesitamos saber cómo derivar las relaciones entre estas
cantidades, solo necesitamos saber dónde encontrar un buen paquete de software que nos
dé la respuesta correcta.
En nuestra aplicación, donde el enfoque es encontrar el índice de cobertura y la media y

volatilidad promedio del diferencial, la variable observable es una de las series de precios y, y
la variable oculta es el índice de cobertura β. La función lineal que relaciona y y β es, por
supuesto,
donde x es la serie de precios del otro activo y ∋ es un ruido gaussiano con varianza V
∋. Como normalmente permitimos que la dispersión entre xey tenga una media distinta de
cero, usaremos un vector β 2 × 1 para denotar tanto la intersección μ como la pendiente de la
relación lineal entre xey, y aumentaremos x (t ) con un vector de columna de unos para crear
una matriz N × 2 que permita el desplazamiento constante entre xey. x sirve en realidad como
modelo de observación en la jerga de los filtros de Kalman.
Puede parecer extraño que consideremos solo y (t) como un observable pero no x (t),
pero esto es solo un truco matemático, ya que todas las variables en las ecuaciones del filtro
de Kalman son observables excepto por la variable oculta y los ruidos, y así tenemos la
libertad de designar qué variable es el "observable" (y) y cuál es el "modelo de observación"
(x). A continuación, hacemos una suposición crucial de que el coeficiente de regresión
(nuestra variable oculta) en el tiempo t es el mismo que en el tiempo t - 1 más ruido
donde ω también es un ruido gaussiano pero con covarianza V ω. En otras palabras, el

TRADUCCIÓN 64
modelo de transición de estado aquí es solo la matriz de identidad. Dada la especificación de

las cuatro cantidades importantes en cursiva, el filtrado de Kalman ahora puede generar
iterativamente el valor esperado de la variable oculta β dada una observación en t. Un
beneficio notable de usar el filtro de Kalman para encontrar β es que no solo obtenemos una
razón de cobertura dinámica entre los dos activos, sino que también obtenemos
simultáneamente lo que solíamos llamar "la media móvil" del diferencial. Esto se debe a que,
como mencionamos, β incluye tanto la pendiente como la intersección entre y y x. La mejor
estimación actual de la intersección se utiliza en lugar de la media móvil del diferencial. Pero,
como su vendedor telefónico le recuerda a menudo, ¡eso no es todo! Como subproducto,
también genera una estimación de la desviación estándar del RECUADRO 3.1 del error de
pronóstico de la variable observable, que podemos usar en lugar de la desviación estándar
móvil de una banda de Bollinger.
A pesar de la linealidad del filtrado de Kalman, las relaciones matriciales que relacionan
varias cantidades pueden parecer bastante complejas, por lo que las relego al Recuadro 3.1
aquí para que el lector paciente las lea detenidamente.
En realidad, además de las ecuaciones iterativas, también necesitamos especificar las

(co) varianzas V ∋ y V ω de las ecuaciones de medición y transición de estado. Estas
especificaciones también se incluirán en el recuadro 3.1.
Las ecuaciones iterativas del filtro de Kalman

Denotamos el valor esperado de β en t dada la observación en t - 1 por ˆβ (t | t - 1), el
valor esperado de β dada la observación en t por ˆβ (t | t) y el valor esperado de y (t ) dada la
observación en t - 1 por ŷ (t | t - 1). Dadas las cantidades ˆβ (t - 1 | t - 1) y R (t - 1 | t - 1) en el
tiempo t - 1, podemos hacer el de un paso
donde R (t | t - 1) es cov (β (t) - ˆβ (t | t - 1)), midiendo la covarianza del error de las

estimaciones de la variable oculta. (Es una covarianza en lugar de una varianza porque β
tiene dos componentes independientes). De manera similar, R (t | t) es cov (β (t) - ˆβ (t | t)).
Recordando que la variable oculta consiste tanto en la media del diferencial como en el
índice de cobertura, R es una matriz de 2 × 2. e (t) = y (t) - x (t) ˆβ (t | t - 1) es el error de
pronóstico para y (t) dada la observación en t - 1, y Q (t) es var (e (t) ), midiendo la varianza
del error de pronóstico. Después de observar la medición en el tiempo t, se obtienen las
famosas ecuaciones de actualización de la estimación del estado del filtro de Kalman y
actualización de la covarianza.
donde K (t) se denomina ganancia de Kalman y viene dada por

TRADUCCIÓN 65
Para comenzar con estas recursiones, asumimos ˆβ (1 | 0) = 0, R (0 | 0) = 0. Pero, ¿qué

pasa con V w y V e? Existe un método para estimar estas varianzas a partir de datos
llamados mínimos cuadrados de autocovarianza desarrollado por Rajamani y Rawlings
(2007, 2009). Incluso hay un paquete Matlab / Octave gratuito para implementar
Ejemplo 3.3: Estrategia de reversión de la media del filtro de Kalman

Ahora implementaremos las ecuaciones del filtro de Kalman 3.5 a 3.13 y las aplicaremos
al par EWA-EWC. El código se puede descargar como KF_beta_EWA_EWC.m. Suponemos que
la serie de precios de EWA se almacena en una matriz Tx1 x, y la de EWC se almacena en una
matriz Tx1 y.
% Aumento x con unos para acomodar el posible desplazamiento en el% de regresión%

entre y vs x.
x = [x unidades (tamaño (x))];
delta = 0,0001; % delta = 0 no permite ningún cambio (como el% de regresión lineal
tradicional).
yhat = NaN (tamaño (y)); % de predicción de medición e = NaN (tamaño (y)); % de error de
predicción de la medición Q = NaN (tamaño (y)); % de varianza del error de predicción de la
medición% Para mayor claridad, denotamos R (t | t) por P (t).
% inicializa P y beta.
P = ceros (2); beta = NaN (2, tamaño (x, 1));
Vw = delta / (1-delta) * diag (unos (2, 1));
Ve = 0,001; % Inicializar beta (:, 1) a cero beta (:, 1) = 0; , donde δ es un parámetro entre 0
y 1, e I es una matriz identidad de 2 × 2. Si δ = 0, esto significa β (t) = β (t - 1), lo que reduce el
filtro de Kalman a una regresión de mínimos cuadrados ordinarios con un desplazamiento y
una pendiente fijos. Si δ = 1, esto significa que la β estimada fluctuará enormemente según la
última observación. El δ óptimo, al igual que el retroceso óptimo en una regresión lineal en
movimiento, se puede obtener utilizando datos de entrenamiento.
Con el beneficio de la retrospectiva, elegimos δ = 0,0001. Con la misma retrospectiva,

también elegimos V e = 0.001.
En el Ejemplo 3.3, describimos la implementación real de usar el filtro de Kalman para

TRADUCCIÓN 66
estimar un β dinámico para el par EWA-EWC que discutimos en el Ejemplo 2.7. Podemos ver
en la Figura 3.5 que con δ = 0.0001, la pendiente Kalmanupdated β (1, t) de un ajuste lineal
entre EWC (y) y EWA (x) oscila alrededor de 1.
(Continuación) También podemos ver en la Figura 3.6 que la intersección β (2, t)

actualizada por Kalman aumenta monótonamente con el tiempo.
Podemos utilizar estas y otras cantidades calculadas con el filtro de Kalman para crear
una estrategia de reversión de la media. El error de predicción de medición e (t)
(anteriormente llamado error de pronóstico para y (t) dada la observación en t - 1) no es otro
que la desviación del diferencial EWC-EWA de su valor medio previsto, y compraremos este
diferencial. cuando la desviación es muy negativa y viceversa si es muy positiva. ¿Qué tan
negativo o positivo? Eso depende de la desviación estándar predicha de e (t), que no es otra
que Q t (). Podemos graficar e (t) y Q t () en el mismo gráfico (Figura 3.7) para ver que Q t ()
cambia con bastante lentitud dado nuestro pequeño δ.
A continuación, se muestra el código de Matlab para determinar las señales de entrada y

salida. Una vez que se determinan las señales de entrada y salida, el resto del código es el
mismo que bollinger.m-simplemente sustituya beta (1, :) en lugar de hedgeRatio. Tiene una
TAE razonable del 26,2 por ciento y una proporción de Sharpe de 2,4. Sus rendimientos
acumulados se grafican en la Figura 3.8.
■ Filtro de Kalman como modelo de creación de mercado

Hay otra aplicación digna de mención del filtro de Kalman a una estrategia de reversión
de la media. En esta aplicación sólo nos ocupamos de una serie de precios con reversión a la
media; no nos interesa encontrar la relación de cobertura entre dos series de precios
cointegradas. Sin embargo, como antes, todavía queremos encontrar el precio medio y la
desviación estándar de la serie de precios para nuestro comercio de reversión a la media.
Entonces, el precio medio m (t) es la variable oculta aquí, y el precio y (t) es la variable
observable. La ecuación de medición en este caso es trivial:
("Ecuación de medición") (3.14)
con la misma ecuación de transición de estado
La ganancia de Kalman es 18) y la actualización de la variación de estado es

TRADUCCIÓN 67
En lugar de codificar el filtro Kalman usted mismo, como demostramos, también puede
utilizar muchos códigos MATLAB de código abierto gratuitos disponibles. Puede encontrar
uno de estos paquetes en www.cs.ubc.ca/~murphyk /Software/Kalman/kalman.html. Los
filtros Kalman también están disponibles en la Caja de herramientas del sistema de control
de MATLAB.
¿Por qué vale la pena destacar estas ecuaciones? Porque este es el modelo favorito de
los creadores de mercado para actualizar su estimación del precio medio de un activo, como
señaló Euan Sinclair (Sinclair, 2010). Para que estas ecuaciones sean más prácticas, los
profesionales hacen suposiciones adicionales sobre el error de medición V e, que, como
recordará, mide la incertidumbre del precio de transacción observado. Pero, ¿cómo puede
haber incertidumbre en el precio de transacción observado? Resulta que podemos interpretar
la incertidumbre de tal manera que si el tamaño de la operación es grande (en comparación
con algún punto de referencia), entonces la incertidumbre es pequeña y viceversa. Entonces,
V e en este caso también se convierte en una función de t. Si denotamos el tamaño de la
operación como T y el tamaño de la operación de referencia como T max, entonces V e
puede tener la forma
Entonces puede ver que si T = T max, no hay incertidumbre en el precio observado y la

ganancia de Kalman es 1, y por lo tanto, la nueva estimación del precio medio m (t) es
exactamente igual al precio observado. Pero, ¿cuál debería ser T max? Puede ser una
fracción del volumen total de operaciones del día anterior, por ejemplo, cuando la fracción
exacta debe optimizarse con algunos datos de entrenamiento.
Tenga en cuenta la similitud de este enfoque con el llamado enfoque de precio promedio
ponderado por volumen (VWAP) para determinar el precio medio o el valor razonable de un
activo. En el enfoque del filtro de Kalman, no solo damos más ponderaciones a las
operaciones con tamaños comerciales más grandes, sino que también damos más
ponderaciones a los precios de las operaciones más recientes. Por lo tanto, se podría
comparar esto con el volumen y el precio promedio ponderado en el tiempo.
■ El peligro de los errores de datos

Los errores de datos tienen un efecto particularmente insidioso tanto en el backtesting
como en la ejecución de estrategias de reversión de la media.
Si hay errores, o "valores atípicos" en los datos históricos utilizados para el backtesting,
estos errores suelen inflar el rendimiento del backtest de las estrategias de reversión a la
media. Por ejemplo, si los precios comerciales reales de una acción a las 11:00, 11:01 y 11:02
eran $ 100, $ 100 y $ 100, pero los datos históricos los registraron erróneamente como $ 100,
$ 110, $ 100, entonces su media- Es probable que el backtest de la estrategia de reversión
TRADUCCIÓN 68
haya acortado la acción a las 11:01 ($ 110), y luego haya cubierto la posición a las 11:02 ($
100) y haya obtenido una ganancia ordenada pero ficticia de $ 10. Puede ver que la calidad
de los datos es particularmente importante para los datos intradía, porque presentan muchas
más oportunidades para tales errores. Es por eso que los proveedores de datos de renombre
tuvieron mucho cuidado al incorporar los códigos de cancelación y corrección
proporcionados por el intercambio para corregir cualquier transacción que pudiera haber sido
cancelada debido a precios de transacción que están demasiado lejos de lo "normal". (Lo que
constituye un precio "normal" se determina únicamente, a veces caso por caso, por el
intercambio pertinente). Thomas Falkenberry (2002) ha escrito más sobre cuestiones de
limpieza de datos.
Sin embargo, este tipo de error de datos suprimirá el rendimiento de backtest de las
estrategias de impulso, por lo que no es tan peligroso. En el ejemplo anterior, una estrategia
de impulso probablemente comprará la acción a las 11:01 ($ 110) en backtest, y puede
detenerse con pérdidas a las 11:02 ($ 100).
El mismo tipo de errores, por supuesto, también desencadenará operaciones incorrectas

en operaciones en vivo, lo que a menudo resulta en pérdidas en la vida real. En el ejemplo
anterior, si los precios eran precios de oferta, y tenemos la oferta errónea de $ 110 a las
11:02, entonces nuestro programa de ejecución puede haber enviado una orden de venta de
mercado corta en ese momento, que desafortunadamente se completará a $ 100 en su lugar.
ya que en realidad no hubo una oferta a $ 110.
Este problema con las cotizaciones de compra / venta en vivo erróneas es

particularmente peligroso cuando se negocian pares u otras estrategias de arbitraje, porque
en estas estrategias a menudo dependemos de las diferencias de las cotizaciones de precios
de varios instrumentos para activar las señales de negociación. La diferencia de un par de
cotizaciones suele ser de una magnitud mucho menor que las propias cotizaciones, por lo
que cualquier error en las cotizaciones resulta en un porcentaje de error mucho mayor en el
margen. Por ejemplo, si estamos negociando un par de acciones X e Y, y X tiene un precio de
oferta real de $ 100 e Y tiene un precio de oferta real de $ 105, entonces el diferencial Y − X
es de $ 5, que puede ser demasiado pequeño para activarse. una orden de mercado para
comprar X y vender Y. Pero si el error de datos hace que Y muestre un precio de venta de $
106, entonces el diferencial erróneo se convierte en $ 6, un aumento del 20 por ciento sobre
el diferencial real de $ 5, y esto puede ser suficiente para activar una orden errónea para
comprar X y vender Y.
He visto este problema en las operaciones en vivo cuando utilicé la fuente de datos de
un corredor para impulsar una estrategia de negociación de pares de acciones. Esa fuente de
datos desencadenaba operaciones perdedoras con bastante frecuencia que no pude explicar,
hasta que cambié la fuente de datos a un proveedor externo (nada más elegante que las
TRADUCCIÓN 69
cotizaciones en tiempo real de Yahoo!) Y las malas operaciones se detuvieron. Más tarde,
tuve acceso a la transmisión de datos en vivo de Bloomberg, y tampoco desencadenó
ninguna de estas malas operaciones.
Las garrapatas incorrectas en los datos en vivo también harán que las estrategias de
impulso envíen pedidos incorrectos. Por tanto, son igualmente perjudiciales para la ejecución
de esas estrategias.
• ¿Quiere construir una cartera con reversión a la media con un número fijo de acciones
durante la duración de una operación? Utilice series de precios para determinar los ratios de
cobertura.
• ¿Quiere construir una cartera con reversión a la media con valores de mercado fijos
para cada componente durante la duración de una operación? Utilice series de precios
logarítmicos para determinar las relaciones de cobertura.
• La relación, en lugar de los diferenciales, suele ser un buen indicador para operar con
pares de divisas.
• ¿Teme que el índice de cobertura, la media y la desviación estándar de un diferencial

puedan variar en el futuro? Utilice un período retrospectivo móvil o el filtro de Kalman.
• Una implementación práctica de una estrategia comercial lineal son las bandas de
Bollinger con escalado.
• El escalado puede no ser óptimo en las pruebas retrospectivas, pero a menudo es útil
para operaciones en vivo donde las volatilidades y las probabilidades cambian.
• ¿Desea actualizar dinámicamente el precio esperado de un instrumento en función de

su última operación (precio y tamaño)? Utilice el filtro de Kalman.
• Los errores de datos pueden inflar los resultados del backtest de las estrategias de
reversión de la media, pero no las estrategias de impulso.
• Las estrategias basadas en diferenciales son particularmente sensibles a pequeños

errores de datos, ya sea en backtest o en operaciones en vivo.
Reversión media de acciones y ETF

TRADUCCIÓN 70
CAPÍTULO 4
El mercado de valores es, en cierto sentido, el terreno más fértil para encontrar
instrumentos de reversión a la media y para la aplicación de las técnicas básicas de
negociación de reversión a la media descritas en los dos capítulos anteriores. En teoría,
podemos formar pares de acciones pertenecientes a cualquier sector y esperar que se
cointegran debido a su exposición a muchos factores económicos comunes. Su número es
grande, por lo que la diversificación es fácil. En la práctica, sin embargo, existen serias
dificultades para aplicar estas técnicas genéricas a la negociación de acciones y ETF. Este
capítulo examinará cuestiones específicas de las acciones y los ETF. También demostraré
que las estrategias simples de reversión a la media en realidad funcionan mejor para pares y
trillizos de ETF.
Pero no necesitamos limitarnos a las estrategias descritas en el Capítulo 3 cuando

buscamos una reversión a la media en acciones o ETF. Encontramos que, a corto plazo, la
mayoría de las acciones exhiben propiedades de reversión a la media en circunstancias
normales. (Una circunstancia normal significa que no hay noticias sobre las acciones, un
tema que se aborda en el Capítulo 7.) Esto es a pesar del hecho de que los precios de las
acciones siguen recorridos geométricos aleatorios a largo plazo. Construiremos una
estrategia para explotar esta reversión a la media a corto plazo o "estacional".
El arbitraje de índices es otra estrategia familiar de reversión a la media. En este caso,

contamos con la cointegración de acciones versus futuros o acciones versus ETF. Debido a
que se deja poca ganancia usando la implementación tradicional del arbitraje de índices,
damos un ejemplo de una estrategia modificada.
Como se mencionó anteriormente, además de la reversión media de series de tiempo

familiar a la que hemos dedicado toda nuestra atención hasta ahora, existe el fenómeno de
reversión media transversal, que prevalece en las canastas de valores. Recuerde que en la
reversión de la media de las series de tiempo, los precios están volviendo a una media
determinada por sus propios precios históricos, mientras que la reversión de la media
transversal significa que los rendimientos acumulados de los instrumentos en una canasta
se revertirán al rendimiento acumulado de la canasta. Las pruebas estadísticas para la
reversión de la media de las series de tiempo son en gran medida irrelevantes para la
reversión de la media transversal. Este tipo adicional de reversión de la media facilita aún
más la creación de cualquier tipo de estrategia de reversión de la media para las acciones.
Debido a esta facilidad para encontrar patrones de reversión a la media, el mercado de

valores atrae a un gran número de comerciantes, a menudo llamados arbitrajistas
estadísticos, para explotar dichos patrones. Como resultado, los rendimientos de tales
estrategias en general han disminuido. Discutimos algunos trucos simples que pueden
mejorar sus rendimientos, que de otro modo serían en declive.
TRADUCCIÓN 71
Una vez más, enfatizamos que los resultados del backtesting en este libro no incluyen
los costos de transacción. Una de las razones de esta omisión es que los costos de
transacción pueden depender de manera bastante sensible del método de ejecución exacto
utilizado y del universo de acciones exacto elegido para los modelos de acciones. Un error
más específico incluido en el backtesting de los modelos de valores es el uso de datos con
sesgo de supervivencia, ya que los datos sin sesgo de supervivencia son más engorrosos y
costosos de recopilar. La esperanza es que los resultados no sean demasiado poco realistas,
al menos para los resultados del último año o dos. Si tiene la intención de rehacer los
backtests con bases de datos libres de sesgos de supervivencia, debe recordar que el índice
bursátil elegido (normalmente Standard & Poor's [S&P] 500) también tiene una composición
cambiante a lo largo de su historia. Para hacer esto correctamente, necesitará una base de
datos que contenga las composiciones históricas del índice diario. Recuerde también la
cuestión de los precios de las acciones primarias frente a las consolidadas que se analizan
en el capítulo 1. Los precios históricos que se utilizan aquí son todos los precios de apertura
y cierre consolidados. Pero si implementa algunas de estas estrategias utilizando órdenes de
mercado en apertura (MOO) o de límite en apertura (LOO), o de manera similar órdenes de
mercado en cierre (MOC) o de límite en cierre (LOC), se llenará en la apertura o cierre de la
bolsa primaria. Por lo general, esto significa que los rendimientos reales serán más bajos que
los que se informan aquí.
■ Las diferencias de la negociación de pares de acciones

La negociación por pares de acciones es el primer tipo de estrategia algorítmica de
reversión a la media inventada por los traders institucionales, según se informa Gerry
Bamberger en Morgan Stanley (Patterson, 2010). Sin embargo, hoy en día puede resultar
sorprendentemente difícil sacarle beneficios.
Si probamos la serie de precios diarios de las acciones individuales, casi nunca cumplen
con la definición de estacionariedad definida en el Capítulo 2. La caminata aleatoria
geométrica describe bastante bien sus comportamientos: una vez que se alejaron, rara vez
regresaron a sus puntos de partida. (Sus propiedades de reversión de la media intradiaria y
estacional son casos especiales que se analizarán más adelante).
Incluso si los empareja de alguna manera sensata (por ejemplo, Exxon versus Chevron, o
Citibank versus Bank of America), rara vez se cointegran fuera de la muestra. Hago hincapié
fuera de la muestra porque es bastante fácil encontrar pares de valores cointegrados en
cualquier período de tiempo elegido, pero pueden perder fácilmente la cointegración en el
período posterior fuera de la muestra. La razón de esta dificultad es que la suerte de una
empresa puede cambiar muy rápidamente según las decisiones de la dirección y la
competencia. El hecho de que dos empresas estén en el mismo sector industrial no garantiza
TRADUCCIÓN 72
que estarán sujetas a la misma fortuna (piense en AAPL versus BBRY). El resultado es que es
difícil obtener ganancias consistentes en la negociación de un solo par de acciones
utilizando una estrategia de reversión a la media, a menos que tenga un conocimiento
fundamental de cada una de las empresas y pueda salir de una posición a tiempo antes de
las malas noticias en una de las siguientes empresas. ellos se hacen públicos.
¿Qué sucede si negociamos una gran cantidad de pares de acciones, de modo que el
descarrilamiento ocasional de algunos pares no afecte la rentabilidad de toda la cartera? La
ley de los números grandes solo funcionará a nuestro favor si el rendimiento esperado de un
par individual en el período fuera de la muestra es positivo, pero no he encontrado que este
sea el caso de los pares de valores. Aparentemente, las pequeñas ganancias obtenidas por
los pares "buenos" se han visto completamente abrumadas por las grandes pérdidas de los
pares que han salido "malos".
Aparte de estos problemas fundamentales con el comercio de pares de acciones,

existen dos dificultades técnicas adicionales.
La primera dificultad es la restricción de la venta al descubierto. Es particularmente

peligroso para un par de acciones que implica vender en corto una acción difícil de pedir
prestada, porque incluso si su posición es en última instancia rentable, puede verse obligado
a liquidarla en el momento menos rentable y en el momento más inoportuno. Esto puede
suceder cuando usted está corto con estas acciones y de repente su valor aumenta debido a
una buena noticia inesperada, y muchos prestamistas de estas acciones están ansiosos por
venderlas. En este caso, sus acciones prestadas pueden ser retiradas y se verá obligado a
comprar para cubrir esta posición con una gran pérdida, mientras vende la posición larga en
el otro lado. Esto se llama apretón corto.
Bajo el mismo título de restricción de venta corta, la nueva regla alternativa de aumento
en vigor en los mercados de valores de EE. UU. Desde 2010 también crea incertidumbre tanto
en el backtesting como en las ejecuciones en vivo de la estrategia de pares de acciones. Una
vez que se activa el disyuntor, básicamente se nos prohíbe enviar órdenes de mercado en
corto.
La segunda dificultad surge en la negociación intradiaria de pares de acciones. Dado que

los márgenes de beneficio en la negociación de pares de acciones han ido disminuyendo a lo
largo de los años, se vuelve imperativo entrar y salir de posiciones durante el día para
capturar los mejores precios. Además, si los operadores se abstienen de tomar posiciones
nocturnas en pares de acciones, es posible que puedan evitar los cambios en las
valoraciones corporativas fundamentales que afectan a las posiciones a largo plazo
mencionadas anteriormente. Sin embargo, el comercio intradía de pares de acciones se
encuentra con el problema de que los tamaños de cotización de la mejor oferta y oferta
TRADUCCIÓN 73
nacional (NBBO) para las acciones (y para los ETF) se han vuelto muy pequeños. Esto puede
deberse a la prevalencia del uso de grupos oscuros u órdenes "iceberg" no mostradas por
parte de los comerciantes institucionales, la división de órdenes grandes en órdenes
secundarias muy pequeñas mediante algoritmos de ejecución inteligente, la llegada de
operadores de alta frecuencia que envían órdenes pequeñas que pueden cancelar y
reemplazar con frecuencia y, finalmente, la renuencia de los creadores de mercado a mostrar
pedidos de gran tamaño para evitar que los operadores de alta frecuencia se aprovechen de
ellos.
Por ejemplo, no es inusual que AAPL tenga un tamaño de NBBO de solo 100 acciones.
Por lo tanto, realizar una prueba retrospectiva de una estrategia de negociación de pares de
acciones utilizando precios de negociación o cotización no es muy realista a menos que
opere solo con 100 acciones o si incluye un costo de transacción sustancial. El mismo
fenómeno también conduce a dificultades en la ejecución en vivo. Si tuviéramos que enviar
órdenes de mercado para ambas partes después de que los precios de NBBO dispararan una
señal comercial, podríamos haber sufrido un deslizamiento sustancial. Nos vemos obligados
a enviar órdenes limitadas para un lado (o para ambos lados con pequeñas fracciones de un
pedido y sufrir pequeñas posiciones temporales sin cobertura) y gestionar activamente las
posibles cancelaciones y reenvíos de este pedido en caso de que no se llenen por completo.
¿Por qué las acciones de negociación de pares eran tan rentables en el pasado? Una
razón general es que el mercado era mucho más ineficaz en ese entonces, por lo que las
ganancias normales de los pares que sí revierten a la media son lo suficientemente grandes
como para cubrir las pérdidas de los pares que no lo hacen. Esto es, por supuesto, una plaga
común para cualquier estrategia rentable, pero es particularmente grave para estrategias tan
conocidas como el comercio de acciones por pares. Una razón específica de la disminución
de las ganancias de la negociación de pares de acciones es la decimalización de los precios
de las acciones de EE. UU. La decimalización provocó que los diferenciales de oferta y
demanda se redujeran drásticamente, por lo que los operadores de pares, que actúan como
un tipo de creadores de mercado, encuentran que sus beneficios de creación de mercado
también disminuyen (Serge, 2008).
Por supuesto, el hecho de que la negociación de acciones en pares no sea muy rentable
en los mercados estadounidenses altamente eficientes no significa que no sean rentables en
otros países. Pero para el mercado estadounidense, tenemos la alternativa de negociar en
pares ETF de forma rentable.
■ Negociación de pares (y trillizos) de ETF

La única ventaja de negociar pares de ETF en lugar de pares de acciones es que, una vez
que se determina que se cointegran, es menos probable que los pares de ETF se desmoronen
TRADUCCIÓN 74
en los datos fuera de la muestra. Esto se debe a que la economía fundamental de una
canasta de acciones cambia mucho más lentamente que la de una sola empresa. Por
ejemplo, dado que tanto Australia como Canadá son economías basadas en materias primas,
EWA y EWC (sus respectivos ETF de índices bursátiles) son buenos candidatos para las
pruebas de cointegración. Y, de hecho, confirmamos su cointegración en el Capítulo 3.
Mencioné este par en 2009 en mi blog (http: // epchan .blogspot.com / 2009/11 / in-praise-
of-etfs.html? ShowComment = 125743 4002472 # c1235760260813269054), y su
cointegración continúa a la fecha de este escrito (noviembre de 2012). El proceso de
selección de pares para ETF es bastante sencillo: necesitamos encontrar ETF que estén
expuestos a factores económicos comunes. Además de los ETF nacionales, los ETF
sectoriales son otro terreno fértil para encontrar instrumentos cointegrados. Por ejemplo, el
fondo minorista RTH se cointegra con el fondo de bienes de consumo básico XLP. Con la
proliferación de ETF que siguen más o menos el mismo sector, las oportunidades de
negociación de pares aumentan constantemente.
Otro par de ETF favorito mío es entre un ETF de materias primas y un ETF de empresas
que producen esa materia prima. El fondo de oro GLD frente al fondo de mineros de oro GDX
es un buen ejemplo. El motivo es que, dado que el principal activo de una empresa minera de
oro es el oro, sus valores deberían cointegrarse con los precios al contado del oro. Y, de
hecho, lo han hecho, hasta el 14 de julio de 2008, más o menos. Si probamos la cointegración
de GLD versus GDX entre el 23 de mayo de 2006 y el 14 de julio de 2008, utilizando la prueba
de Johansen, encontramos que se cointegran con una probabilidad del 99 por ciento, pero si
probamos durante el período del 15 de julio de 2008, para 9 de abril de 2012, han perdido la
cointegración. ¿Qué sucedió el 14 de julio de 2008? Fue entonces cuando el precio del
petróleo (el sabor del West Texas Intermediate) alcanzó un máximo de alrededor de $ 145
por barril, un máximo histórico. ¿Qué tiene que ver el precio del petróleo con la cointegración
entre el precio del oro y los precios de las acciones de los mineros de oro? Mucho,
aparentemente. Resulta que cuando los precios del petróleo son caros, la extracción de oro
cuesta mucho más y, por lo tanto, las ganancias de los mineros de oro se reducen, lo que
lleva a un bajo rendimiento de los precios de sus acciones en relación con los precios al
contado del oro ("The Wacky World of Gold , "2011).
Para obtener apoyo empírico para esta explicación, podemos introducir el fondo
petrolero USO en la cartera y ver si este triplete se cointegra durante todo el período de 2006
a 2012. La prueba de Johansen muestra que sí, con un 99 por ciento de probabilidad de que
exista uno. relación de cointegración. Por lo tanto, en lugar de solo intercambiar GLD y GDX,
podemos intercambiar esta cartera de trillizos. Incluso si encuentra que negociar un triplete
es demasiado engorroso, al menos debería tener una regla para dejar de negociar GLD frente
a GDX siempre que el precio del petróleo supere un cierto umbral.
Este ejemplo tiene un significado particular. Cuando los científicos se encuentran por
TRADUCCIÓN 75
primera vez con un fenómeno inexplicable, forman una corazonada sobre su causa y luego
encuentran formas de probar esta corazonada empíricamente. Deberíamos adoptar el mismo
proceso científico al abordar el comercio. Cuando una estrategia comercial deja de funcionar,
debemos formar una hipótesis de la razón y luego probar empíricamente si esa hipótesis
está respaldada por datos. El resultado de este proceso es a menudo una estrategia
modificada que recupera la rentabilidad.
Uno podría pensar que el fondo petrolero USO versus el fondo del sector energético XLE
es otro ejemplo de un par de productos básicos versus productores de productos básicos,
pero hay un problema con este emparejamiento. Si bien GLD posee oro y, por lo tanto, refleja
el precio al contado del oro, USO no posee petróleo en realidad. Invierte en contratos de
futuros de petróleo. Como veremos en el capítulo 5, el precio de futuros de un producto
básico difiere de su precio al contado. Incluso si XLE se cointegra con el precio al contado
del petróleo, no necesariamente se cointegra con USO. Por supuesto, este problema afecta a
cualquier fondo de futuros de productos básicos frente a los fondos de productores de
productos básicos. El comercio de reversión a la media de tales pares sería mucho menos
riesgoso si el fondo de materias primas mantiene la materia prima real en lugar de los
futuros.
La mecánica de la negociación de pares ETF es la misma que la de la negociación de

pares de acciones. La antigua regla de aumento eximía a los ETF, pero la nueva regla
alternativa de aumento cubre todos los valores negociados en las bolsas de valores de EE.
UU. Sin embargo, los tamaños de NBBO para ETF son ciertamente mucho mayores que los de
las acciones. Por ejemplo, en un día normal, los tamaños de NBBO para EWC pueden rondar
las 5.000 acciones.
■ Reversión de la media intradía: modelo de compra en brecha

Los precios de las acciones siguen recorridos geométricos aleatorios, como nos han
recordado incansablemente muchos estudiosos de las finanzas (Malkiel, 2008). Pero esto es
cierto solo si probamos su serie de precios para la reversión a la media estrictamente a
intervalos regulares (como usando sus cierres diarios). Nuestro trabajo como traders es
encontrar condiciones especiales, o periodos especiales, de modo que la reversión media se
produzca con regularidad y, al mismo tiempo, evitemos el sesgo de búsqueda de datos.
Como mostrará la siguiente estrategia, es posible que se produzca una reversión de la media
estacional en el marco de tiempo intradiario incluso para las acciones.
Las reglas de la estrategia son:
1. Seleccione todas las acciones cercanas a la apertura del mercado cuyos rendimientos
desde los mínimos del día anterior hasta la apertura de hoy sean inferiores a una desviación
TRADUCCIÓN 76
estándar. La desviación estándar se calcula utilizando los rendimientos diarios de cierre a

cierre de los últimos 90 días. Estas son las acciones que "se redujeron". 2. Reduzca esta lista
de acciones exigiendo que sus precios de apertura sean más altos que el promedio móvil de
20 días de los precios de cierre. 3. Compre las 10 acciones de esta lista que tengan los
rendimientos más bajos de los mínimos del día anterior. Si la lista tiene menos de 10
acciones, compre la lista completa. 4. Liquidar todas las posiciones al cierre del mercado.
El fundamento de esta estrategia es que en los días en que los futuros de los índices
bursátiles bajan antes de la apertura, ciertas acciones sufren de manera desproporcionada
debido al pánico que se vende en la apertura. Pero una vez que termine esta venta de pánico,
las acciones se apreciarán gradualmente a lo largo del día.
La regla 2 es a menudo muy útil en las estrategias de reversión de la media: es

básicamente un filtro de impulso superpuesto a una estrategia de reversión de la media, una
técnica que repetiremos a menudo. Por lo general, las acciones que cayeron "solo un poco"
tienen más posibilidades de retroceder que las que cayeron "mucho" porque estas últimas
suelen ser las que tienen noticias negativas, como anuncios de ganancias deficientes. Las
caídas causadas por noticias negativas tienen menos probabilidades de revertirse. De hecho,
podemos desarrollar estrategias de impulso basadas en tales noticias de última hora (más
sobre esto en el Capítulo 7). Además, el hecho de que una acción sea más alta que un
promedio móvil a largo plazo atrae la presión de venta de los actores más grandes, como los
fondos solo a largo plazo, cuyos horizontes comerciales tienden a ser más largos. Esta
demanda de liquidez en la apertura puede exagerar la presión a la baja sobre el precio, pero
es más probable que los movimientos de precios debido a las demandas de liquidez se
reviertan cuando tales demandas desaparecen que los movimientos de precios debido a un
cambio en la economía fundamental de la acción. Por lo tanto, esta estrategia puede tener
éxito en un entorno con muchas noticias en el que la negociación tradicional de pares de
valores interdiarios probablemente fracasará.
El código MATLAB para realizar una prueba retrospectiva de esta estrategia se muestra
en el Ejemplo 4.1.
Esta estrategia tiene una tasa de porcentaje anual (APR) de 8.7 por ciento y un índice de
Sharpe de 1.5 desde el 11 de mayo de 2006 hasta el 24 de abril de 2012. La curva de
rendimiento acumulado se muestra en la Figura 4.1.
He negociado una versión bastante rentable en mi cuenta personal, así como en un

fondo que administraba conjuntamente. Desafortunadamente, esa versión
Ejemplo 4.1: Modelo Buy-on-Gap en acciones de SPX

TRADUCCIÓN 77
Este código, que prueba el modelo Buy-on-Gap, se puede descargar como bog.m.
Requiere como entrada tres matrices T × N, op, lo y cl, donde T es el número de días, N es el
número de acciones en el universo y op contiene los precios de apertura diarios, lo contiene
los mínimos diarios y cl cierra el diario. El universo de acciones que utilizamos para realizar
pruebas retrospectivas es el S&P 500, pero tiene un sesgo de supervivencia. no incluye la
regla 2, y sufrió rendimientos decrecientes desde 2009 en adelante. La naturaleza de largo
plazo de la estrategia también presenta algunos desafíos de gestión de riesgos. Finalmente,
el número de acciones negociadas cada día es bastante pequeño, lo que significa que la
estrategia no tiene una gran capacidad. El lector astuto puede preguntarse cómo podemos
utilizar los precios abiertos para determinar las señales de negociación para la entrada en la
apertura y llenar los precios oficiales de apertura. La respuesta corta es, por supuesto: ¡No
podemos! Sin embargo, podemos usar los precios de pre-apertura (por ejemplo, en ARCA)
para determinar las señales comerciales. Las señales así determinadas no coincidirán
exactamente con las determinadas por los precios de apertura reales, pero se espera que la
diferencia no sea tan grande como para eliminar los rendimientos. Podemos llamar a esta
diferencia ruido de señal. Además, tenga en cuenta el peligro de hacer backtesting de esta
estrategia utilizando precios consolidados versus precios de cambio primario, como se
explica en el Capítulo 1.
¿Qué pasa con la imagen especular de esta estrategia? ¿Podemos vender acciones que
tienen una diferencia de una desviación estándar pero que aún están por debajo de su
promedio móvil de 20 días? Si podemos. La APR es del 46 por ciento y el índice de Sharpe es
de 1,27 durante el mismo período. A pesar del rendimiento aparentemente más alto que la
estrategia de solo largo, la de solo corto tiene una reducción más pronunciada (ver Figura
4.2), y sufrió el mismo escollo de restricción de venta corta que se discutió anteriormente.
Esta estrategia es bastante conocida entre los traders y existen muchas variaciones
sobre el mismo tema. Por ejemplo, obviamente puede intercambiar las versiones solo larga y
corta simultáneamente. O puede negociar una versión cubierta que sea acciones largas pero
futuros de índices bursátiles cortos. Puede Puede imponer topes de beneficios intradía. Pero
el mensaje importante es: las series de precios que no exhiben reversión a la media cuando
se muestrean con barras diarias pueden exhibir una fuerte reversión a la media durante
períodos específicos. Esta es la estacionalidad en el trabajo en una escala de tiempo corta.
■ Arbitraje entre un ETF y las acciones que lo componen

Muchos lectores estarían familiarizados con la estrategia del "arbitraje de índices", que
se negocia con la diferencia de valor entre una cartera de acciones que constituye un índice y
los futuros de ese índice. Si las acciones se ponderan de la misma manera que se utilizó para
construir el índice, entonces el valor de mercado de la cartera se cointegrará muy
estrechamente con los futuros del índice. Tal vez demasiado estricta; desafortunadamente,
TRADUCCIÓN 78
esta es una estrategia tan conocida que la diferencia en los valores de mercado se ha vuelto
extremadamente pequeña (Reverre, 2001). Todos los operadores, excepto los más
sofisticados, pueden beneficiarse de esta estrategia y, sin duda alguna, debe negociarse
intradía, quizás con alta frecuencia (véase el recuadro 4.1). Para aumentar esta diferencia,
podemos seleccionar solo un subconjunto de las acciones en el índice para formar la cartera.
El mismo concepto se puede aplicar al arbitraje entre una cartera de acciones que constituye
un ETF y el propio ETF. En este caso, elegimos solo un subconjunto adecuado de las
acciones constituyentes para formar la cartera. Un método de selección es simplemente
elegir todas las acciones que se cointegran individualmente con el ETF. Demostraremos el
método utilizando el ETF más famoso de todos: SPY. Elegiremos un año de datos (en nuestro
ejemplo, del 1 de enero de 2007 al 31 de diciembre de 2007) como conjunto de
entrenamiento y buscaremos todas las acciones que se cointegran con SPY con al menos un
90 por ciento de probabilidad utilizando la prueba de Johansen. Luego formamos una cartera
de estas acciones con el mismo capital en cada acción, y confirmamos usando la prueba de
Johansen nuevamente que esta cartera de solo largo plazo todavía se cointegra con SPY.
Este paso es necesario porque una asignación arbitraria de igual peso de capital a cada
acción no produce necesariamente una serie de precios de cartera que se cointegra con la de
SPY, incluso si cada una de las acciones constituyentes se cointegra con SPY. Estamos
usando el precio de registro en esta segunda prueba porque esperamos reequilibrar esta
cartera todos los días para que el capital de cada acción sea constante. (Vea las discusiones
en el Capítulo 3.) Después de confirmar la cointegración, podemos probar la estrategia de
reversión de media lineal descrita en el Capítulo 2. Los códigos fuente de MATLAB se
muestran en el Ejemplo 4.2.
CUADRO 4.1
Arbitraje de índice de alta frecuencia

Los operadores de alta frecuencia han podido explotar dos deficiencias en los cálculos
intradiarios de los índices y el arbitraje entre los futuros que rastrean estos índices frente a
las acciones que los componen. La primera deficiencia es que muchos índices importantes,
incluidos Dow Jones, S&P, Nasdaq y Russell, se calculan utilizando solo los datos de las
operaciones bursátiles primarias (consulte el Capítulo 1 sobre precios de acciones primarios
versus consolidados), que representan menos del 30 por ciento de todas las acciones.
negociados con esas acciones (Arnuk y Saluzzi, 2012). La segunda deficiencia es que el
índice se actualiza solo una vez cada pocos segundos. Ambas deficiencias conducen a una
discrepancia entre el valor de mercado real y más actualizado de una canasta de acciones de
componentes y el valor del índice en sí. Como resultado, se puede esperar que el valor futuro
del índice se retrase del valor de mercado instantáneo de las acciones. Si el valor futuro del
TRADUCCIÓN 79
índice es más alto que el valor de mercado instantáneo, simplemente podemos acortar el
futuro y viceversa. ¿Dónde podemos obtener este valor de mercado instantáneo y verdadero
de las acciones? Por supuesto, necesitaríamos suscribirnos a la fuente de datos directa de
cada bolsa de valores de EE. UU. Y ECN (y no a la fuente SIAC) y monitorear los precios
comerciales de todas las acciones en el índice con una latencia de milisegundos en todos
estos lugares. ¡Nadie dijo que el trading de alta frecuencia sea fácil!
Ejemplo 4.2: Arbitraje entre SPY y sus acciones componentes

Este código se puede descargar como indexArb.m. Requiere como entrada una matriz
TxN cl, donde T es el número de días, N es el número de existencias en el universo y cl los
cierres diarios. El universo de valores que usamos para realizar una prueba retrospectiva es el
mismo que se usó en el ejemplo 4.1, y los símbolos que contiene están en un conjunto de
celdas. Todas estas matrices están empaquetadas en una estructura stks. Además,
necesitamos un cl array Tx1 para los cierres diarios de SPY. Estos están empaquetados en
una estructura etf. Por supuesto, debemos asegurarnos de que las fechas de stks y etf
coincidan. Las fechas comunes de negociación están contenidas en una matriz Tx1 tday.
Ejecutaremos la prueba de Johansen solo en la primera parte de estos datos: enero La
prueba de Johansen indica que la cartera de solo largo se cointegra con SPY con una
probabilidad superior al 95 por ciento. De modo que podemos formar una cartera
estacionaria larga-corta que comprenda tanto las acciones como SPY, utilizando el vector
propio de Johansen para determinar los pesos de SPY frente a la de la cartera de acciones.
(De hecho, hay dos relaciones de cointegración, pero elegiremos la que tenga el valor propio
más grande, la primera columna de la matriz propia, para formar esta cartera estacionaria.)
Como se realizó la prueba de Johansen sobre los precios de los logaritmos, la cobertura Las
razones (representadas por la matriz de ponderaciones) de las acciones o SPY representan
la asignación de capital en dólares, no el número de acciones, como se explica en el Capítulo
3. (La ponderación de cada acción individual es, por supuesto, la misma, debido a nuestro
supuesto de igual asignación de capital, pero difiere del peso en SPY.)

Luego aplicamos la estrategia de reversión de media lineal en este portafolio durante el
período de prueba del 2 de enero de 2008 al 9 de abril de 2012, de la misma manera que en el
Ejemplo 2.8, excepto que en el programa actual hemos fijado la retrospectiva utilizada. para
calcular la media móvil y las desviaciones estándar del valor de mercado de la cartera en 5,
con el beneficio de la retrospectiva. pnl = smartsum (lag (posiciones, 1). * (log (yNplus) -... lag
(log (yNplus), 1)), 2); ret = pnl. / smartsum (abs (lag (posiciones, 1)), 2); ret (isnan (ret)) = 0;
La TAE de esta estrategia es del 4,5 por ciento y la relación de Sharpe es de 1,3. Como
TRADUCCIÓN 80
puede ver en el gráfico de rendimientos acumulados (Figura 4.3), el rendimiento disminuye a

medida que pasa el tiempo, en parte porque no hemos reentrenado el modelo
periódicamente para seleccionar nuevas acciones constituyentes con nuevos índices de
cobertura. En un backtest más completo, podemos agregar esta actualización dinámica de
los ratios de cobertura.
Por supuesto, la misma metodología se puede aplicar a cualquier ETF, índice o subíndice
que desee. Además, podemos usar un futuro en lugar de un ETF si existe tal futuro que
rastrea ese índice o subíndice, aunque en este caso hay que tener cuidado de que los precios
del futuro usados en el backtest sean contemporáneos con los precios de cierre de las
acciones. . (Esto se señaló como un peligro potencial en el Capítulo 1.)
GRÁFICO 4.3 Rendimientos acumulados del arbitraje entre SPY y

sus acciones componentes
Quizás se pregunte por qué no ejecutamos directamente una prueba de cointegración de
Johansen en las 500 acciones en SPX más SPY, y dejamos que el algoritmo encuentre
automáticamente un vector propio de instrumentos de cointegración que incluyen el SPY. (No
todas las relaciones de cointegración del universo stocks + SPY necesariamente incluyen
SPY, pero solo necesitamos elegir una que lo haga). El problema con este enfoque es doble:
1. La implementación de la prueba de Johansen que conozco puede aceptar un máximo

de 12 símbolos solamente (LeSage, 1998). 2. Los autovectores generalmente involucrarán
posiciones de acciones tanto largas como cortas. Esto significa que no podemos tener una
cartera de acciones a largo plazo que esté cubierta con una posición corta de SPY o
viceversa. Esto es un problema porque si tenemos posiciones cortas en la cartera de
acciones y una posición corta SPY simultáneamente, estaríamos doblemente cortos en
algunas acciones incluso cuando tenemos posiciones largas en la cartera de acciones, lo que
aumenta nuestros riesgos específicos.
Existe un método alternativo para construir una cartera de acciones a largo plazo.
Todavía podemos usar la prueba de Johansen para probar individualmente cada acción en
SPX para la cointegración con SPY. Después de encontrar este subconjunto de acciones, las
incluimos en una cartera de acciones y luego usamos un método de optimización restringido
(por ejemplo, algoritmo genético o recocido simulado) para minimizar la diferencia absoluta
promedio entre esta serie de precios de la cartera de acciones y la serie de precios SPY. Las
variables que queremos optimizar en este caso son los ratios de cobertura de las acciones, y
TRADUCCIÓN 81
las restricciones son que todos los ratios de cobertura deben ser positivos. MATLAB Global
Optimization Toolbox proporciona funciones para algoritmos genéticos o recocido simulado
para esta tarea de optimización restringida.
Esta estrategia adolece de la misma restricción de venta corta que plagó cualquier
estrategia que involucre posiciones cortas de acciones. Sin embargo, el problema no es
demasiado grave aquí porque la cartera de acciones está bastante diversificada con unas 98
acciones. Si es necesario eliminar algunas existencias debido a la restricción de la venta en
descubierto, el impacto debería ser limitado.
■ Inversión de la media transversal: un modelo lineal largo-corto

En la negociación de reversión a la media basada en la cointegración, formamos una
cartera con un conjunto fijo de instrumentos y con un número fijo de acciones o un capital
fijo en dólares para cada instrumento. Este número fijo puede determinarse mediante fi t
(como en el ejemplo 4.2), regresión lineal, la prueba de Johansen u optimización restringida.
Pero no hay ninguna razón por la que la cartera tenga que constar del mismo conjunto fijo de
instrumentos o las mismas ponderaciones sobre este conjunto de instrumentos todos los
días. Para muchas estrategias de negociación de acciones de cartera, la ventaja proviene
precisamente de la selección diaria inteligente o la reponderación de las acciones.
En este tipo de estrategia de reversión de la media "transversal", el precio de las acciones

individuales (y este tipo de estrategia más comúnmente involucra acciones, no futuros o
divisas) no necesariamente vuelve a su propia media histórica. Más bien, la atención se
centra en sus rendimientos relativos a corto plazo, y nos basamos en la anticorrelación en
serie de estos rendimientos relativos para generar beneficios. En la mayoría de los casos, los
rendimientos relativos se calculan como el rendimiento de una acción menos los
rendimientos promedio de todas las acciones de un universo en particular. Por lo tanto,
esperamos que el rendimiento inferior de una acción sea seguido por un rendimiento superior
y viceversa. Dado que solo estamos midiendo el rendimiento relativo, es muy posible que
hagamos cortos en una acción aunque su rendimiento anterior (absoluto) sea negativo,
siempre que no sea tan negativo como el rendimiento promedio de todas las acciones del
universo.
Una característica interesante de las estrategias transversales es que, a diferencia de las

estrategias de "series de tiempo", no deberíamos esperar beneficios de cada acción
individual, ya que algunas de ellas pueden servir como "coberturas" en algunos días. Por el
contrario, las ganancias solo se pueden obtener en el agregado de todas las acciones. En mi
libro anterior describí tal estrategia propuesta por Khandani y Lo (Ejemplo 3.7 de Chan, 2009;
el artículo original es Khandani y Lo, 2007). Con esta estrategia, invertimos en todas las
acciones de algún índice favorito como S&P 500, S&P 1500 o Russell 2000, pero con
TRADUCCIÓN 82
diferente asignación de capital por acción. Cerca del cierre del mercado de cada día,
determinaremos el capital largo o corto que se asignará a la i-ésima acción como
donde r i es el rendimiento diario de la i-ésima acción, y r j es la rentabilidad diaria

promedio de todas las acciones del índice. En otras palabras, si una acción tiene un
rendimiento muy positivo en relación con sus pares, venderemos muchas de ellas, y si tiene
un rendimiento muy negativo en relación con sus pares, compraremos muchas. Tenga en
cuenta que siempre invertimos el mismo capital bruto total de $ 1 en la cartera todos los días
debido al factor de normalización en el denominador. El fragmento de código MATLAB para
esto se muestra en el Ejemplo 4.3.
Ejemplo 4.3: Modelo lineal largo-corto sobre acciones

La implementación de la Ecuación 4.1 en MATLAB es muy compacta. Suponemos una
matriz de entrada T × N cl de precios de cierre diarios, donde, como es habitual, T es el
número de días de negociación y N es el número de acciones en el SPX. Este código se puede
descargar como andrewlo_2007_2012.m. ret = (cl-rezago (cl, 1)) ./ rezago (cl, 1); %
devoluciones diarias marketRet = smartmean (ret, 2); % índice de mercado ponderado igual%
ponderaciones de retorno = - (ret-repmat (marketRet, [1 size (ret, 2)]));
pesos = pesos. / repmat (smartsum (abs (pesos), 2), ...
[1 talla (pesos, 2)]); dailyret = smartsum (retroceso (1, pesos). * ret, 2); % Capital% es
siempre uno
Tiene una TAE del 13,7 por ciento y un índice de Sharpe de 1,3 desde el 2 de enero de
2007 hasta el 30 de diciembre de 2011, incluso si realizamos una prueba retrospectiva en el
SPX. (Por lo general, el backtesting en un universo de capitalización menor generará
rendimientos aún mayores). Los rendimientos acumulados se representan en la Figura 4.4.
FIGURA 4.4 Rendimientos acumulados del modelo lineal largo-corto

La característica notable de esta estrategia es que es completamente lineal, no tiene
parámetros y es casi perfectamente neutral al dólar. ¿Qué estrategia puede ser más simple
que esta? Y sorprendentemente, logró una TAE del 30 por ciento en 2008, el año de la quiebra
de Lehman Brothers, y una TAE del 11 por ciento en 2011, un año lleno de gran ansiedad por
la rebaja de la calificación de la deuda federal de Estados Unidos y el incumplimiento de
TRADUCCIÓN 83
Grecia. (Su desempeño desde principios de 2008 es una verdadera prueba fuera de la
muestra, ya que la estrategia se publicó en 2007).
En mi libro anterior, también sugerí que podemos mejorar los rendimientos de esta
estrategia utilizando el rendimiento del cierre anterior a la apertura de hoy para determinar los
pesos para la entrada en la apertura. Todas las posiciones se liquidarán al cierre del
mercado, convirtiéndose así en una estrategia intradía. El fragmento de código MATLAB
modificado se muestra en el Ejemplo 4.4.
Es posible que existan otras variables (también llamadas "factores") que son mejores
para predecir la reversión media transversal de los precios de las acciones que los
rendimientos relativos que hemos utilizado en los ejemplos 4.3 y 4.4. Una variable popular
que usan los traders para clasificar las acciones es la relación precio-ganancias (P / E),
donde las ganancias pueden ser las del último trimestre, o pueden ser ganancias
proyectadas estimadas por los analistas o las propias empresas. El razonamiento es que el
APR y el índice de Sharpe durante el mismo período son 73 por ciento y 4.7, respectivamente.
A pesar de un rendimiento tan aparentemente estelar, la versión de apertura a cierre adolece
de algunos inconvenientes que no tiene la versión de cierre a cierre.
Primero, los costos de transacción (no incluidos en nuestros backtests) se duplicarán,

porque estamos operando dos veces al día en lugar de solo una vez al día. En segundo lugar,
dado que esta estrategia también tiene que utilizar precios "abiertos" para determinar las
señales de negociación para la entrada en la apertura, está sujeta al mismo ruido de señal de
negociación que mencioné en el modelo Buy-on-Gap del ejemplo 4.1.
En realidad, incluso para la estrategia de cierre a cierre, tampoco podemos usar el precio
de cierre exacto para determinar los pesos y luego ingresar exactamente a esos precios.
Pero en ese caso, los precios solo unos segundos antes del cierre suelen estar mucho más
cerca de los precios de cierre oficiales reales (intercambio primario) porque estos precios de
cierre previo se imprimen cuando el mercado primario está abierto y tiene alta liquidez. Los
precios de las acciones se desviarán hacia un nuevo valor de equilibrio si hay anuncios de
ganancias o cambios en las estimaciones. Por lo tanto, una acción que experimente un
cambio positivo en las estimaciones de ganancias probablemente disfrutará de un
rendimiento positivo, y no deberíamos esperar que el precio revierta a la media si este
rendimiento está en línea con el cambio porcentual en sus estimaciones de ganancias. Por lo
tanto, podemos evitar poner en corto dicha acción si usamos la relación P / E para clasificar
las acciones.
• ¿Está tentado a negociar pares de acciones debido a la enorme cantidad de opciones?

Tenga cuidado con los cambios en los fundamentos de las empresas que pueden hacer que
el rendimiento fuera de la muestra sea bastante deficiente a pesar de los excelentes
TRADUCCIÓN 84
resultados de las pruebas retrospectivas.
• Negociar una cartera de ETFs cointegrados puede ser mejor que negociar acciones por
pares.
• ¿Está negociando en pares ETF que mantienen futuros? Tenga cuidado con el papel de
los retornos de rollo en la determinación de los retornos totales de futuros.
• La reversión a la media estacional o intradiaria es difícil de detectar con las pruebas

habituales de estacionalidad o cointegración, pero puede ser muy rentable.
• La imposición de un filtro de impulso en las estrategias de inversión de la media

generalmente mejora su consistencia.
• ¿Cree que el arbitraje de índices entre acciones y futuros ya no es rentable? Intente

seleccionar solo un subconjunto de las acciones del índice.
• Las estrategias de reversión de medias transversales se pueden implementar muy

fácilmente con una estrategia lineal largo-corto.
• La variable que se utiliza para clasificar las acciones en una estrategia de reversión de
la media transversal es típicamente el rendimiento relativo, pero pueden ser otros factores
fundamentales como la relación P / E.
Reversión media de divisas y futuros
CAPÍTULO 5
La sabiduría convencional nos dice que las divisas y los futuros son el dominio de los
comerciantes de impulso, y la sabiduría convencional tiene razón al respecto. De hecho, la
mayoría de los CTA (asesores de comercio de productos básicos) se basan en el impulso.
También es cierto que la mayoría de los pares de divisas o futuros no se cointegrarían, y la
mayoría de las carteras de divisas o futuros no presentan una reversión a la media
transversal. Por tanto, las oportunidades de estrategias de reversión a la media en divisas y
futuros son limitadas, pero no inexistentes. Este capítulo guiará al lector hacia aquellas
situaciones en las que la reversión a la media es la excepción y no la regla, como la
negociación de los diferenciales del calendario de futuros. En particular, discutiremos una
estrategia de negociación para un único diferencial entre mercados de futuros: el futuro de la
volatilidad frente al futuro del índice bursátil.
TRADUCCIÓN 85
En el curso de la exploración de la reversión a la media en los futuros, también

discutiremos un modelo matemático simple de precios de futuros que iluminará conceptos
como los rendimientos al contado versus los retornos al contado y el retroceso versus
contango. La comprensión de este modelo también ayudará a sugerir nuevas estrategias de
negociación de futuros sin recurrir a indicadores técnicos ad hoc.
El comercio de divisas tiene ciertos matices que son ajenos a los operadores de bolsa.
Se debe tener cuidado al probar la cointegración de monedas o al calcular los rendimientos
de una cartera de monedas asegurándose de que un movimiento de puntos en un par de
divisas tenga el mismo valor en dólares que un movimiento de puntos en otro par de divisas;
de lo contrario, los resultados no tendrán sentido. Además, los intereses de reinversión a
veces pueden jugar un papel importante en la determinación de los retornos totales. Estos
matices se cubrirán en este capítulo.
■ Negociar tipos de cambio cruzados

La idea básica para formar una cartera estacionaria de monedas extranjeras es muy
similar a la negociación de pares ETF de índices bursátiles de diferentes países: necesitamos
encontrar países que tengan fundamentos económicos similares. Dado que encontramos,
por ejemplo, que EWA (índice bursátil australiano ETF) y EWC (índice bursátil canadiense
ETF) se cointegran, podríamos esperar encontrar AUD (dólar australiano) para cointegrarse
con CAD (dólar canadiense) también. Además, debido a que tanto Australia como Sudáfrica
tienen importantes ingresos mineros, podríamos esperar que el AUD se cointegrara con ZAR
(rand sudafricano). De hecho, los comerciantes han llamado a estas y otras monedas, como
la corona noruega, monedas de materias primas.
El comercio de pares de divisas tiene una serie de ventajas en comparación con el

comercio de sus pares de ETF de índice bursátil correspondientes. Por lo general, la liquidez
en monedas es mayor (especialmente para los mejores tamaños de oferta / demanda), lo que
reduce los costos de transacción. El apalancamiento que se puede emplear para las
monedas también es mucho mayor, aunque, por supuesto, esto puede ser un arma de doble
filo. No hay restricciones de venta corta para monedas. Finalmente, el comercio de divisas se
puede realizar durante todo el día, al menos cinco días a la semana a partir de las 5:00 p.m.
ET del domingo a las 5:00 p.m. ET del viernes. (ET puede ser EDT o EST; es decir, GMT-4 o
Esto significa que tenemos muchas más oportunidades comerciales en divisas, y también
podemos emplear stop loss de manera significativa (si un mercado está cerrado por durante
un largo período, los stop loss son inútiles ya que el mercado puede subir o bajar cuando se
reabre).
A pesar de la similitud conceptual con el comercio de pares ETF, la mecánica del

comercio de divisas es bastante diferente. Comencemos con una terminología básica. Si
TRADUCCIÓN 86
estamos operando con el tipo de cambio cruzado AUD.ZAR, entonces el AUD se llama la
moneda base y el ZAR es la moneda de cotización. (Mi nemotécnica personal para esto: B
está por delante de Q alfabéticamente, por lo que el orden es B.Q.) Si AUD.ZAR se cotiza a
9.58, se necesitan 9.58 rand sudafricanos para comprar 1 dólar australiano. Comprar
100.000 AUD.ZAR significa comprar 100.000 dólares australianos, mientras se vende la
cantidad equivalente (100.000 × 9,58 = 958.000 en la cotización anterior) de rand
sudafricano. Sin embargo, pocos corredores realmente ofrecen AUD. ZAR como tasa
cruzada. Por lo general, tenemos que comprar X unidades de B.ZAR y vender X unidades de
B.AUD para comprar efectivamente X dólares australianos por valor de AUD.ZAR, donde B es
alguna otra divisa base. Normalmente elegimos una divisa base muy líquida como el USD o el
EUR para esta operación. Podemos denotar un par sintético como USD.ZAR / USD.AUD, ya
que la cotización de AUD.ZAR será exactamente igual a esta relación de cotizaciones.
Cuando realmente negociemos este par sintético en vivo, las ganancias y pérdidas realizadas
(P&L) estarán denominadas tanto en ZAR como en AUD. En general, cuando calculamos los
rendimientos de una estrategia de trading con BQ, estamos asumiendo que las ganancias
están denominadas en nuestra moneda local (USD para los inversores estadounidenses), que
puede no ser ni B ni Q. Por lo tanto, para nuestras pérdidas y ganancias reales realizadas
Para cumplir con nuestro P&L de backtest, necesitamos convertir regularmente B y Q a
nuestra moneda local. Por ejemplo, si nuestra moneda local es el USD, y hemos obtenido
beneficios de X unidades de AUD e Y de ZAR después de una operación de ida y vuelta,
necesitamos comprar X unidades de ZAR.USD e Y de ZAR.AUD. Si no hacemos esto con
regularidad, una gran P&L acumulada en AUD y ZAR puede causar una desviación
significativa de nuestros resultados de backtest.
Incluso cuando una tasa cruzada como AUD.CAD está lista para operar, a veces
podemos encontrar ventajoso sopesar las dos monedas de manera diferente operando
AUD.USD versus USD.CAD por separado. El código del ejemplo 5.1 ilustra tal estrategia. En
esta estrategia utilizamos la prueba de Johansen para encontrar la mejor relación de
cobertura de capital, o ponderaciones de capital, entre AUD.USD versus CAD.USD. ¿Por qué
no utilizar la cotización convencional USD.CAD en lugar de CAD? ¿DÓLAR
ESTADOUNIDENSE? Esto se debe a que para interpretar el vector propio de la prueba de
Johansen como ponderaciones de capital, las dos series de precios deben tener la misma
moneda de cotización. De lo contrario, los movimientos puntuales de los dos presuntos
instrumentos de cointegración no tendrían el mismo valor, lo que haría que la prueba de
Johansen no tuviera sentido. El uso de CAD.USD en nuestro programa de backtest no
dificulta las operaciones en vivo: siempre que el programa envíe una orden para "Comprar 1
unidad de CAD.USD", deberíamos simplemente "Vender 1 / a de USD.CAD". siempre que y sea
la cotización actual de USD.CAD.
En el ejemplo 5.1, nos centramos en el comercio de dos divisas que, en última instancia,
pueden reducirse a un par con una divisa de cotización común USD: B 1 .USD - B 2 .USD.
TRADUCCIÓN 87
Entonces, los rendimientos de una cartera con n 1 unidades de B 1 .USD yn 2 unidades de B 2

.USD es = + + r n y r y t t n y
donde y i, U (t) y y i, U (t + 1) son las cotizaciones para B i .USD en t y t + 1

respectivamente. Esto se debe a que una unidad de B i .USD vale y i, U en dólares
estadounidenses. Sin embargo, si una cartera tiene n 1 unidades de USD.Q 1 y n 2 unidades
de USD.Q 2 en su lugar, entonces el rendimiento se puede escribir más simplemente como
y y U, i (t) y y U, i (t + 1) son las cotizaciones para USD.Q i en t y t + 1, respectivamente.

Esto se debe a que una unidad de USD.Q i vale exactamente un dólar estadounidense.
Permítanme decirles de inmediato que las ecuaciones 5.2 y 5.4 no son estrictamente
correctas, ya que hemos ignorado los intereses de renovación, que discutiremos en la
siguiente sección. Pero el impacto de los intereses de reinversión no suele ser grande para
las estrategias a corto plazo como la que describo en el ejemplo 5.1, por lo que las hemos
omitido aquí por simplicidad.
Ejemplo 5.1: Negociación de pares USD.AUD frente a USD.CAD

utilizando el vector propio de Johansen
Esta es una estrategia clásica de reversión de media lineal similar a la del Ejemplo 3.1
(PriceSpread.m). Anteriormente, usamos una revisión retrospectiva de 20 días para calcular
el índice de cobertura, mientras que aquí usamos un conjunto de entrenamiento fijo de 250
días (que da mejores resultados en retrospectiva), aunque todavía estamos usando una
revisión retrospectiva de 20 días. para calcular la media móvil y la desviación estándar. Sin
embargo, nuestra estrategia actual es muy diferente de una estrategia de divisas típica como
la del ejemplo 2.5. Aquí, la relación de cobertura entre las dos monedas no es una, por lo que
no podemos negociarla como una tasa cruzada AUD.CAD. En lugar (continuación) Ejemplo
5.1 (continuación) de ejecutar la prueba de Johansen en USD.AUD frente a USD.CAD, en
realidad deberíamos ejecutarla en AUD.USD y CAD.USD, de modo que el valor en dólares de
un movimiento de punto en cada instrumento sea lo mismo. Intuitivamente, esto también
tiene sentido, ya que en una estrategia de reversión a la media queremos comprar CAD si
CAD.USD es mucho más bajo que AUD.USD.
Suponemos que la entrada son dos matrices T × 1 usdcad y usdaud, ambas series de
precios diarias. La matriz T × 1 yport es el valor de mercado de una cartera de unidades de
AUD.USD y CAD.USD expresada en USD, mientras que numUnits es el número de unidades de
esta cartera de unidades que nuestra estrategia nos pide que tengamos. Las posiciones de la
matriz T × 2 denotan los valores de mercado en USD de AUD.USD y CAD.USD que deberíamos
poseer. Naturalmente, el P&L (en USD nuevamente) es solo la suma del valor de mercado de
cada instrumento multiplicado por sus rendimientos, y el rendimiento diario de la cartera es el
TRADUCCIÓN 88
P&L dividido por el valor de mercado bruto total de la cartera al final de la anterior. día.
El código se puede descargar como AUDCAD_unequal.m. pnl = suma (rezago

(posiciones, 1). * (y-rezago (y, 1)) ./ rezago (y, 1), 2); ret = pnl. / sum (abs (lag (posiciones, 1)),
2);

Teniendo cuidado de excluir los primeros 250 días de datos de entrenamiento continuo
al calcular el desempeño de la estrategia, la APR es del 11 por ciento y el índice de Sharpe es
de 1.6, para el período del 18 de diciembre de 2009 al 26 de abril de 2012. La curva de
rendimientos acumulados es trazada en la Figura 5.1. A veces, puede encontrar
oportunidades de ganancias intercambiando dos pares de tasas cruzadas completamente
diferentes entre sí: B 1 .Q 1 versus B 2 .Q 2. Si la estrategia requiere una cartera de n 1
unidades de B 1 .Q 1 yn 2 unidades de B 2 .Q 2, el rendimiento diario (en la presunta moneda
local de USD) de la cartera viene dado por la misma Ecuación 5.1. . El r i habrá el retorno de B
i .Q i, por lo que la Ecuación 5.2 se reemplaza por
donde y i, Qi (t) es la cotización de B i .Q i. Las mismas ecuaciones, 5.1 a 5.5, son válidas
si hubiéramos utilizado EUR o cualquier otra moneda en lugar de USD como moneda local
para calcular los rendimientos. Como puede ver, la dificultad clave al hacer backtesting de las
estrategias de arbitraje cambiario no es la complejidad de las estrategias, sino la forma
correcta de preparar la serie de datos para las pruebas de cointegración y la fórmula correcta
para medir los rendimientos.
■ Intereses de reinversión en el comercio de divisas

Una característica del tipo de cambio cruzado de negociación de divisas es el tipo de
interés diferencial ganado o pagado si la posición de tipo cruzado se mantiene durante la
noche. Tenga en cuenta que "de la noche a la mañana" en el comercio de divisas significa
mantener una posición hasta o más allá de las 5:00 p.m. ET. Si tenemos un par B.Q largo de
la noche a la mañana, el diferencial de interés es i B - i Q, donde i B e i Q son las tasas de
interés diarias de las divisas B y Q, respectivamente. Si i Q> i B, entonces este diferencial de
interés, también llamado interés de reinversión, es en realidad un interés de débito (es decir,
se debitará su cuenta). En realidad, por motivos que tienen que ver con el sistema de
liquidación de T + 2 días, si se ocupó un puesto pasadas las 5 de la tarde. ET cierra el día T, y
el día T + 3 es un fin de semana o feriado para cualquiera de las divisas de la tasa cruzada, el
interés de refinanciamiento acumulado en esa posición se multiplicará por uno más el
número de días que el mercado permanece cerrado. Entonces, si un puesto se ocupó después
de las 5 p.m. ET del miércoles, el interés de reinversión es tres veces la tasa diaria, ya que el
TRADUCCIÓN 89
mercado está cerrado los sábados y domingos. Se aplica una excepción adicional a esta
regla cuando estamos negociando USD.CAD o USD.MXN, donde la liquidación se produce el
día T + 1, por lo que solo multiplicamos el interés de reinversión por uno más el número de
días no negociables si el día T + 2 es un fin de semana o feriado. (Por lo tanto, solo si una
posición se mantuvo después de las 5:00 p.m. ET del jueves, el interés de reinversión será
tres veces la tasa diaria). Todas estas consideraciones afectan la precisión de una prueba
retrospectiva de estrategias que mantienen posiciones durante la noche.
Cuando calculamos el índice de Sharpe para cualquier estrategia, necesitamos calcular

el rendimiento en exceso, porque el índice de Sharpe es el índice del rendimiento en exceso
promedio dividido por la desviación estándar del rendimiento en exceso, adecuadamente
anualizado. El exceso de rendimiento es el rendimiento de las posiciones que mantiene la
estrategia menos el costo de financiación de esas posiciones. Entonces, si solo tenemos
posiciones intradía, el costo de financiamiento es cero. Si estamos negociando una cartera
de acciones neutral en dólares larga-corta, podemos suponer que el costo de financiamiento
es cercano a cero, aunque el interés crediticio suele ser ligeramente menor que el valor
absoluto del interés débito. Para las posiciones de futuros, el costo de financiación también
es cero, porque las posiciones de futuros son solo contratos, no activos que requieren
efectivo para su financiación. (No contamos el requisito de efectivo de margen, ya que ese
efectivo genera intereses en la cuenta). En el caso de tipos de cambio cruzados, podemos
establecer nuevamente el costo de financiamiento en cero, siempre y cuando tengamos
cuidado de agregar el el interés de reinversión al cambio porcentual de la tasa cruzada. Es
decir, necesitamos modificar la Ecuación 5.5 para que el exceso de rendimiento r t + 1 por
mantener una posición de tasa cruzada POS B.Q desde el día t al día t + 1 sea
donde y (t) e y (t + 1) son las cotizaciones de BQ en t y t + 1, respectivamente (Dueker,

2006).
En el ejemplo 5.2, vemos cómo podemos tener en cuenta los intereses de reinversión al
realizar una prueba retrospectiva de la estrategia de reversión de media lineal en AUD.CAD.
Ejemplo 5.2: Negociación de pares AUD.CAD con intereses de

reinversión
Continuamos usando la estrategia de reversión de media lineal en este ejemplo, pero en
contraste con el Ejemplo 5.1 y en aras de la simplicidad, negociamos el par AUD.CAD listo
para usar, no USD.CAD versus AUD. USD por separado. Tendremos en cuenta las tasas de
interés de reinversión durante la noche porque esta estrategia se mantiene más allá de las 5
p.m. ET. Suponemos que los precios de cierre diarios de AUD.CAD están contenidos en una
matriz T × 1 dailyCl y las fechas de negociación correspondientes en la matriz T × 1 tday.
TRADUCCIÓN 90
Esta estrategia simple de reversión a la media produce una APR del 6.2 por ciento, con un
índice de Sharpe de 0.54, que son resultados mucho más débiles que los del ejemplo 5.1,
que, como recordará, utiliza un índice de cobertura de no unidad. También vale la pena
señalar que incluso si hubiéramos olvidado tener en cuenta el interés de reinversión en este
caso, la APR aumentaría solo ligeramente a 6.7 por ciento y el índice de Sharpe a 0.58,
aunque el interés de reinversión promedio anualizado ascendería a casi 5 por ciento.
■ Diferencial del calendario de negociación de futuros

Los contratos de futuros con diferentes fechas de vencimiento (o "vencimientos") tienen
diferentes precios y tienen rendimientos ligeramente diferentes. La combinación de contratos
de futuros con diferentes vencimientos crea lo que se conoce como diferenciales de
calendario.
Dado que ambos tramos de un diferencial de calendario rastrean el precio del activo
subyacente, uno pensaría que los diferenciales de calendario ofrecen potencialmente buenas
oportunidades para el comercio de reversión a la media. Pero en realidad, generalmente no
significan revertir.
Para comprender por qué, debemos comprender más sobre qué impulsa los
rendimientos de los futuros en general.
Roll Returns, Backwardation y Contango

El hecho de que los contratos de futuros con diferentes vencimientos tengan diferentes
precios implica que una posición de futuros tendrá un rendimiento distinto de cero incluso si
el precio al contado subyacente permanece sin cambios, ya que eventualmente todos sus
precios tienen que converger hacia ese precio al contado constante. Esta devolución se
denomina devolución de rollo o rendimiento de rollo. A pesar de su nombre, una posición de
futuros sufre este retorno si realmente "avanzamos" al siguiente contrato. Es una parte
intrínseca de su retorno total, que puede descomponerse en un retorno al contado y un
retorno de rollo. Si los contratos están en backwardation, lo que significa que los contratos
cercanos (próximos a expirar) tienen precios más altos que los contratos lejanos, entonces
los retornos de rollo serán positivos; de lo contrario si los contratos están en contango,
entonces las devoluciones de rollo serán negativas. Para ver esto, imagine que el precio al
contado no cambia a lo largo del tiempo, representado por la línea horizontal en la Figura 5.2.
También podemos pretender que los precios de futuros logarítmicos con diferentes
vencimientos se ajustan a la misma función lineal de tiempo con la misma pendiente pero
con diferentes compensaciones, intersectando el precio al contado en los vencimientos. La
TRADUCCIÓN 91
pregunta es: ¿La pendiente debe ser positiva o negativa? Gráficamente, si los futuros más
cercanos tienen un precio más alto que los futuros más lejanos y tienen que cruzarse antes
con la línea horizontal, deben tener pendiente ascendente y tener un rendimiento positivo,
como se muestra en la Figura 5.2. En un momento dado, el precio del primer contrato
cercano P 1 es más alto que el del segundo contrato cercano P 2, y así sucesivamente. Lo
contrario es cierto si están en contango, como se ilustra en la Figura 5.3. (Mostramos los
precios de los registros en lugar de los precios brutos, de modo que un contrato con un
rendimiento total compuesto constante aparecerá como una línea recta).
Tenga en cuenta que este argumento gráfico simplemente sirve como nemotécnico, no
como prueba, ya que, por supuesto, los precios reales de los futuros logarítmicos no son
funciones lineales del tiempo, incluso pueden cruzarse (dos contratos de diferentes
vencimientos que tienen la
Mnemónico para Backwardation versus Contango

Nunca puedo recordar si el backwardation significa que los contratos cercanos tienen un
precio más alto o más bajo. Si eres como yo, puedes emplear el siguiente mnemónico.
Este mnemónico se originó con John Maynard Keynes (Hull, 1997). Él y John Hicks
argumentaron que para los productos básicos normales, aquellos que realmente poseen los
productos físicos (los "coberturistas", como los agricultores o los productores de petróleo)
tienden a cubrir sus posiciones colocando cortos en futuros, esperando perder dinero en sus
coberturas. Mientras tanto, los especuladores son los que tienen una posición larga neta y
necesitan ser compensados por asumir este riesgo. Por lo tanto, comprarán solo futuros con
rentabilidad positiva o, de manera equivalente, futuros que tengan precios más bajos que el
precio al contado futuro esperado; es decir, los que están en "backwardation normal". Por lo
tanto, debemos recordar que "backwardation" siempre está asociado con "normal", y "normal"
significa que el precio de futuros siempre es más bajo que el precio al contado.
Por supuesto, este argumento no es del todo correcto, ya que veremos que el crudo, un
commodity perfectamente "normal", está en contango durante varios períodos. Pero esta
historia nos da una buena mnemotécnica.
Para calcular los rendimientos spot y roll para un conjunto de contratos de futuros, es útil
tener un modelo simple de precios de futuros. Para muchos productos básicos, podemos
escribir
donde t es la hora actual, T es la hora de vencimiento y S (t) es el precio al contado (Hull,

1997). Este modelo implica que el rendimiento del balanceo (compuesto) γ es constante en el
tiempo. Pero podemos dar un paso más y asumir que el retorno al contado (compuesto) α
TRADUCCIÓN 92
también es constante:
donde c, α y γ son constantes. El rendimiento total de un contrato viene dado por ∂ (log F
(t, T)) / ∂t = α + γ (5.10) ya que T es fijo para un contrato específico. Por último, el
rendimiento de la renovación de los futuros está dado por −∂ (log F (t, T)) / ∂T = γ (5.11) Por
lo tanto, hemos capturado matemáticamente la noción de que el rendimiento total = el
rendimiento al contado + el rendimiento de la renovación. Con base en este modelo,
podemos usar la regresión lineal para estimar los rendimientos spot y roll de una serie de
futuros, como se demuestra en el ejemplo 5.3.
Los retornos de rollo pueden ser una maldición en muchas estrategias aparentemente
atractivas basadas en el conocimiento o la intuición informados por el precio al contado
subyacente. Por ejemplo, un ETF de productores de productos básicos (como XLE)
generalmente se cointegra con el precio al contado de ese producto básico. Pero debido a la
presencia de un retorno de rollo, este ETF puede no cointegrarse con el precio de futuros de
ese producto básico. No comprender esta sutileza me costó más de $ 100,000 en pérdidas
comerciales y arruinó mi primer año (2006) como operador independiente.
Ejemplo 5.3: Estimación de los rendimientos al contado y al contado

mediante el modelo de rendimientos constantes
Si asumimos que los retornos al contado y al rodar son realmente constantes a lo largo
del tiempo, como hicimos en la Ecuación 5.9, podemos usar la regresión lineal para estimar
sus valores. Es fácil encontrar el rendimiento al contado de esta manera, ya que solo
necesitamos hacer una regresión del registro de los precios al contado en función del tiempo.
Pero para encontrar el rendimiento del rollo es necesario elegir un punto fijo en el tiempo y
hacer una regresión de los precios de los distintos contratos con respecto a su fecha de
vencimiento. En la práctica, el coeficiente de regresión dependerá de ese tiempo fijo y
también del conjunto exacto de contratos disponibles en ese momento. Entonces, a pesar de
la suposición de rendimientos de balance constantes, aún terminaremos con una γ estimada
que varía lentamente. Aplicaremos este procedimiento a algunos futuros diferentes en
diferentes categorías: el futuro BR del Real Brasileño, el futuro del maíz C, el futuro del
petróleo crudo WTI CL, el futuro del cobre HG y el futuro TU del Bono del Tesoro de Estados
Unidos a dos años.
En el siguiente programa, asumimos que el precio al contado está contenido en una

matriz al contado de τ × 1, y los datos de precios de cierre de futuros se almacenan en una
matriz de τ × M cl, donde τ es el número de días de negociación y M es el número de
contratos. Ciertamente no todos los contratos existen en todo momento, por lo que
denotaremos los precios para esos días en los que algunos contratos son inexistentes como
TRADUCCIÓN 93
NaN.
Primero encontraremos el promedio anualizado (A continuación, ajustaremos la curva

forward (el precio futuro en función de la fecha de vencimiento) con el fin de obtener los
valores de la rentabilidad del rollo γ; es decir, elegiremos un día a la vez y ajustar los precios
de los futuros de los cinco vencimientos más cercanos a su tiempo hasta el vencimiento T
(medido en meses), siempre que haya cinco contratos consecutivos para el ajuste (la curva a
plazo bien podría cambiar de contango a (Continuación)

backwardation o viceversa más allá de los cinco contratos más cercanos.)
Almacenamos los valores de γ en una matriz gamma de τ × 1. Gamma = NaN (tamaño (tday)

Los valores anualizados de γ durante el período del 22 de noviembre de 2004 al 13 de
agosto de 2012 para CL se representan en la Figura 5.5. En la tabla 5.1 enumeré los valores
promedio anualizados para los rendimientos al contado α y los rendimientos del rollo γ para
los cinco futuros. ¡Puede ver que para BR, C y TU, la magnitud de los retornos de rollo es
mucho mayor que la de los retornos al contado! Figura 5.6, una diferencia que se debe
enteramente al retorno del rollo. El futuro de VX ha estado en contango alrededor de las tres
cuartas partes del tiempo, y el retorno de rollo promedio es un 50 por ciento anualizado muy
negativo (Simon y Campasano, 2012). Este contango persistente es el motivo por el que
encontramos en el capítulo 6 que una estrategia de impulso funciona bastante bien con VX.
Los rendimientos de rollo promedio pueden ser bastante altos en comparación con sus
rendimientos al contado promedio para otros futuros además de VX también. La tabla 5.1
muestra que el rendimiento anualizado del rollo para el maíz es -12,8 por ciento en
comparación con un rendimiento al contado del 2,8 por ciento, y Erb y Harvey calcularon que
el rendimiento anualizado del rollo para el aceite de calefacción es del 4,6 por ciento, en
comparación con un rendimiento al contado del 0,93 por ciento, sobre el período de
diciembre de 1982 a mayo de 2004 (Erb y Harvey, 2006).
¿Los diferenciales de calendario significan reversión?

Un diferencial de calendario es una cartera que consta de una posición larga en un
contrato de futuros y una posición corta en otro contrato de futuros con el mismo subyacente
pero con un mes de vencimiento diferente. Según nuestra experiencia previa con los
diferenciales en general, los diferenciales de calendario parecen ser excelentes candidatos
TRADUCCIÓN 94
para la reversión de la media: ¿no están ambas partes rastreando exactamente el mismo
activo subyacente? Pero aquí nuevamente, los retornos de rollo descarrilan nuestra intuición.
El modelo de precios de futuros expresado en la Ecuación 5.7 aclarará esto.
Al igual que con cualquier negociación con diferencial, podemos optar por definir el
diferencial como las diferencias de los precios de los logaritmos de los dos tramos para
generar señales de negociación (véase el Capítulo 3), asumiendo que mantenemos el valor de
mercado de los dos tramos en lo mismo en cada período. El valor de mercado logarítmico de
una cartera de margen con un contrato largo a largo plazo y un contrato corto cercano es
simplemente γ (T 1 - T 2) con T 2> T 1, de acuerdo con la Ecuación 5.7. (Nuevamente, esta
fórmula simple puede no ser válida si T 2 - T 1 es grande). El punto importante es que la señal
de negociación del margen de calendario no depende en absoluto del precio al contado, ¡solo
del rendimiento de la tirada! Como aprendimos en el Capítulo 2, las series de retorno (a
diferencia de las series de precios) casi siempre revierten a la media. Aquí no estamos
considerando el rendimiento total de un futuro, sino solo el componente de devolución de
rollo, por lo que las cosas pueden ser diferentes. (Aunque el modelo expresado en la
Ecuación 5.7 presupone que los retornos spot y roll son constantes, no obstante podemos
intentar aplicarlo a situaciones donde el retorno roll varía lentamente). Ejecutamos la prueba
ADF para la propagación del calendario logarítmico de 12 meses de CL , y descubrió que de
hecho es estacionario con un 99 por ciento de probabilidad y una vida media de 36 días.
Además, si aplicamos nuestra estrategia habitual de reversión de media lineal al margen de
calendario logarítmico para CL, obtenemos una APR de 8.3 por ciento y una razón de Sharpe
de 1.3 desde el 2 de enero de 2008 hasta el 13 de agosto de 2012. Los detalles de la backtest
se describen en el ejemplo 5.4.
Ejemplo 5.4: Negociación de reversión media de diferenciales de

calendario
Como comentamos en el texto principal, el valor de mercado logarítmico de una cartera
de margen de calendario con un contrato largo a largo plazo y un contrato corto cercano es
simplemente γ (T 1 - T 2), con T 2> T 1. Dado que T 1 y T 2 están fijos para un margen de
calendario particular, podemos usar (con suerte) γ de reversión a la media para generar
señales comerciales. En el programa (continuación)

calendarSpdsMeanReversion.m a continuación, asumimos que el precio de los contratos
CL se almacena en una matriz cl τ × M, donde τ es el número de días de negociación y M es
el número de contratos. Calculamos γ de la misma manera que en el ejemplo 5.3 y
almacenamos los valores resultantes γ en una matriz gamma de τ × 1. Como primer paso,
TRADUCCIÓN 95
encontramos la vida media de γ.
isGoodData = encontrar (isfinite (gamma)); gammalag = retraso (gamma (isGoodData),

1); deltaGamma = gamma (isGoodData) -gammalag;
deltaGamma (1) Aquí viene la parte más difícil. Necesitamos elegir un par de contratos,
lejanos y cercanos, en cada día histórico, según tres criterios:
1. El período de tenencia de un par de contratos es de 3 meses (61 días de negociación).

2. Pasamos al siguiente par de contratos 10 días antes del vencimiento del contrato actual. 3.
Las fechas de vencimiento de los contratos cercanos y lejanos tienen una diferencia de 1
año.
Una vez que hemos elegido esos contratos, asumimos inicialmente que mantendremos
una posición larga en el contrato lejano y una posición corta en el cercano, sujeto a
revisiones posteriores.
isExpireDate = false (tamaño (cl)); posiciones = ceros (tamaño (cl));
Los estudiosos de los mercados de productos básicos saben que la estacionalidad suele
ser una característica destacada. Por lo tanto, puede encontrar que para un mercado en
particular, solo los diferenciales de calendario de ciertos meses (y con ciertos meses de
diferencia) significan reversión. Sin embargo, aquí no buscaremos estos detalles que
dependen del mercado.
Podemos probar esta misma estrategia de reversión de media lineal en los diferenciales
del calendario VX. Resulta que la Ecuación 5.7 funciona solo para un futuro cuyo subyacente
es un activo negociado, y VIX no lo es. (Si traza un diagrama de dispersión de los precios de
los futuros de log VX en función del tiempo hasta el vencimiento, como hicimos en la Figura
5.4 para CL, encontrará que no caen en línea recta). Varios investigadores han sugerido
fórmulas alternativas adecuado para el futuro de VX (ver, por ejemplo, Dupoyet, Daigler y
Chen, 2011), pero he descubierto que ninguno puede explicar la propiedad de reversión a la
media de los diferenciales del calendario VX en la cara

Esto resulta en una APR sin apalancamiento atractiva de 8.3 por ciento y un índice de
Sharpe de 1.3 desde el 2 de enero de 2008 hasta el 13 de agosto de 2012. La curva de
rendimiento acumulado se muestra en la Figura 5.7. de la reversión no media del propio
futuro VX. Por lo tanto, podemos confiar solo en nuestra observación empírica de que una
prueba ADF en la relación anterior / posterior de VX también muestra que está estacionario
TRADUCCIÓN 96
con una probabilidad del 99 por ciento. Si aplicamos nuestra estrategia habitual de reversión
de media lineal utilizando el ratio como señal (y con un análisis retrospectivo de 15 días para
el promedio móvil y las desviaciones estándar), VX arroja una TAE del 17,7 por ciento y un
ratio de Sharpe de 1,5 a partir del 27 de octubre. , 2008, al 23 de abril de 2012 (ver Gráfico 5.8
para un gráfico de sus rendimientos acumulados), aunque tuvo un desempeño mucho peor
antes de octubre de 2008. En la siguiente sección, presentaré evidencia gráfica de que hay un
cambio de régimen en el comportamiento del VIX y sus futuros en la época de la crisis
financiera de 2008, por lo que quizás este cambio abrupto en el desempeño de la estrategia
también esté relacionado con eso.
■ Diferenciales entre mercados de futuros

Como indiqué en la introducción de este capítulo, no es fácil encontrar diferenciales
entre mercados de futuros (es decir, pares de futuros de diferentes subyacentes) que tengan
una reversión media. No obstante, acorralemos sistemáticamente a algunos de los
sospechosos habituales.
El candidato más obvio para el comercio de futuros de pares son los diferenciales entre
mercados entre mercados que están estrechamente relacionados. Por ejemplo, los
complejos energéticos (petróleo crudo WTI CL, petróleo crudo Brent BZ, gasolina sin plomo
RB y combustible para calefacción HO, todos negociados en la Bolsa Mercantil de Nueva
York [NYMEX]) deberían ofrecer grandes oportunidades potenciales. Antes de ejecutar una
prueba de Johansen en estos cuatro contratos, primero podemos examinar una cartera bien
conocida denominada crack spread que consta de tres contratos largos de CL, dos contratos
cortos de RB y uno corto de HO. Esto se llama propagación de la grieta porque podemos
obtener gasolina y aceite de calefacción al romper las largas cadenas de hidrocarburos de
las moléculas de petróleo crudo, y las relaciones de cobertura 3: 2: 1 se producen porque tres
barriles de CL producen aproximadamente dos barriles de RB y un barril. de gasóleo para
calefacción, aunque esto no es universalmente cierto para todos los refinadores. Una ventaja
de negociar el diferencial de crack es que NYMEX ofrece una canasta lista para usar, con un
requisito de margen mucho menor que si los intercambiamos por separado.
Sin embargo, la ejecución de una prueba de ADF en la propagación de grietas desde el

20 de mayo de 2002 hasta el 4 de mayo de 2012, muestra que esta propagación no significa
revertir. El gráfico de este diferencial (Figura 5.9) revela un aumento dramático en el valor
alrededor del 9 de marzo de 2007 al 3 de julio de 2008, y luego una fuerte caída después de
eso, y ejecutar la estrategia de reversión a la media lineal muestra retornos negativos para
ese período. . (Tenga en cuenta que debemos retroajustar los contratos continuos utilizando
precios en lugar de rendimientos en esta prueba; de lo contrario, este diferencial de precios
mostrará un salto discontinuo en las renovaciones, como se explica en el Capítulo 1).
TRADUCCIÓN 97
Otro margen que parecería ser un buen candidato es CL y BZ en una proporción de 1: 1.

Después de todo, sus subyacentes son ambos petróleos crudos. Pero otra prueba rápida del
ADF mostrará que está lejos de estar estacionario. BZ ha superado implacablemente a CL
debido a una variedad de factores. Los posibles culpables incluyen el aumento de la
producción de petróleo en los Estados Unidos (Friedman, 2012), el cuello de botella del
oleoducto en Cushing, Oklahoma (Philips, 2012) y preocupaciones geopolíticas FIGURA 5. 9
La propagación del crack, como el embargo contra el petróleo iraní en 2012 , que afectó a
Europa y por tanto a BZ más que a Estados Unidos.
Si desea realizar una prueba retrospectiva de los diferenciales entre mercados, no olvide
asegurarse de que sus precios sean sincrónicos, como advertí en el Capítulo 1. En particular,
antes de que BZ comenzara a cotizar en el NYMEX el 5 de septiembre de 2001, se cotizaba en
el Intercontinental Petroleum Exchange en Londres, que obviamente tiene una hora de cierre
diferente a NYMEX en la que CL siempre se ha negociado. Por lo tanto, realizar una prueba
retrospectiva del diferencial BZ-CL antes del 5 de septiembre de 2001, utilizando precios de
cierre, sería incorrecto. Además, a menudo necesitamos multiplicar los precios de futuros por
un factor para convertir puntos en USD.
Nuestra búsqueda de diferenciales de futuros entre mercados que reviertan la media no

ha sido fructífera hasta ahora. Pero ahora discutiré una extensión inusual que cambiará eso.
Futuros de volatilidad versus futuros de índices de acciones

Muchos traders han observado que la volatilidad no está correlacionada con el índice
bursátil del mercado de valores: cuando el mercado baja, la volatilidad se dispara y, en menor
medida, viceversa. Una forma de visualizar esta relación inversa es graficar ES, los precios de
los futuros del mes anterior de E-mini S&P 500, contra VX, los precios de los futuros del mes
anterior de VIX. Esto se puede lograr mediante la función "dispersar" en MATLAB, y el
resultado se muestra en la Figura 5.10.
La primera característica obvia de este gráfico es que, de hecho, el índice bursátil tiene
una relación inversa con la volatilidad. Pero, lo que es más interesante, parecía haber dos
regímenes principales, de 2004 a mayo de 2008 y de agosto de 2008 a 2012. El segundo
régimen tiene una volatilidad notablemente menor para un nivel de índice bursátil
determinado. En la FIGURA 5.10 Un estudio de los regímenes de volatilidad: ES versus VX
English, el mercado es menos volátil hoy en día. Sin embargo, el rango de volatilidades es
mayor ahora, lo que significa que tenemos días con volatilidades más extremas que antes.
(Hay otros períodos más cortos que pueden representar estados de transición, pero los
ignoraremos en nuestro análisis). Sería un error ejecutar una regresión lineal o aplicar la
prueba de Johansen a una mezcla de ambos regímenes, por lo que nos enfocaremos en el el
segundo, que se extiende hasta el momento de escribir este artículo.
TRADUCCIÓN 98
Elegimos calcular los coeficientes de regresión solo para los primeros 500 días de los
datos posteriores a agosto de 2008 como el conjunto de entrenamiento porque luego nos
gustaría usar las diversas estadísticas de esta regresión para construir nuestro modelo de
negociación. Antes de ejecutar los precios a través del programa de regresión lineal,
debemos recordar que los precios de futuros de VX y ES están en unidades diferentes: un
movimiento de un punto en VX es de $ 1,000, mientras que un movimiento de un punto en ES
es de $ 50. Por lo tanto, debemos multiplicar los precios de VX por 1000 y los precios de ES
por 50 para que el índice de cobertura refleje adecuadamente el índice en el número de
contratos.
La relación lineal se muestra en la Ecuación 5.11.
ES × 50 = −0,3906 × VX × 1.000 + $ 77.150 (5,11)
donde ES y VX son sus respectivos precios de futuros (liquidación). La desviación

estándar de los residuos es $ 2047. Esto significa que un portafolio largo de 0.3906 contratos
de VX y uno largo de ES debe ser estacionario, como nos convencería una gráfica (Figura
5.11) del valor de mercado de este portafolio. Podemos construir una estrategia de reversión
de media similar a una banda de Bollinger acortando esta cartera siempre que su valor se
desvíe de una desviación estándar Existe una estrategia diferente de VX versus ES que
podemos emplear, que no se basa en las propiedades de reversión de la media de la difundir
VX-ES. Debido a que esa es una estrategia de impulso, la discutiré en el próximo capítulo.
FIGURA 5.12 Rendimientos acumulados de la estrategia de

reversión media de VX-ES
• Las monedas de "materias primas" como grupo ofrecen muchas oportunidades para la
cointegración.
• Al calcular los rendimientos de una cartera con dos tipos de cambio cruzados de
divisas, ¿prestó atención a si tienen la misma divisa cotizada, la misma divisa base o
ninguna? Las fórmulas para calcular los rendimientos no son las mismas para todos los
casos.
• Los rendimientos de futuros constan de dos componentes: rendimientos al contado y

rendimientos de rollo.
• Backwardation significa que los retornos de roll son positivos y los contratos lejanos
son más baratos que los contratos cercanos. Contango significa que los retornos de rollo son
TRADUCCIÓN 99
negativos y los contratos lejanos son más caros que los contratos cercanos.
• Debido a los rendimientos de rollo, la reversión media del precio de contado puede no
inducir la reversión media del precio de futuros.
• La reversión media de los diferenciales del calendario de futuros de los activos

negociados depende de la reversión media de los rendimientos de la lista.
PUNTOS CLAVE
Estrategias de impulso entre días
CAPÍTULO 6
Hay cuatro causas principales del impulso:
1. Para los futuros, la persistencia del rollo retorna, especialmente de sus signos. 2. La
lenta difusión, análisis y aceptación de nueva información.
3. Las ventas o compras forzosas de activos de diversos tipos de fondos. 4.

Manipulación del mercado por parte de comerciantes de alta frecuencia.
Discutiremos las estrategias comerciales que aprovechan cada causa del impulso en
este capítulo y en el siguiente. En particular, la rentabilidad de los futuros, que se destacó de
forma destacada en el último capítulo, volverá a ocupar un lugar central. Se pueden construir
innumerables estrategias de futuros a partir de la persistencia del signo de los retornos de la
tirada.
Los investigadores a veces clasifican el impulso de los precios de los activos en dos
tipos: el impulso de series de tiempo y el impulso transversal, tal como clasificamos la
reversión media en dos tipos correspondientes en el capítulo 2 (Moskowitz, Yao y Pedersen,
2010). El impulso de las series de tiempo es muy simple e intuitivo: los rendimientos pasados
de una serie de precios se correlacionan positivamente con los rendimientos futuros. El
impulso transversal se refiere al desempeño relativo de una serie de precios en relación con
otras series de precios: una serie de precios con rendimientos que superaron a otras series
de precios probablemente seguirá haciéndolo en el futuro y viceversa. Examinaremos
ejemplos de ambos tipos de impulso en futuros y acciones.
TRADUCCIÓN 100
Las estrategias que describo en este capítulo tienden a mantener posiciones durante
varios días, por lo que las llamo estrategias de impulso "entre días". Consideraré las
estrategias de impulso intradía de mayor frecuencia en el próximo capítulo. La razón de esta
distinción es que muchas estrategias de impulso interdiario adolecen de una debilidad
recientemente descubierta, mientras que las estrategias de impulso intradiario se ven menos
afectadas por ella. Destacaré esta debilidad en este capítulo y también discutiré las
propiedades muy diferentes de las estrategias de impulso frente a sus contrapartes de
reversión a la media, así como sus pros y contras.
■ Pruebas de impulso de series temporales

Antes de profundizar en las diferentes causas del impulso, primero deberíamos ver cómo
podemos medir el impulso, o más específicamente, el impulso de series de tiempo. El
impulso de la serie temporal de una serie de precios significa que los rendimientos pasados
se correlacionan positivamente con los rendimientos futuros. De ello se deduce que
podemos simplemente calcular el coeficiente de correlación de los rendimientos junto con su
valor p (que representa la probabilidad de la hipótesis nula de no correlación). Una
característica del cálculo del coeficiente de correlación es que tenemos que elegir un desfase
de tiempo específico para los rendimientos. A veces, las correlaciones más positivas se dan
entre rendimientos de diferentes rezagos. Por ejemplo, los rendimientos de 1 día pueden
mostrar correlaciones negativas, mientras que la correlación entre el rendimiento de los
últimos 20 días y el rendimiento futuro de 40 días puede ser muy positiva. Debemos
encontrar el par óptimo de períodos pasados y futuros que proporcionen la correlación
positiva más alta y usarlo como nuestro período retrospectivo y de espera para nuestra
estrategia de impulso.
Alternativamente, también podemos probar las correlaciones entre los signos de

rendimientos pasados y futuros. Esto es apropiado cuando todo lo que queremos saber es
que un movimiento hacia arriba será seguido por otro movimiento hacia arriba, y no nos
importa si las magnitudes de los movimientos son similares.
Si, en cambio, estamos interesados en averiguar si hay un comportamiento de tendencia

a largo plazo en la serie de tiempo sin tener en cuenta los marcos de tiempo específicos,
podemos calcular el exponente de Hurst junto con la prueba de la razón de varianza para
descartar la hipótesis nula de caminata aleatoria. . Estas pruebas se describieron en el
Capítulo 2 para la detección de reversión a la media, pero también pueden usarse como
pruebas de impulso. Ilustraré el uso de estas pruebas a continuación utilizando como
ejemplo la cotización futura de TU de bonos del Tesoro a dos años en la Bolsa Mercantil de
Chicago (CME). El coeficiente de correlación y su valor p se pueden calcular utilizando la
función de MATLAB corrcoef, mientras que el exponente de Hurst y la prueba de la relación
de varianza están, como antes, dados por genhurst y vratiotest.
TRADUCCIÓN 101
Al calcular las correlaciones de pares de rendimientos resultantes de diferentes períodos

retrospectivos y de mantenimiento, debemos tener cuidado de no utilizar datos
superpuestos. Si la retrospectiva es mayor que el período de tenencia, tenemos que avanzar
por el período de tenencia para generar un nuevo par de retornos. Si el período de tenencia es
mayor que el retroceso, tenemos que avanzar en el período retroactivo. Esto se ilustra en la
Figura 6.1.
Las dos barras superiores de la Figura 6.1 corresponden al caso en el que la

retrospectiva es mayor que el período de mantenimiento. La barra superior representa el
conjunto de datos que forma el primer par de retornos y la segunda barra desde la parte
superior representa el conjunto de datos que forma el segundo par de retornos
independientes. Las dos barras inferiores son para el caso en el que la vista atrás es más
pequeña que la explotación. El código se enumera a continuación (y está disponible para
descargar como TU_mom.m).
Si adelantamos los datos un día, obtendremos un conjunto de rendimientos ligeramente

diferente para calcular nuestras correlaciones. Para simplificar, solo he probado la
correlación de uno entre muchos conjuntos posibles de rendimientos, pero debido a la gran
superposición de datos entre dos conjuntos diferentes de rendimientos, es poco probable
que los resultados sean muy diferentes. Algunos de los resultados más significativos se
tabulan en la Tabla 6.1.
Vemos que hay un compromiso entre el coeficiente de correlación y el valor p. Los

siguientes pares (retrospectiva, de mantenimiento) ofrecen algunos de los mejores
compromisos: (60, 10), (60, 25), (250, 10), (250, 25), (250, 60), ( 250, 120). Por supuesto,
desde el punto de vista comercial, preferimos un período de tenencia lo más corto posible, ya
que tienden a generar los mejores índices de Sharpe.
En cambio, también he probado las correlaciones entre los signos de rendimientos

pasados y futuros, y los resultados no son muy diferentes de los de la tabla 6.1. Encontré que
las mejores parejas candidatas en ese caso son (60, 10), (250, 10) y (250, 25).
Por el contrario, encontramos que el exponente de Hurst es 0,44, mientras que la prueba
de la razón de varianza no rechazó la hipótesis de que se trata de una caminata aleatoria.
¿Cómo se concilian estos dos resultados contradictorios? Como mostramos en las

pruebas de correlación, esta serie de tiempo (como muchas otras series de tiempo
financieras) exhibe impulso y reversión media en diferentes marcos de tiempo. La prueba de
la razón de varianza no puede probar los períodos de tiempo específicos en los que las
correlaciones pueden ser más fuertes que el promedio.
TRADUCCIÓN 102
■ Estrategias de series de tiempo

Para un futuro determinado, si encontramos que el coeficiente de correlación entre un
rendimiento pasado de una cierta retrospectiva y un rendimiento futuro de un determinado
período de tenencia es alto, y el valor p es pequeño, podemos proceder a ver si Se puede
encontrar una estrategia de impulso rentable utilizando este conjunto de períodos de tiempo
óptimos.
Dado que la tabla 6.1 nos muestra que para TU, los pares de rendimientos de 250-25 días
tienen un coeficiente de correlación de 0.27 con un valor p de 0.02, elegiremos este período
retrospectivo y de retención. Tomamos nuestra señal para una estrategia de impulso de
series de tiempo simple de un artículo de Moskowitz, Yao y Pedersen: simplemente compre
(venda) el futuro si tiene un rendimiento positivo (negativo) de 12 meses y mantenga la
posición durante 1 mes ( Moskowitz, Yao y Pedersen, 2012). Modificaremos un detalle de la
estrategia original: en lugar de tomar una decisión comercial todos los meses, la haremos
todos los días, invirtiendo cada día solo una vigésima quinta parte del capital total.
Ejemplo 6.1: Estrategia TU Momentum

Este código asume que los precios de cierre están contenidos en una matriz T × 1 cl.
Este código está contenido en TU_mom.m. Desde el 1 de junio de 2004 hasta el 11 de mayo
de 2012, el índice de Sharpe es un respetable 1. La tasa de porcentaje anual (APR) de 1.7 por
ciento puede parecer baja, pero nuestro rendimiento se calcula en base al valor nocional del
contrato, que es alrededor de $ 200,000. El requisito de margen para este contrato es de solo
$ 400. Por lo tanto, ciertamente puede emplear una cantidad razonable de apalancamiento
para impulsar el rendimiento, aunque también debe lidiar con la reducción máxima del 2.5
por ciento. La curva de renta variable también parece bastante atractiva (véase el gráfico
6.2).
Esta simple estrategia se puede aplicar a todo tipo de contratos de futuros, con
diferentes períodos de retroceso óptimos y días de tenencia. Los resultados de los tres
futuros que consideramos se enumeran en la Tabla 6.2.
¿Por qué muchos rendimientos de futuros presentan correlaciones en serie? ¿Y por qué
estas correlaciones en serie ocurren solo en una escala de tiempo bastante larga? La
explicación radica en el componente de rendimiento de la renovación del rendimiento total de
los futuros que analizamos en el capítulo 5. Normalmente, el signo de los rendimientos de la
renovación no varía con mucha frecuencia. En otras palabras, los futuros se mantienen en
contango o backwardation durante largos períodos de tiempo. Sin embargo, los retornos
puntuales pueden variar muy rápidamente tanto en signo como en magnitud. Entonces, si
mantenemos un futuro durante un largo período de tiempo, y si los rendimientos promedio de
TRADUCCIÓN 103
los rollos dominan los rendimientos totales promedio, encontraremos una correlación en
serie de los rendimientos totales. Esta explicación ciertamente tiene sentido para BR, HG y
TU, ya que de la Tabla 5.1 podemos ver que todos tienen retornos de rollo que son mayores
en magnitud que sus retornos al contado. (No he encontrado la razón por la que no funciona
para C, a pesar de tener la mayor magnitud de retorno de rollo en comparación con su retorno
al contado promedio, ¡pero tal vez usted pueda!) Si aceptamos la explicación de que el
impulso de la serie temporal de los futuros se debe a la persistencia de los signos de los
retornos de rollo, entonces podemos diseñar una señal de impulso más limpia y
potencialmente mejor que el retorno total rezagado. En su lugar, podemos usar el retorno de
rollo retrasado como una señal, e ir en largo cuando este retorno es más alto que algún
umbral, ir en corto cuando este retorno es menor que el negativo de ese umbral y salir de
cualquier posición existente de lo contrario. La aplicación de esta estrategia revisada en TU
con un umbral de un rendimiento anualizado del 3 por ciento produce una APR más alta del
2.5 por ciento y un índice de Sharpe de 2.1 desde el 2 de enero de 2009 al 13 de agosto de
2012, con una reducción máxima reducida del 1.1 por ciento.
Hay muchas otras posibles señales de entrada además del simple indicador de "señal de
retorno". Por ejemplo, podemos comprar cuando el precio alcanza un nuevo máximo de N
días, cuando el precio excede el promedio móvil de N días o el promedio móvil exponencial,
cuando el precio excede la banda superior de Bollinger o cuando el número de días al alza
excede el número de días de inactividad en un período móvil.
También existe una estrategia de impulso clásica llamada Filtro Alexander, que nos dice
que compremos cuando el rendimiento diario suba al menos un x por ciento, y luego
vendamos y nos quedemos cortos si el precio baja al menos un x por ciento desde un
máximo posterior (Fama y Blume, 1966).
A veces, la combinación de reglas de cambio de media y de impulso puede funcionar

mejor que cada estrategia por sí misma. Un ejemplo de estrategia en CL es el siguiente:
compre al cierre del mercado si el precio es más bajo que el de hace 30 días y es más alto
que el de hace 40 días; viceversa para pantalones cortos. Si no se satisface ni la condición de
compra ni de venta, cambie cualquier posición existente. La TAE es del 12 por ciento, con una
proporción de Sharpe de 1,1. Agregar un filtro de reversión a la media a la estrategia de
impulso en el ejemplo 6.1 agregará IBX (MEFF), KT (NYMEX), SXF (DE), US (CBOT), CD (CME),
NG (NYMEX) y W (CME ) a la Tabla 6.2, y también mejorará los retornos y los ratios de Sharpe
de los contratos existentes en esa tabla.
De hecho, si no desea construir su propia estrategia de impulso de series de tiempo,

existe un índice listo para usar que se compone de 24 futuros: el indicador de tendencias
diversificadas (DTI) de Standard & Poor's (S&P). La estrategia esencial detrás de este índice
es que tendremos un futuro largo si está por encima de su promedio móvil exponencial, y
TRADUCCIÓN 104
corto si está por debajo, con reequilibrio mensual. (Para obtener más detalles, puede visitar
www.standardandpoors.com.) Existe un fondo mutuo (RYMFX) y un fondo cotizado en bolsa
(WDTI) que rastrea este índice. Michael Dever calculó que la relación de Sharpe de este
índice fue de 1,3 con una reducción máxima de -16,6 por ciento desde enero de 1988 a
diciembre de 2010 (Dever, 2011). (Esto puede compararse con el índice SPX del S&P 500, que
tiene una relación de Sharpe de 0,61 y una reducción máxima de -50,96 por ciento durante el
mismo período, según el autor). Sin embargo, al igual que muchas otras estrategias de
impulso, su rendimiento es pobre desde la crisis financiera de 2008, un punto que se
abordará más adelante.
Dado que no hay muchos intercambios en la cantidad relativamente limitada de datos de

prueba que usamos debido a los períodos de tenencia sustanciales, existe el riesgo de sesgo
de búsqueda de datos en estos resultados. La prueba real para la estrategia es, como
siempre, en las pruebas verdaderas fuera de la muestra.
■ Extracción de retornos de rollo a través de arbitraje futuro versus

arbitraje ETF
Si los retornos totales de los futuros = retornos al contado + retornos de rollo, entonces
una forma obvia de extraer el retorno de rollo es comprar el activo subyacente y vender los
futuros, si el retorno de rollo es negativo (es decir, bajo contango); y viceversa si el retorno de
la tirada es positivo (es decir, con backwardation). Esto funcionará siempre que el signo del
retorno del rollo no cambie rápidamente, como suele ocurrir. También es probable que esta
estrategia de arbitraje dé como resultado un período de tenencia más corto y un riesgo menor
que la estrategia de compra y retención discutida en la sección anterior, ya que en esa
estrategia necesitábamos mantener el futuro durante mucho tiempo antes del ruidoso
retorno al contado. se puede promediar. Sin embargo, la logística de comprar y,
especialmente, vender en corto el activo subyacente no es simple, a menos que exista un
fondo cotizado en bolsa (ETF) que tenga el activo. Estos ETF se pueden encontrar para
muchos metales preciosos. Por ejemplo, GLD en realidad posee oro físico y, por lo tanto,
sigue muy de cerca el precio al contado del oro. Los futuros del oro tienen un rendimiento
negativo de -4,9 por ciento anualizado desde diciembre de 1982 a mayo de 2004. Un backtest
muestra que mantener una posición larga en GLD y una posición corta en GC produce un
rendimiento anualizado del 1,9 por ciento y una reducción máxima del 0,8 por ciento de Del 3
de agosto de 2007 al 2 de agosto de 2010. Esto puede parecer atractivo, dado que se puede
aplicar un apalancamiento de 5 o 6 y obtener una rentabilidad decente con un riesgo
razonable, pero en realidad no lo es. Recuerde que, a diferencia de poseer futuros, poseer
GLD en realidad incurre en un costo de financiamiento, que no es muy diferente del 1.9 por
ciento durante el período de backtest. Entonces, el exceso de retorno de esta estrategia es
cercano a cero.
TRADUCCIÓN 105
(El lector astuto podría notar otra advertencia de nuestro backtest rápido de GC versus
GLD: los precios de liquidación o cierre de GC se registran a la 1:30 pm ET, mientras que los
de GLD se registran a las 4:00 pm ET. Esta asincronicidad es una escollo que mencioné en el
Capítulo 1. Sin embargo, no nos importa en este caso porque las señales comerciales se
generan basándose únicamente en los precios de cierre de GC).
Si intentamos buscar fuera de los ETF de metales preciosos para encontrar

oportunidades de arbitraje, estaremos perplejos. No hay ETF que contengan otras materias
primas físicas a diferencia de los futuros de materias primas, debido a los sustanciales
costos de almacenamiento de esas materias primas. Sin embargo, existe una forma de
arbitraje menos exacta que nos permite extraer los retornos del rollo. Los ETF que contienen
empresas productoras de materias primas a menudo se cointegran con el precio al contado
de esas materias primas, ya que estas materias primas forman una parte sustancial de sus
activos. Por lo tanto, podemos usar estos ETF como proxy del precio al contado y usarlos
para extraer los retornos de los futuros correspondientes.
Un buen ejemplo es el arbitraje entre el sector energético ETF XLE y los futuros de crudo
WTI CL. Dado que XLE y CL tienen diferentes horarios de cierre, es más fácil estudiar el
arbitraje entre XLE y ETF USO, que no contiene nada más que contratos de primer mes de CL.
La estrategia es simple: ■ USO corto y XLE largo siempre que CL esté en contango.
■ USO largo y XLE corto siempre que CL esté en backwardation. La APR es un muy
respetable 16 por ciento desde el 26 de abril de 2006 hasta el 9 de abril de 2012, con un
índice de Sharpe de aproximadamente 1. He trazado la curva de rendimiento acumulado en la
Figura 6.3.
FIGURA 6.3 Rendimientos acumulados del arbitraje XLE-USO

¿Qué pasa con un futuro cuyo subyacente no es una mercancía negociada? VX es un
ejemplo de tal futuro: es muy costoso mantener una canasta de opciones que replican el
índice VIX subyacente, y ningún patrocinador de ETF ha sido tan tonto como para hacer eso.
Pero, nuevamente, no necesitamos encontrar un instrumento que rastree exactamente el
precio al contado, solo necesitamos encontrar uno que tenga una alta correlación (o anti-
correlación) con el retorno al contado. En el caso de VIX, el conocido ETF SPY encaja
perfectamente. Debido a que el S&P E-mini future ES tiene un rendimiento de rollo
insignificante (alrededor del 1 por ciento anualizado), tiene casi los mismos rendimientos que
el activo subyacente. Debido a que ciertamente es más fácil negociar futuros que un ETF,
investigaremos el desempeño de nuestra estrategia de arbitraje anterior utilizando ES en su
lugar.
TRADUCCIÓN 106
Futuros de volatilidad versus futuros de índices de acciones: Redux

VX es una elección natural si queremos extraer retornos de rollo: sus retornos de rollo
pueden ser tan bajos como -50 por ciento anualizado. Al mismo tiempo, está altamente
anticorrelacionado con ES, con un coeficiente de correlación de rendimientos diarios que
alcanza el -75 por ciento. En el Capítulo 5, usamos la cointegración entre VX y ES para
desarrollar una estrategia de reversión de la media de la rentabilidad. Aquí, utilizaremos la
magnitud de retorno de rollo grande de VX, la magnitud de retorno de rollo pequeño de ES y la
anticorrelación de VX y ES para desarrollar una estrategia de impulso. Esta estrategia fue
propuesta por Simon y Campasano (2012):
1. Si el precio del contrato inicial de VX es más alto que el del VIX en 0,1 punto
(contango) multiplicado por el número de días de negociación hasta la liquidación, los
contratos iniciales cortos 0,3906 de VX y el contrato inicial corto 1 de ES. Sostenga por un
día. 2. Si el precio del contrato anticipado de VX es menor que el de VIX en 0.1 puntos
(backwardation) multiplicado por el número de días de negociación hasta la liquidación,
compre 0.3906 contratos anticipados de VX y compre 1 contrato anticipado de ES. Sostenga
por un día.
Recuerde que si el precio del contrato inicial es más alto que el precio al contado, el
rendimiento del rollo es negativo (consulte la Figura 5.3). Por lo tanto, la diferencia de precio
entre VIX y VX dividida por el tiempo hasta el vencimiento es el retorno de rollo, y compramos
VX si el retorno de rollo es positivo. ¿Por qué no usamos el procedimiento del ejemplo 5.3,
donde usamos la pendiente de la curva de avance del logaritmo de futuros para calcular el
rendimiento del rollo aquí? Esto se debe a que la Ecuación 5.7 no funciona para VX y, por lo
tanto, los precios a plazo de VX no caen en línea recta, como se explica en el Capítulo 5.
Observe que el índice de cobertura de esta estrategia es ligeramente diferente del

informado por Simon y Campasano: se basa en el ajuste de regresión entre los precios VX
versus ES en la Ecuación 5.11, no entre sus rendimientos como en el artículo original. La
liquidación es el día posterior a la expiración de los contratos. La APR del 29 de julio de 2010
al 7 de mayo de 2012 (este período no se usó para la determinación del índice de cobertura)
es del 6.9 por ciento, con un índice de Sharpe de 1. El gráfico de rendimiento acumulado se
muestra en la Figura 6.4. Puede encontrar el código MATLAB para esta estrategia en
VX_ES_rollreturn.m en mi sitio web.
■ Estrategias transversales
Existe una tercera forma de extraer los grandes rendimientos de los futuros, además de
comprar y mantener o arbitrar contra el activo subyacente (o contra un instrumento
correlacionado con el activo subyacente). Esta tercera forma es una estrategia transversal:
TRADUCCIÓN 107
podemos simplemente comprar una cartera de futuros en backwardation y,

simultáneamente, vender una cartera de futuros en contango. La esperanza es que los
rendimientos de los precios al contado se cancelen entre sí (una expectativa razonable si
creemos que los precios al contado de las materias primas están correlacionados
positivamente con el crecimiento económico o con algunos otros índices
macroeconómicos), y nos quedamos con los rendimientos favorables. Daniel y Moskowitz
describieron una estrategia de impulso "transversal" tan simple que es casi una imagen
especular del modelo lineal largo-corto con reversión de la media propuesto por Khandani y
Lo descrito en el Capítulo 3, aunque uno con una mirada mucho más larga. período de
retroceso y mantenimiento (Daniel y Moskowitz, 2011).
FIGURA 6.4 Rendimientos acumulados de la estrategia VX-ES Roll

Returns
Una versión simplificada de la estrategia es clasificar el rendimiento de 12 meses (o 252
días de negociación en nuestro programa a continuación) de un grupo de 52 materias primas
físicas todos los días, y comprar y mantener el futuro con el rendimiento más alto durante 1
mes (o 25 días de negociación) mientras sea corto y mantenga el futuro con el rendimiento
más bajo para el mismo período. Probé esta estrategia desde el 1 de junio de 2005 hasta el
31 de diciembre de 2007, y el APR es un excelente 18 por ciento con un índice de Sharpe de
1,37. Los rendimientos acumulados se grafican en la Figura 6.5. Lamentablemente, este
modelo tuvo un desempeño muy negativo desde el 2 de enero de 2008 hasta el 31 de
diciembre de 2009, con una APR de -33 por ciento, aunque su desempeño se recuperó
posteriormente. La crisis financiera de 2008-2009 arruinó esta estrategia de impulso, al igual
que lo hizo con muchas otras, incluido el indicador S&P DTI mencionado anteriormente.
Daniel y Moskowitz también han descubierto que esta misma estrategia funcionó para el
universo de índices bursátiles mundiales, divisas, acciones internacionales y acciones
estadounidenses; en otras palabras, prácticamente todo lo que hay bajo el sol. Obviamente,
el impulso transversal en divisas y acciones ya no puede explicarse por la persistencia del
signo de retornos de rollo. Podríamos atribuir eso a la correlación serial en la economía
mundial o al crecimiento de la tasa de interés en el caso de la moneda, y a la lenta difusión,
análisis y aceptación de nueva información en el caso de las acciones.
Al aplicar esta estrategia a las acciones de EE. UU., Podemos comprar y mantener
acciones dentro del decil superior de rendimientos rezagados de 12 meses durante un mes, y
viceversa para el decil inferior. Ilustraré la estrategia en el ejemplo 6.2. La TAE desde el 15 de
mayo de 2007 hasta el 31 de diciembre de 2007 es del 37 por ciento con un índice de Sharpe
de 4,1. Los rendimientos acumulados se muestran en la Figura 6.6. (Daniel y Moskowitz
encontraron un rendimiento promedio anualizado de 16.7 por ciento y un índice de Sharpe de
TRADUCCIÓN 108
0.83 de 1947 a 2007). Sin embargo, la APR del 2 de enero de 2008 al 31 de diciembre de
2009 es un miserable -30 por ciento. La crisis financiera de 2008-2009 también arruinó esta
estrategia de impulso. El retorno después de 2009 se estabilizó, aunque todavía no ha vuelto
a su nivel anterior.
Al igual que en el caso de la estrategia de reversión a la media transversal analizada en el

capítulo 4, en lugar de clasificar las acciones por sus rendimientos rezagados, podemos
clasificarlas por muchas otras variables o "factores", como se les suele llamar. Mientras
escribimos rendimiento total = rendimiento al contado + rendimiento de rollo para futuros,
podemos escribir rendimiento total = rendimiento de mercado + rendimiento de factores para
acciones. Una cartera transversal de acciones, ya sea con reversión media o basada en el
impulso, eliminará el componente de rendimiento del mercado y sus rendimientos serán
impulsados únicamente por los factores. Estos factores pueden ser fundamentales, como el
crecimiento de las ganancias o la relación valor contable-precio, o alguna combinación lineal
de los mismos. O pueden ser factores estadísticos que se derivan, por ejemplo, del análisis
de componentes principales (PCA) como se describe en el comercio cuantitativo (Chan,
2009). Todos estos factores, con la posible excepción del PCA, tienden a cambiar
lentamente, por lo que su uso para clasificar las acciones dará como resultado períodos de
tenencia tan largos como los modelos transversales que analicé en esta sección.
Si bien estamos en el tema de los factores, vale la pena mencionar que un modelo de
factores también se puede aplicar a una cartera transversal de futuros. En este caso,
podemos encontrar factores macroeconómicos como el crecimiento del producto interno
bruto (PIB) o la tasa de inflación y correlacionarlos con los rendimientos de cada instrumento
de futuros, o podemos emplear nuevamente el PCA.
En los últimos años, con el avance del procesamiento del lenguaje natural por
computadora y la capacidad de comprensión, hay otro factor que se ha puesto en uso. Este
es el llamado puntaje de sentimiento de noticias, nuestro próximo tema.
El sentimiento periodístico como factor fundamental

Con el advenimiento de las fuentes de noticias legibles por máquina, o "con elementos",
ahora es posible capturar de manera programática todas las noticias de una empresa, no
solo aquellas que encajan perfectamente en una de las categorías estrechas, como anuncios
de ganancias o fusiones y actividades de adquisición (M&A). Además, los algoritmos de
procesamiento del lenguaje natural ahora son lo suficientemente avanzados como para
analizar la información textual contenida en estas noticias y asignar un "puntaje de
sentimiento" a cada artículo de noticias que sea indicativo de su impacto en el precio de una
acción, y una agregación de estos puntajes de sentimiento. a partir de múltiples artículos de
noticias de un período determinado, se encontró que era predictivo de su retorno futuro. Por
TRADUCCIÓN 109
ejemplo, Hafez y Xie, utilizando el índice de sentimiento de RavenPack, encontraron que

comprar una cartera de acciones con un cambio de sentimiento positivo y acortar una con un
cambio de sentimiento negativo da como resultado una APR del 52% al 156% y ratios de
Sharpe del 3,9 al 5,3 antes de los costos de transacción. , dependiendo de cuántas acciones
se incluyan en las carteras (Hafez y Xie, 2012). El éxito de estas estrategias transversales
también demuestra muy claramente que la lenta difusión de las noticias es la causa del
impulso de las acciones.
Hay otros proveedores además de RavenPack que brindan opiniones sobre las acciones.
Los ejemplos incluyen Recorded Future, thestocksonar.com y Thomson Reuters News
Analytics. Se diferencian en el alcance de su cobertura de noticias y también en el algoritmo
que utilizan para generar la puntuación de sentimiento. Si cree que su propio algoritmo de
sentimiento es mejor que el de ellos, puede suscribirse directamente a una fuente de noticias
con elementos y aplicarle su algoritmo. Mencioné antes que Newsware ofrece una versión de
bajo costo de este tipo de feeds de noticias, pero Bloomberg Event-Driven Trading, Dow
Jones Elementized News Feeds y Thomson Reuters Machine Readable News proporcionan
ofertas con menor latencia y mejor cobertura.
Más allá de un uso tan razonable del sentimiento de las noticias como un factor para el
intercambio de impulso transversal, también ha habido investigaciones que sugirieron que el
"estado de ánimo" general de la sociedad, tal como se revela en el contenido de los feeds de
Twitter, predice el índice del mercado en sí (Bollen, Mao, y Zeng, 2010). De hecho, se lanzó un
fondo de cobertura multimillonario para implementar esta idea extravagante (Bryant, 2010),
aunque la validez de la investigación en sí fue atacada (Buy the Hype, 2012).
Venta de activos de fondos mutuos y compras forzosas

Los investigadores Coval y Staff ord (2007) encontraron que es probable que los fondos
mutuos que experimentan grandes reembolsos reduzcan o eliminen sus posiciones de
acciones existentes. Esto no es ninguna sorpresa, ya que los fondos mutuos suelen estar
casi completamente invertidos, con muy pocas reservas de efectivo. Más interesante aún, los
fondos que experimentan grandes flujos de capital tienden a aumentar sus posiciones en
acciones existentes en lugar de utilizar el capital adicional para invertir en otras acciones, tal
vez porque las nuevas ideas de inversión no surgen fácilmente. Las acciones mantenidas de
manera desproporcionada por fondos mutuos de bajo rendimiento que enfrentan
reembolsos, por lo tanto, experimentan rendimientos negativos. Además, esta "venta
inmediata" de activos por parte de fondos mutuos de bajo rendimiento es contagiosa. Dado
que la venta de incendios deprime los precios de las acciones, también suprimen el
rendimiento de otros fondos que tienen esas acciones, lo que provoca más reembolsos en
esos fondos. La misma situación ocurre a la inversa para las acciones que poseen de manera
desproporcionada fondos mutuos de excelente desempeño con grandes flujos de capital.
TRADUCCIÓN 110
Por lo tanto, se puede activar el impulso en ambas direcciones para las acciones de
propiedad común.
(Esta ignición del impulso de los precios debido al flujo de pedidos es en realidad un
fenómeno bastante general, y ocurre incluso en la escala de tiempo más corta. Encontramos
más detalles sobre eso en el contexto del comercio de alta frecuencia en el Capítulo 7.)
Se puede construir un factor para medir la presión de venta (compra) sobre una acción
en función del porcentaje neto de fondos que las poseen y que experimentaron reembolsos
(entradas). Más precisamente,
donde PRESIÓN (i, t) es el factor para la acción i al final del trimestre t, Compra (j, i, t) = 1
si el fondo j aumentó su participación en la acción i durante el trimestre t y si el fondo
experimentó entradas superior al 5 por ciento de su valor liquidativo (NAV) ("fl ujo (j, t)> 5%"),
y cero en caso contrario. Sell (j, i, t) se define de manera similar para las disminuciones en las
tenencias, y ∑ j Own (j, i, t - 1) es el número total de fondos mutuos que tienen acciones i al
comienzo del trimestre t. Tenga en cuenta que la variable PRESIÓN no tiene en cuenta el
tamaño (NAV) del fondo, ya que Comprar es una variable binaria. Uno se pregunta si sopesar
Buy by NAV dará mejores resultados.
Coval y Staff ord encontraron que una cartera de mercado neutral formada en base a
acciones en corto con la presión de venta más alta (decil inferior de la clasificación de
PRESIÓN) y la compra de acciones con la presión de compra más alta (decil superior de la
clasificación de PRESIÓN) genera retornos anualizados de alrededor del 17 por ciento antes.
costos de transacción. (Dado que los datos sobre tenencias de acciones están disponibles
generalmente solo trimestralmente, nuestra cartera también se actualiza trimestralmente).
Además, los flujos de capital que entran y salen de los fondos mutuos se pueden predecir
con buena precisión en función de su desempeño pasado y los flujos de capital. , un reflejo
del comportamiento gregario de los inversores minoristas. Con base en esta predicción,
también podemos predecir el valor futuro del factor de presión mencionado anteriormente.
En otras palabras, podemos administrar los fondos mutuos en nuestra venta (compra) de las
acciones que poseen actualmente. Esta estrategia de ejecución inicial genera otro
rendimiento anualizado del 17 por ciento antes de los costos de transacción.
Finalmente, dado que estas acciones experimentan tales presiones de compra y venta
debido a razones impulsadas por la liquidez, y sufren la supresión o elevación de sus precios
sin culpa o mérito propio, los precios de sus acciones a menudo se revierten después de la
venta o compra del fondo mutuo. la presión ha terminado. De hecho, la compra de acciones
que experimentaron la mayor presión de venta en los trimestres t - 4 hasta t - 1, y viceversa,
genera otro 7 por ciento de rendimientos anualizados.
TRADUCCIÓN 111
La combinación de las tres estrategias (impulso, ejecución inicial y reversión a la media)

genera un rendimiento total de alrededor del 41 por ciento antes de los costos de
transacción. Sin embargo, es probable que el componente de deslizamiento de los costos de
transacción sea significativo porque es posible que experimentemos retrasos en la obtención
de información sobre las tenencias de fondos mutuos al final de un trimestre. Además, la
implementación de esta estrategia no es para los pusilánimes: los datos de tenencias
mutuas y devoluciones limpios y precisos deben comprarse al Centro de Investigación en
Precios de Seguridad (CRSP) a un costo de alrededor de $ 10,000 por año de datos.
Los fondos mutuos no son el único tipo de fondos que pueden generar un impulso en las
acciones debido a las compras y ventas forzadas de activos. En el Capítulo 7, descubriremos
que los fondos indexados y los ETF apalancados también generan un impulso similar. De
hecho, las ventas y compras forzadas de activos por parte de los fondos de cobertura
también pueden generar un impulso en las acciones, y eso provocó el colapso de los fondos
cuantitativos en agosto de 2007, como explico en el Capítulo 8.
■ Pros y contras de las estrategias de impulso

Las estrategias de impulso, especialmente las estrategias de impulso entre días, a
menudo tienen características de riesgo y recompensa diametralmente opuestas en
comparación con las estrategias de inversión media. Compararemos sus pros y contras en
esta sección.
Empecemos por las desventajas. En mi propia experiencia comercial, a menudo he

descubierto que es más difícil crear estrategias de impulso rentables, y aquellas que son
rentables tienden a tener ratios de Sharpe más bajos que las estrategias de inversión media.
Hay dos razones para esto.
En primer lugar, como hemos visto hasta ahora, muchas estrategias de impulso
establecidas tienen períodos de espera y de retroceso prolongados. Así que, claramente, el
número de señales comerciales independientes es escaso y distante entre sí. (Podemos
reequilibrar una cartera de impulso todos los días, pero eso no hace que las señales de
negociación sean más independientes). Menos señales de negociación conducen
naturalmente a una relación de Sharpe más baja. Ejemplo: El modelo de reversión de la media
lineal para las acciones del S&P 500 descrito en el Capítulo 4 se basa en las propiedades de
reversión de la media transversal a corto plazo de las acciones, y el período de tenencia es
inferior a un día. Tiene una alta relación de Sharpe de 4,7. Para el mismo universo de
acciones, la estrategia de impulso transversal opuesta descrita anteriormente en este
capítulo tiene un período de retención de 25 días, y aunque tuvo un desempeño similar antes
de 2008, el desempeño colapsó durante los años de crisis financiera.
TRADUCCIÓN 112
En segundo lugar, la investigación de Daniel y Moskowitz sobre las "caídas de impulso"

indica que las estrategias de impulso para futuros o acciones tienden a comportarse
miserablemente durante varios años después de una crisis financiera (Daniel y Moskowitz,
2011). Podemos verlo fácilmente en una gráfica del índice S&P DTI (Figura 6.7). Al momento
de escribir este artículo, ha sufrido una reducción del -25,9 por ciento desde el 5 de diciembre
de 2008. De manera similar, el impulso transversal en las acciones también desapareció
durante las secuelas de la caída del mercado de valores en 2008-2009, y es reemplazado por
una fuerte media reversión. Todavía no sabemos cuánto durará este régimen de reversión a
la media: después de la caída del mercado de valores de 1929, una estrategia de impulso
representativo no volvió a su nivel máximo durante más de 30 años. La causa de esta caída
se debe principalmente al fuerte repunte de las posiciones cortas tras una crisis del mercado.
En tercer lugar, y esto se relaciona principalmente con el impulso a corto plazo

impulsado por las noticias del que hablaremos en el próximo capítulo, la duración durante la
cual el impulso permanece en vigor se acorta progresivamente a medida que más
operadores se dan cuenta. Por ejemplo, el impulso de los precios impulsado por los anuncios
de ganancias solía durar varios días. Ahora dura apenas hasta que cierra el mercado. Esto es
bastante comprensible si consideramos que el impulso de los precios es generado por la
lenta difusión de información. A medida que más comerciantes aprenden sobre la
información más rápido y antes, la difusión, y por lo tanto, el impulso, también termina antes.
Por supuesto, esto crea un problema para el comerciante de impulso, ya que es posible que
tengamos que acortar constantemente nuestro período de tenencia, pero no hay un
calendario predecible para hacerlo.
Para que no piense que deberíamos renunciar a las estrategias de impulso, echemos un
vistazo a la lista de ventajas de las estrategias de impulso. Estas listas suelen comenzar con
la facilidad de gestión de riesgos. Para ver por qué, observamos que hay dos tipos comunes
de estrategias de salida para las estrategias de impulso: basadas en el tiempo y stop loss.
Todas las estrategias de impulso que he discutido hasta ahora involucran solo salidas
basadas en el tiempo. Especificamos un período de tenencia y salimos de una posición
cuando alcanzamos ese período de tenencia. Pero también podemos imponer un stop loss
como condición de salida, o tal vez como condición de salida adicional. Los Stop Loss son
perfectamente consistentes con las estrategias de impulso. Si el impulso ha cambiado de
dirección, deberíamos entrar en la posición opuesta. Dado que la posición original habría
estado perdiendo, y ahora la hemos salido, esta nueva señal de entrada sirvió efectivamente
como un stop loss. Por el contrario, los stop loss no son consistentes con las estrategias de
reversión de la media, porque contradicen las señales de entrada de las estrategias de
reversión de la media. (Este punto se abordará nuevamente en el Capítulo 8.) Debido a una
salida basada en el tiempo o un stop loss, la pérdida de una posición de impulso siempre es
limitada. Por el contrario, podemos incurrir en una enorme reducción con una sola posición
debido a una estrategia de reversión a la media. (¡Esto no quiere decir que la pérdida
TRADUCCIÓN 113
acumulada de posiciones perdedoras sucesivas debido a una estrategia de impulso no nos

lleve a la bancarrota!) Las estrategias de impulso no solo sobreviven bien a los riesgos, sino
que pueden prosperar en ellos (aunque hemos visto lo mal que lo hicieron en las secuelas de
eventos de riesgo). Para las estrategias de reversión de la media, su ventaja está limitada por
su límite de beneficio natural (establecido como la "media" a la que se revierten los precios),
pero su desventaja puede ser ilimitada. Para las estrategias de impulso, su ventaja es
ilimitada (a menos que uno imponga arbitrariamente un límite de ganancias, lo cual no es
aconsejable), mientras que su desventaja es limitada. Cuanto más a menudo ocurren los
eventos de "cisne negro", es más probable que una estrategia de impulso se beneficie de
ellos. Cuanto más gruesas sean las colas de la curva de distribución de retornos, o cuanto
mayor sea su curtosis, mejor será el mercado para las estrategias de impulso. (¿Recuerda la
simulación del ejemplo 1.1? Simulamos una serie de rendimientos con la misma curtosis que
la serie de futuros para TU pero sin autocorrelaciones seriales. Descubrimos que aún puede
generar los mismos rendimientos que nuestra estrategia de impulso TU en el 12 por ciento
de las ¡Realizaciones!) Por último, dado que la mayoría de los futuros y las divisas muestran
impulso, las estrategias de impulso nos permiten diversificar verdaderamente nuestros
riesgos entre diferentes clases de activos y países. Agregar estrategias de impulso a una
cartera de estrategias de reversión de la media nos permite lograr índices de Sharpe más
altos y reducciones más pequeñas que cualquier tipo de estrategia por sí solo.
• El impulso de las series de tiempo se refiere a la correlación positiva de los

rendimientos pasados y futuros de una serie de precios.
• El impulso transversal se refiere a la correlación positiva de los rendimientos relativos

pasados y futuros de una serie de precios, en relación con la de otras series de precios en
una cartera.
• Los futuros exhiben un impulso de series de tiempo principalmente debido a la

persistencia del signo de retornos de rollo.
• Si puede encontrar un instrumento (por ejemplo, un ETF u otro futuro) que cointegra o
se correlaciona con el precio de contado o el rendimiento de un producto básico, puede
extraer el rendimiento de rollo del futuro del producto básico colocando en corto ese
instrumento durante el backwardation, o comprando ese instrumento durante el contango.
• Las carteras de futuros o acciones a menudo exhiben un impulso transversal: un

algoritmo de clasificación simple basado en rendimientos funcionaría.
• Las estrategias de rentabilidad sobre el impulso del sentimiento de las noticias

muestran que la lenta difusión de las noticias es una causa del impulso del precio de las
acciones.
TRADUCCIÓN 114
• El contagio de las ventas y compras forzosas de activos entre fondos mutuos

contribuye al impulso del precio de las acciones.
• Los modelos Momentum prosperan en eventos de "cisne negro" y la curtosis positiva

de la curva de distribución de retornos.
Estrategias de impulso intradía
CAPÍTULO 7
En el capítulo anterior vimos que la mayoría de los instrumentos, ya sean acciones o
futuros, exhiben un impulso transversal y, a menudo, también un impulso de series de
tiempo. Desafortunadamente, el horizonte temporal de este comportamiento de impulso
tiende a ser largo, típicamente un mes o más. Los períodos de tenencia prolongados
presentan dos problemas: dan como resultado índices de Sharpe más bajos y significancia
estadística de backtest debido a las infrecuentes señales de negociación independientes, y
sufren un rendimiento deficiente como consecuencia de las crisis financieras. En este
capítulo, describimos estrategias de impulso intradiario a corto plazo que no sufren estos
inconvenientes.
Anteriormente enumeramos cuatro causas principales del impulso. Veremos que todos
menos uno de ellos también operan en el marco de tiempo intradiario. (La única excepción es
la persistencia del retorno de la inversión, ya que su magnitud y volatilidad son demasiado
pequeñas para ser relevantes intradía).
Hay una causa adicional de impulso que se aplica principalmente al corto período de
tiempo: la activación de paradas. Estos factores desencadenantes a menudo conducen a las
llamadas estrategias de ruptura. Veremos un ejemplo que involucra una entrada en el
mercado abierto y otro que involucra una entrada intradía en varios niveles de soporte o
resistencia.
El impulso intradía puede desencadenarse por eventos específicos más allá de las
acciones del precio. Estos eventos incluyen noticias corporativas, como anuncios de
ganancias o cambios en las recomendaciones de los analistas, así como noticias
macroeconómicas. Se sabe desde hace mucho tiempo que estos eventos generan un
impulso de series de tiempo, pero presento algunas investigaciones nuevas sobre los efectos
de cada categoría específica de eventos.
El impulso intradiario también puede ser provocado por las acciones de grandes fondos.
TRADUCCIÓN 115
Examino cómo el reequilibrio diario de los ETF apalancados conduce a un impulso a corto
plazo.
Por último, en la escala de tiempo más corta posible, el desequilibrio de los tamaños de
oferta y demanda, los cambios en el flujo de pedidos o la distribución no uniforme de las
órdenes de suspensión antes mencionada pueden inducir un impulso en los precios. En este
capítulo se presentarán algunas de las tácticas comerciales comunes de alta frecuencia que
aprovechan ese impulso.
■ Estrategia de apertura de brecha

En el capítulo 4, analizamos una estrategia de compra en brecha con reversión a la
media para las acciones. La estrategia de impulso opuesta a veces funcionará en futuros y
divisas: comprar cuando el instrumento se abre y vender en corto cuando se abre.
Después de ser probada en varios futuros, esta estrategia demostró funcionar mejor en
la negociación de futuros del índice Dow Jones STOXX 50 (FSTX) en Eurex, que genera una
tasa de porcentaje anual (APR) del 13 por ciento y un índice de Sharpe de 1.4 a partir de julio.
16 de 2004 al 17 de mayo de 2012. El ejemplo 7.1 muestra el código de impulso de la brecha
(disponible para descargar como gapFutures_FSTX.m). La curva de equidad se muestra en la
Figura 7.1.
La misma estrategia también funciona en algunas monedas. Sin embargo, la "apertura" y

el "cierre" diarios deben definirse de manera diferente. Si definimos el cierre a las 5:00 p.m.
ET, y la apertura será a las 5:00 am ET (correspondiente a la apertura de Londres), luego, al
aplicar esta estrategia al GBPUSD se obtiene una APR de 7.2 por ciento y un índice de Sharpe
de 1.3 desde el 23 de julio de 2007 hasta el 20 de febrero de 2012. Naturalmente, puede
experimentar con diferentes definiciones de horarios de apertura y cierre para diferentes
monedas. La mayoría de los mercados de divisas están cerrados a partir de las 5:00 p.m. el
viernes a las 5:00 p.m. el domingo, por lo que es una "brecha" natural para estas estrategias.
¿Qué tiene de especial la brecha durante la noche o el fin de semana que a veces
desencadena el impulso? El período prolongado sin negociación significa que el precio de
apertura suele ser bastante diferente del precio de cierre. Por lo tanto, las órdenes stop
establecidas a diferentes precios pueden activarse todas a la vez en la apertura. La ejecución
de estas órdenes stop a menudo conduce a un impulso porque un efecto en cascada
también puede desencadenar órdenes stop colocadas más lejos del precio de apertura.
Alternativamente, puede haber eventos importantes que ocurrieron durante la noche. Como
se analiza en la siguiente sección, muchos tipos de eventos noticiosos generan impulso.
TRADUCCIÓN 116
■ Estrategia de impulso impulsada por las noticias

Si, como mucha gente cree, el impulso es impulsado por la lenta difusión de las noticias,
seguramente podemos beneficiarnos de los primeros días, horas o incluso segundos
después de un evento de interés periodístico. Ésta es la razón fundamental detrás de los
beneficios tradicionales posteriores a las ganancias.
Deriva del anuncio posterior a las ganancias

No es de extrañar que un anuncio de ganancias mueva el precio de las acciones. Sin
embargo, es sorprendente que este movimiento persista durante algún tiempo después del
anuncio, y en la misma dirección, permitiendo que los operadores de impulso se beneficien.
Aún más sorprendente es que, aunque este hecho se conoce y se estudia desde 1968
(Bernard y Thomas, 1989), el efecto aún no se ha eliminado por arbitraje, aunque la duración
de la deriva puede haberse acortado. Lo que mostraré en esta sección es que en 2011 esta
estrategia sigue siendo rentable si entramos en la apertura del mercado después del anuncio
de ganancias después del cierre anterior, comprando la acción si el rendimiento es muy
positivo y corto si el rendimiento. es muy negativo y liquida la posición al cierre del mismo
día. Tenga en cuenta que esta estrategia no requiere que el operador interprete si el anuncio
de ganancias es "bueno" o "malo". Ni siquiera requiere que el comerciante sepa si las
ganancias están por encima o por debajo de las expectativas de los analistas. Dejamos que
el mercado nos diga si cree que las ganancias son buenas o malas.
Antes de realizar una prueba retrospectiva de esta estrategia, es necesario tener datos
históricos de los tiempos de los anuncios de ganancias. Puede usar la función parseEarnings
CalendarFromEarningsDotcom.m que se muestra en el cuadro para recuperar
aproximadamente un año de dichos datos de ganancias.com dado un determinado universo
de valores especificado por la matriz de símbolos de valores allsyms. La característica
importante de este programa es que selecciona cuidadosamente solo los anuncios de
ganancias que ocurren después del cierre del mercado del día de negociación anterior y antes
de la apertura del mercado de hoy. Los anuncios de ganancias que se produzcan en otros
momentos no deberían desencadenar nuestras operaciones de entrada, ya que se producen
en la apertura del mercado de hoy.
RECUADRO 7.1
Función para recuperar el calendario de ganancias de

ganancias.com
TRADUCCIÓN 117
Esta función toma una matriz de celdas de símbolos de acciones 1xN de entrada allsyms
y crea una matriz lógica N earnann 1 × N, que nos dice si (con valores verdaderos o falsos) la
acción correspondiente tiene un anuncio de ganancias después de las 4:00 p.m. del día
anterior. ET (hora de cierre del mercado de EE. UU.) Y antes de las 9:30 a.m. de hoy. ET (hora
de apertura del mercado de EE. UU.). Las entradas prevDate y todayDate deben estar en
formato aaaammdd. Necesitamos llamar a este programa para cada día en el backtest de la
estrategia PEAD. A continuación, podemos concatenar las matrices 1 × N earnann
resultantes en N una gran matriz histórica T × N earnann para los N T días en la prueba
retrospectiva. T Suponiendo que hemos compilado la matriz lógica del anuncio histórico de
ganancias, ya sea usando nuestra función anterior o por otros medios, el programa real de
backtest para la estrategia PEAD es muy simple, como se muestra en el Ejemplo 7.2. Solo
necesitamos calcular la desviación estándar móvil de 90 días de la rentabilidad abierta del
día anterior al cierre del día siguiente como punto de referencia para decidir si el anuncio es lo
suficientemente "sorprendente" como para generar la deriva posterior al anuncio.
Ejemplo 7.2: Prueba retrospectiva de la estrategia de deriva del

anuncio posterior a las ganancias
Suponemos que los precios históricos de apertura y cierre se almacenan en las matrices
T × N N op y cl. La matriz lógica de entrada T × N N earnann indica si hay un anuncio de
ganancias para una acción en un día determinado antes de la apertura del mercado de ese
día, pero después del cierre del mercado del día de negociación anterior. Las funciones de
utilidad backshift, smartMovingStd y Para un universo de acciones del S&P 500, la APR desde
el 3 de enero de 2011 hasta el 24 de abril de 2012 es del 6,7 por ciento, mientras que el índice
de Sharpe es un muy respetable 1,5. La curva de rentabilidad acumulada se muestra en la
Figura 7.2. Tenga en cuenta que hemos utilizado 30 como denominador para calcular los
rendimientos, ya que hay un máximo de 30 posiciones en un día durante ese período de
backtest. Por supuesto, existe un cierto grado de sesgo de anticipación al usar este número,
ya que no sabemos exactamente cuál será el máximo. Pero dado que el número máximo de
anuncios por día es bastante predecible, este no es un sesgo muy grave. Dado que se trata
de una estrategia intradía, es posible aumentarla al menos cuatro veces, lo que arroja un
rendimiento promedio anualizado cercano al 27 por ciento.
Quizás se pregunte si mantener estas posiciones durante la noche generará beneficios

adicionales. La respuesta es no: los rendimientos nocturnos son negativos en promedio. Por
el contrario, muchos resultados publicados de hace 10 o 20 años han demostrado que el
PEAD duró más de un día. Este puede ser un ejemplo en el que la duración del impulso se
acorta debido a una mayor conciencia de la existencia de dicho impulso. Queda por probar si
un período de tenencia aún más corto puede generar mejores rendimientos.
TRADUCCIÓN 118
Deriva debido a otros eventos

Además de los anuncios de ganancias, hay otros eventos corporativos que pueden
mostrar una desviación posterior al anuncio: una lista incompleta incluye orientación de
ganancias, calificaciones de analistas y cambios de recomendación, ventas en la misma
tienda y factores de ocupación de las aerolíneas. (Un proveedor diario razonable de tales
datos es el cable de noticias Dow Jones entregado por Newsware porque tiene el código
específico para el tipo de evento adjunto a cada historia y es legible por máquina). En teoría,
cualquier anuncio que provoque una reevaluación de la feria El valor de mercado de una
empresa debería inducir un cambio en el precio de sus acciones hacia un nuevo precio de
equilibrio. (Para un estudio exhaustivo reciente de todos estos eventos y su impacto en los
rendimientos posteriores al evento de las acciones, consulte Hafez, 2011). Entre estos
eventos, las fusiones y adquisiciones, por supuesto, llaman la atención de los fondos de
cobertura especializados que poseen información en profundidad Conocimientos
fundamentales de las sociedades adquirente y adquirida. Sin embargo, un modelo puramente
técnico como el descrito anteriormente para PEAD aún puede extraer una APR de
aproximadamente el 3 por ciento para fusiones y adquisiciones (M & As). (Es interesante
observar que, contrariamente a las creencias comunes, Hafez descubrió que el precio de las
acciones de la adquirida cae más que el de la adquirente después del anuncio inicial de la
adquisición).
En el capítulo 6, describimos cómo el impulso en el precio de una acción es generado por

la compra o venta forzada de acciones por parte de grandes fondos. Para los fondos
indexados (ya sean mutuos o negociados en bolsa), existe un tipo de compra y venta forzada
que es bien conocido: los cambios en la composición del índice. Cuando se agrega una
acción a un índice, espere presión de compra y viceversa cuando se elimina una acción de un
índice. Estas operaciones de reequilibrio de índices también generan impulso
inmediatamente después de los cambios anunciados. Aunque algunos investigadores han
informado que ese impulso solía durar muchos días, mis propias pruebas con datos más
recientes sugieren que el horizonte de deriva también se ha reducido a intradía (Shankar y
Miller, 2006).
Si bien estamos en el tema del impulso debido a los anuncios programados, ¿qué pasa
con el impacto de eventos macroeconómicos como las decisiones de tasas del Comité
Federal de Mercado Abierto o la publicación del último índice de precios al consumidor? He
probado sus efectos sobre el EURUSD, pero desafortunadamente no he encontrado un
impulso significativo. Sin embargo, Clare y Courtenay informaron que la publicación de datos
macroeconómicos del Reino Unido, así como los anuncios de tipos de interés del Banco de
Inglaterra, indujeron un impulso en el GBPUSD durante al menos 10 minutos después de los
anuncios (Clare y Courtnenay, 2001). Estos resultados se basaron en datos hasta 1999, por lo
que deberíamos esperar que la duración de este impulso sea más breve en los últimos años,
si es que el impulso continúa existiendo.
TRADUCCIÓN 119
■ Estrategia de ETF apalancada

Imagine que tiene una cartera de acciones que se supone debe seguir el índice MSCI US
REIT (RMZ), excepto que desea mantener el apalancamiento de la cartera en 3,
especialmente al cierre del mercado. Como demuestro en el ejemplo 8.1, este requisito de
apalancamiento constante tiene algunas consecuencias importantes y contradictorias.
Supongamos que el RMZ cayó precipitadamente un día. Eso implicaría que necesitaría
reducir sustancialmente las posiciones en su cartera vendiendo acciones en todos los
ámbitos para mantener constante el apalancamiento. Por el contrario, si la RMZ subió ese
día, necesitaría aumentar las posiciones comprando acciones. Ahora suponga que usted es
en realidad el patrocinador de un ETF, y esa cartera suya no es otra que un ETF apalancado 3
veces como DRN (un ETF de bienes raíces), y su capital es de más de cien millones de
dólares. Si cree que este procedimiento de reequilibrio (vender las acciones que lo componen
cuando el rendimiento de la cartera es negativo y viceversa) cerca del cierre del mercado
generaría un impulso en el valor de mercado de la cartera, estaría en lo cierto.
(Un gran cambio en el índice de mercado genera un impulso en la misma dirección para
los ETF apalancados largos o cortos. Si el cambio es positivo, un ETF corto experimentaría
una disminución en el capital y su patrocinador tendría que reducir sus posiciones cortas. Por
lo tanto, , también necesitaría comprar acciones, tal como lo haría el ETF largo).
Podemos probar esta hipótesis construyendo una estrategia de impulso muy simple:
compre DRN si el rendimiento del día anterior cerca de 15 minutos antes del cierre del
mercado es mayor al 2 por ciento, y venda si el rendimiento es menor al -2 por ciento. Salga
de la posición al cierre del mercado. Tenga en cuenta que esta estrategia de impulso se basa
en el impulso de las acciones subyacentes, por lo que también debería afectar los
rendimientos cercanos al cierre del mercado de los ETF no apalancados como SPY. Usamos
los ETF apalancados como instrumentos de negociación simplemente para magnificar el
efecto. La APR de operar con DRN es del 15 por ciento con un índice de Sharpe de 1.8 desde
el 12 de octubre de 2011 hasta el 25 de octubre de 2012. Naturalmente, el rendimiento de
esta estrategia debería aumentar a medida que aumentan los activos agregados de todos los
ETF apalancados. Se informó que el AUM total de ETF apalancados (incluidos los fondos
largos y cortos) a fines de enero de 2009 es de $ 19 mil millones (Cheng y Madhavan, 2009).
Estos autores también estimaron que un movimiento del 1 por ciento de SPX requerirá una
compra o venta de acciones que constituyan alrededor del 17 por ciento del volumen de
mercado al cierre. Obviamente, esto va a tener un impacto significativo en el mercado, lo que
induce un impulso. (Un análisis más actualizado fue publicado por Rodier, Haryanto, Shum y
Hejazi, 2012.) Por supuesto, hay otro evento que afectará el capital de un ETF, apalancado o
no: el flujo de efectivo de los inversores. Una gran entrada en ETF apalancados a largo plazo
provocará un impulso positivo en los precios de las acciones subyacentes, mientras que una
TRADUCCIÓN 120
gran entrada en ETF apalancados cortos ("inversos") provocará un impulso negativo. Por lo
tanto, es teóricamente posible que el mismo día en que el índice de mercado tuvo un gran
rendimiento positivo, muchos inversores vendieron los ETF apalancados a largo plazo (tal
vez como parte de una estrategia de reversión a la media). Esto habría neutralizado el
impulso. Pero nuestras pruebas retrospectivas muestran que esto no sucedía con frecuencia.
■ Estrategias de alta frecuencia

La mayoría de las estrategias de impulso de alta frecuencia implican extraer información
del libro de pedidos, y la idea básica es simple: si el tamaño de la oferta es mucho mayor que
el tamaño de la demanda, espere que el precio suba y viceversa. Esta idea está respaldada
por investigaciones académicas. Por ejemplo, se encontró una relación aproximadamente
lineal entre el desequilibrio de los tamaños de oferta y demanda y los cambios de precios a
corto plazo en el mercado Nasdaq (Maslov y Mills, 2001). Como era de esperar, el efecto es
mayor para las existencias de menor volumen. El efecto no se limita solo a los precios de la
mejor oferta nacional (NBBO): un desequilibrio de toda la cartera de pedidos también induce
cambios de precio para una acción en el mercado de valores de Estocolmo (Hellström y
Simonsen, 2006).
Hay una serie de estrategias de impulso de alta frecuencia basadas en este fenómeno.
Muchos de ellos se describieron en libros sobre la microestructura del mercado o el
comercio de alta frecuencia (Arnuk y Saluzzi, 2012; Durbin, 2010; Harris, 2003; y Sinclair,
2010). (En mis descripciones que siguen, me concentro en realizar una operación larga
inicial, pero, por supuesto, hay una oportunidad simétrica en el lado corto).
En los mercados que completan las órdenes de forma prorrateada, como las
operaciones de futuros de eurodólares en CME, la forma más sencilla de beneficiarse de esta
expectativa es simplemente "unirse a la oferta" inmediatamente, de modo que siempre que
haya un llenado en el mercado. lado de la oferta, se nos asignará parte de ese relleno. Para
asegurarnos de que es más probable que los precios de oferta y demanda se muevan hacia
arriba en lugar de hacia abajo después de que estemos llenos, nos unimos a la oferta solo
cuando el tamaño de oferta original es mucho mayor que el tamaño de demanda. Esto se
denomina comercio de relación, porque esperamos que la proporción de la orden original que
se complete es igual a la relación entre el tamaño de nuestra propia orden y el tamaño de la
orden agregada al precio de oferta. Una vez que la presión de compra hace que el precio de
oferta suba uno o más ticks, entonces podemos vender con una ganancia, o simplemente
podemos colocar una orden de venta en la mejor oferta (si el diferencial de oferta y demanda
es mayor que el de ida y vuelta comisión por acción). Si el precio de oferta no sube o nuestra
orden de límite de venta no se completa, probablemente aún podamos vender al mejor precio
de oferta original debido al gran tamaño de la oferta, con la pérdida de comisiones
solamente.
TRADUCCIÓN 121
En los mercados donde el diferencial de oferta y demanda es mayor que dos ticks, existe
otra operación simple para beneficiarse de la expectativa de un repunte. Simplemente
coloque la orden de compra con la mejor oferta más una marca. Si se llena, entonces
colocamos una orden de venta en el mejor pedido menos un tick y esperamos que se
complete. Pero si no es así, probablemente podamos venderlo a la mejor oferta original, con
la pérdida de comisiones más un tic. A esto se le llama hacer tictac o comparación de
cotizaciones. Para que esta operación sea rentable, debemos asegurarnos de que la
comisión de ida y vuelta por acción sea menor que el diferencial de oferta y demanda menos
dos ticks. Esta estrategia se ilustra en la Figura 7. Después de completar la orden de compra
en B, intentaremos venderla en S para obtener una ganancia de al menos un tick. Pero si la
orden de venta no se puede completar, la venderemos a S ′ con una pérdida de un tick.
(El tic-tac no es una estrategia infalible, por supuesto. La mejor oferta original antes de la
ejecución inicial puede cancelarse si el comerciante sabe que ha estado al frente, dejándonos
con un precio de oferta más bajo para descargar nuestro inventario. Toda la situación podría
ser una trampa para nosotros: el comerciante que hizo la mejor oferta original en realidad
quería vendernos acciones a un precio mejor que su propia oferta. Por lo tanto, una vez que
compráramos sus acciones más un tick, cancelaría inmediatamente el licitación.)
Incluso cuando no existe una presión de compra preexistente o un desequilibrio de

tamaño entre la oferta y la demanda, podemos crear la ilusión de uno (a menudo llamado
encendido por impulso). Esto funciona para mercados con prioridad de tiempo para los
pedidos en lugar de utilizar rellenos prorrateados. Supongamos que comenzamos con
tamaños de mejor oferta y demanda muy similares. Colocaremos una orden de límite de
compra grande en la mejor oferta para crear la impresión de presión de compra y, al mismo
tiempo, colocaremos una orden de límite de venta pequeña en la mejor oferta. Esto engañaría
a los operadores para que compren al precio de venta, ya que anticipan un repunte, llenando
nuestra pequeña orden de venta. En este punto, cancelamos inmediatamente la orden de
compra grande. Los mejores tamaños de oferta y demanda ahora son aproximadamente
iguales nuevamente. Muchos de los operadores que compraron antes con la expectativa de
una gran presión de compra, ahora pueden volver a vender sus posiciones con pérdidas, y
luego podemos comprarlas a la mejor oferta original. A esto se le llama voltear.
Existe el peligro de crear la ilusión de presión de compra: alguien podría simplemente

llamar nuestro engaño y realmente completar nuestra gran orden de compra. En este caso,
es posible que tengamos que venderlo con pérdidas. Por el contrario, si sospechamos que
una orden de compra grande se debe a los inversores, podemos vender a los inversores y
reducir el precio de oferta. Esperamos que los fl ippers capitulen y vendan su nuevo
inventario, reduciendo también el precio de oferta, de modo que podamos cubrir nuestra
posición corta por debajo del precio de oferta original. ¿Cómo sabemos que la gran orden de
TRADUCCIÓN 122
compra se debe a los fl ippers en primer lugar? Es posible que tengamos que registrar la
frecuencia con la que se cancela una oferta grande en lugar de completarla. Si se suscribe a
los feeds de datos privados de los intercambios como ITCH de Nasdaq, EDGX Book Feed de
Direct Edge o el feed de PITCH de BATS, recibirá el historial de vida detallado de un pedido,
incluidas las modificaciones o rellenos parciales ( Arnuk y Saluzzi, 2012). Dicha información
también puede ayudarlo a detectar fl ippers.
Todas estas estrategias y sus defensas, farol y contra farol ilustran el punto general de
que los traders de alta frecuencia solo pueden beneficiarse de los traders más lentos. Si solo
quedan comerciantes de alta frecuencia en el mercado, la ganancia neta promedio para
todos será cero. De hecho, debido a la prevalencia de este tipo de estrategias de alta
frecuencia que "adelantan" grandes pedidos o pedidos, muchos creadores de mercado
tradicionales ya no cotizan tamaños grandes. Esto ha llevado a una disminución general de
los tamaños de las NBBO en muchos mercados. Por ejemplo, incluso en acciones de gran
liquidez como AAPL, los tamaños de NBBO suelen ser de unos pocos cientos de acciones. E
incluso para los ETF más líquidos, como SPY en ARCA, los tamaños de NBBO suelen ser
menos de 10,000 acciones. Solo después de que se llenen estos pequeños pedidos, el
creador de mercado volverá a cotizar a los mismos precios para evitar que los operadores de
alta frecuencia se aprovechen de ellos. (Por supuesto, hay otras razones para evitar mostrar
cotizaciones grandes: a los creadores de mercado no les gusta mantener grandes inventarios
que pueden resultar de que se llenen sus cotizaciones grandes). De manera similar, las
órdenes institucionales grandes que antes se ejecutaban como operaciones en bloque ahora
se rompen. en pequeños pedidos de niños que se distribuyen por los diferentes lugares del
mercado y se ejecutan a lo largo del día.
Dejar de cazar es otra estrategia favorita de impulso de alta frecuencia. La investigación

en los mercados de divisas indicó que una vez que se superan los niveles de soporte
(resistencia), los precios bajarán (subirán) más por un tiempo (Osler, 2000 (Osler, 2001).
Estos niveles de soporte y resistencia pueden ser los reportados diariamente por los bancos
o corretaje, o simplemente pueden ser números redondos en la proximidad de los niveles de
precios actuales.Este impulso de precios a corto plazo se produce debido a la gran cantidad
de órdenes stop colocadas en o cerca de los niveles de soporte y resistencia.
Para entender esto más a fondo, veamos los niveles de soporte, ya que la situación con
los niveles de resistencia es simétrica. Una vez que el precio cae lo suficiente como para
romper un nivel de soporte, se activan esas órdenes de stop de venta y, por lo tanto, los
precios bajan aún más. Dado este conocimiento, los operadores de alta frecuencia pueden,
por supuesto, crear una presión de venta artificial al enviar grandes órdenes de venta cuando
el precio está lo suficientemente cerca de un nivel de soporte, con la esperanza de reducir el
siguiente tick. Una vez que se activan las órdenes de detención y se aplica un impulso a la
baja, estos operadores de alta frecuencia pueden cubrir sus posiciones cortas para obtener
TRADUCCIÓN 123
una ganancia rápida.
Si tenemos acceso a la información del flujo de órdenes de un mercado, entonces

tenemos un flujo de información muy valioso que va más allá del flujo habitual de oferta /
demanda / último precio. Como Lyons discutió en el contexto del comercio de divisas, el
"flujo de órdenes" es el volumen de transacciones firmado (Lyons, 2001). Si un comerciante
compra 100 unidades de un comerciante / creador de mercado / libro de pedidos, el flujo de
pedidos es 100, y es −100 si el comerciante vende 100 unidades en su lugar. Lo que significa
"comprar" de un libro de órdenes es que un comerciante compra al precio de venta o, de
manera equivalente, el comerciante envía una orden de mercado para comprar. La
investigación empírica indica que la información sobre el flujo de pedidos es un buen
predictor de los movimientos de precios. Esto se debe a que los creadores de mercado
pueden extraer información fundamental importante de la información del flujo de pedidos y
establecer los precios de oferta y demanda en consecuencia. Por ejemplo, si un importante
fondo de cobertura se entera de una noticia importante, sus algoritmos enviarán grandes
órdenes de mercado del mismo signo en una fracción de segundo. Un creador de mercado
que supervise el flujo de órdenes deducirá, con bastante razón, que demandas
unidireccionales tan grandes indican la presencia de comerciantes informados, y ajustarán
inmediatamente sus precios de oferta y demanda para protegerse. La urgencia de utilizar
órdenes de mercado indica que la información es nueva y poco conocida.
Dado que la mayoría de nosotros no somos grandes creadores de mercado ni

operadores de un intercambio, ¿cómo podemos acceder a dicha información sobre el flujo de
pedidos? Para los mercados de acciones y futuros, podemos monitorear y registrar cada tick
(es decir, cambios en la mejor oferta, demanda y precio y tamaño de la transacción), y así
determinar si una transacción se llevó a cabo en la oferta (flujo de orden negativo) o en el
preguntar (flujo de orden positivo). Para el mercado de divisas, esto es difícil porque la
mayoría de los distribuidores no informan los precios de las transacciones. Es posible que
tengamos que recurrir al comercio de futuros de divisas para esta estrategia. Una vez que se
calcula el flujo de pedidos por transacción, podemos calcular fácilmente el flujo de pedidos
acumulado o promedio durante un período retrospectivo y usarlo para predecir si el precio
subirá o bajará.
• Las estrategias de impulso intradía no adolecen de muchas de las desventajas de las

estrategias de impulso entre días, pero conservan algunas ventajas clave.
• Las estrategias de impulso de "ruptura" implican un precio que excede un rango de

negociación.
• La estrategia de apertura de brecha es una estrategia de ruptura que funciona para

algunos futuros y divisas.
TRADUCCIÓN 124
• El impulso de ruptura puede ser causado por la activación de órdenes stop.
• Muchos tipos de noticias corporativas y macroeconómicas inducen un impulso de

precios a corto plazo.
• Los cambios en la composición del índice inducen un impulso en las acciones que se
agregan o eliminan del índice.
• El reequilibrio de los ETF apalancados cerca del cierre del mercado provoca un impulso
en el índice subyacente en la misma dirección que el rendimiento del mercado desde el cierre
anterior.
• Muchas estrategias de impulso de alta frecuencia implican un desequilibrio entre los

tamaños de oferta y demanda, un desequilibrio que a veces es creado artificialmente por los
propios operadores de alta frecuencia.
• Detener la caza es una estrategia de negociación de alta frecuencia que se basa en

activar órdenes de detención que normalmente ocupan números redondos cerca del precio
de mercado actual.
• El flujo de pedidos puede predecir el movimiento de precios a corto plazo en la misma

dirección.
PUNTOS CLAVE
Gestión de riesgos
CAPÍTULO 8
La gestión del riesgo significa diferentes cosas para distintas personas. Para los traders
novatos, la gestión del riesgo está impulsada por la "aversión a las pérdidas": simplemente
no nos gusta la sensación de perder dinero. De hecho, la investigación ha sugerido que el ser
humano promedio debe tener el potencial de ganar $ 2 para compensar el riesgo de perder $
1, lo que puede explicar por qué una proporción de Sharpe de 2 es tan atractiva desde el
punto de vista emocional (Kahneman, 2011). Sin embargo, esta aversión al riesgo en sí
misma no es racional. Nuestro objetivo debe ser la maximización del crecimiento de la renta
variable a largo plazo, y evitamos el riesgo solo en la medida en que interfiera con este
objetivo. La gestión de riesgos de este capítulo se basa en este objetivo.
TRADUCCIÓN 125
El concepto clave en la gestión de riesgos es el uso prudente del apalancamiento, que

podemos optimizar mediante la fórmula de Kelly o algunos métodos numéricos que
maximizan la tasa de crecimiento compuesto. Pero, a veces, la realidad nos obliga a limitar la
extracción máxima de una cuenta. Una forma obvia de lograr esto es el uso de stop loss, pero
a menudo es problemático. La otra forma es el seguro de cartera de proporción constante,
que trata de maximizar la ventaja de la cuenta además de evitar grandes reducciones.
Ambos se discutirán aquí. Por último, puede ser aconsejable evitar el comercio durante
momentos en los que el riesgo de pérdida es alto. Investigaremos si el uso de ciertos
indicadores principales de riesgo es una técnica eficaz para evitar pérdidas.
■ Apalancamiento óptimo
Es fácil decir que debemos ser prudentes al usar el apalancamiento, pero es mucho más
difícil decidir qué constituye un apalancamiento prudente u óptimo para una estrategia o
cartera en particular porque, obviamente, si establecemos el apalancamiento en cero,
sufriremos sin riesgos, pero tampoco generará beneficios.
Para algunos administradores de cartera, especialmente aquellos que administran su

propio dinero y no responden ante nadie más que ellos mismos, el único objetivo de la
negociación es maximizar el patrimonio neto a largo plazo. No prestan atención a las
reducciones y volatilidades de los rendimientos. Entonces, el apalancamiento óptimo para
ellos significa uno que puede maximizar el patrimonio neto o, de manera equivalente, la tasa
de crecimiento compuesto.
Analizaremos aquí tres métodos para calcular el apalancamiento óptimo que maximiza
la tasa de crecimiento compuesto. Cada método tiene sus propias suposiciones e
inconvenientes, y tratamos de ser agnósticos en cuanto al método que debe adoptar. Pero,
en todos los casos, tenemos que suponer que la distribución de probabilidad futura de los
rendimientos del mercado es la misma que en el pasado. Suele ser una suposición incorrecta,
pero es lo mejor que pueden hacer los modelos cuantitativos. Aún más restrictivo, muchas
técnicas de gestión de riesgos asumen además que la distribución de probabilidad de los
rendimientos de la estrategia en sí es la misma que en el pasado. Y finalmente, el más
restrictivo de todos y supone que la distribución de probabilidad de los rendimientos de la
estrategia es gaussiana. Como suele ser el caso en el modelado matemático, las
suposiciones más restrictivas dan lugar a la solución más elegante y simple, por lo que
comenzaré este estudio con la fórmula de Kelly bajo la suposición gaussiana.
Si la reducción máxima de una cuenta con cierto apalancamiento es −100%, este

apalancamiento no puede ser óptimo porque la tasa de crecimiento compuesto también será
−100%. Entonces, un apalancamiento óptimo implica que no debemos arruinarnos (la
equidad llega a cero) en ningún momento de la historia, ¡más bien obviamente! Pero a veces
TRADUCCIÓN 126
nuestros administradores de riesgos (quizás sea un cónyuge para los comerciantes

independientes) nos dicen que se nos permite tener una magnitud de reducción mucho
menor que 1. En este caso, la reducción máxima permitida forma una restricción adicional en
el problema de optimización del apalancamiento.
Independientemente de cómo se determine el apalancamiento óptimo, el tema central es

que el apalancamiento debe mantenerse constante. Esto es necesario para optimizar la tasa
de crecimiento, tengamos o no la restricción de reducción máxima. Mantener un
apalancamiento constante puede parecer bastante mundano, pero puede ser contrario a la
intuición cuando se pone en acción. Por ejemplo, si tiene una cartera de acciones larga y sus
ganancias y pérdidas (P&L) fueron positivas en el último período de negociación, el requisito
de apalancamiento constante lo obliga a comprar más acciones para este período. Sin
embargo, si su P&L fue negativo en el último período, lo obliga a vender acciones en la
pérdida. El ejemplo 8.1 ilustra esto.
Muchos analistas creen que esta característica de "vender con pérdidas" de las técnicas
de gestión de riesgos provoca contagio en las crisis financieras. (En particular, esto se citó
como una de las causas del colapso de los fondos cuantitativos en agosto de 2007; véase
Khandani y Lo, 2007). Esto se debe a que, a menudo, muchos fondos mantienen posiciones
similares en sus carteras. Si un fondo sufre pérdidas, quizás debido a algunas estrategias no
relacionadas, es propenso a liquidar posiciones en todas sus carteras debido al requisito de
apalancamiento constante, lo que provoca pérdidas para todos los demás fondos que
mantienen esas posiciones. Las pérdidas obligan a todos estos otros fondos a liquidar
también sus posiciones y así exacerbar las pérdidas para todos: un círculo vicioso. Se podría
pensar en esto como una tragedia de los comunes: la autoconservación ("gestión de
riesgos") de un fondo puede conducir a una catástrofe para todos.
Ejemplo 8.1: Las implicaciones del requisito de apalancamiento

constante
El requisito central para todas las formas de optimizar el apalancamiento descritas en
este capítulo es que el apalancamiento se mantenga constante en todo momento. Esto
puede tener algunas consecuencias contradictorias. Si comenzó con un capital de $ 100K en
su cuenta y se determinó que el apalancamiento óptimo de su estrategia era 5, entonces
debería tener una cartera con un valor de mercado de $ 500K.
Sin embargo, si perdió $ 10K en un día y su capital se redujo a $ 90K, con un valor de
mercado de la cartera de $ 490K, entonces debe liquidar otros $ 40K de su cartera para que
su valor de mercado actualizado r se convierta en 5. × $ 90K = $ 450K. Esta venta de pérdidas
puede incomodar a algunas personas, pero es una parte necesaria de muchos esquemas de
TRADUCCIÓN 127
gestión de riesgos.
Suponga que luego ganó $ 20K al día siguiente. ¿Cuál debería ser el valor de mercado de
su cartera? ¿Y qué debe hacer para lograr ese valor de mercado?
El nuevo valor de mercado de la cartera debe ser 5 × ($ 90K + $ 20K) = $ 550K. Dado que
el valor de mercado de su cartera actual era solo $ 450K + $ 20K = $ 470K, esto significa que
debe agregar $ 80K en valores (largos o cortos) a la cartera. ¡Con suerte, su corredor le
prestará el dinero en efectivo para comprar todos estos valores adicionales!
Fórmula de Kelly
Si se supone que la distribución de probabilidad de los rendimientos es gaussiana, la
fórmula de Kelly nos da una respuesta muy simple para el apalancamiento óptimo f:
donde m es el exceso de rendimiento medio y s 2 es la varianza de los excesos de

rendimiento.
Una de las mejores exposiciones de esta fórmula se puede encontrar en el artículo de

Edward Thorp (1997), y también le dediqué un capítulo completo en Quantitative Trading
(Chan, 2009). Se puede demostrar que si el supuesto de Gauss es una buena aproximación,
entonces el apalancamiento de Kelly f generará la tasa de crecimiento de capital compuesta
más alta f, suponiendo que todas las ganancias se reinviertan. Sin embargo, incluso si el
supuesto gaussiano es realmente válido, inevitablemente sufriremos errores de estimación
cuando intentemos estimar cuál es la media "verdadera" y la varianza del rendimiento en
exceso. Y no importa lo bueno que sea el método de estimación, no hay garantía de que la
media y la varianza futuras sean las mismas que las históricas. La consecuencia de utilizar
una media sobrestimada o una varianza subestimada es nefasta: cualquiera de los dos casos
conducirá a un apalancamiento óptimo sobrestimado, y si este apalancamiento
sobrestimado es lo suficientemente alto, eventualmente conducirá a la ruina: la equidad va a
cero. Sin embargo, la consecuencia de utilizar un apalancamiento subestimado es
simplemente una tasa de crecimiento compuesta submáxima. Muchos traders prefieren
justificadamente el último escenario, y rutinariamente despliegan un apalancamiento igual a
la mitad de lo que recomienda la fórmula de Kelly: el llamado apalancamiento de media Kelly.
Mi experiencia real con el apalancamiento óptimo de Kelly es que se ve mejor como un

límite superior en lugar de como el apalancamiento que debe utilizarse. A menudo, el
apalancamiento de Kelly otorgado por el backtest (o un período corto de la prueba de avance)
es tan alto que supera con creces el apalancamiento máximo permitido por nuestros
corredores. En otras ocasiones, el apalancamiento de Kelly nos habría llevado a la bancarrota
incluso en backtest, debido a las distribuciones de rendimientos no gaussianas. En otras
TRADUCCIÓN 128
palabras, la reducción máxima en backtest es -1 usando el apalancamiento de Kelly, lo que

implica establecer el apalancamiento optimizando numéricamente la tasa de crecimiento
usando una distribución no gaussiana más realista que podría ser más práctico.
Alternativamente, podemos optimizar los rendimientos históricos empíricos. Estos dos
métodos se discutirán en las siguientes secciones.
Pero el simple hecho de usar el apalancamiento óptimo de Kelly como límite superior a
veces puede proporcionar información interesante. Por ejemplo, una vez calculé que los
índices Russell 1000 y 2000 tienen un apalancamiento de Kelly de aproximadamente 1,8.
Pero el patrocinador de fondos cotizados en bolsa (ETF) Direxion ha estado comercializando
ETF con triple apalancamiento BGU y TNA siguiendo estos índices. Por diseño, tienen un
apalancamiento de 3. Claramente, existe un peligro real de que el valor liquidativo (NAV) de
estos ETF se reduzca a cero. Con igual claridad, ningún inversor debe comprar y mantener
estos ETF, como el propio patrocinador está de acuerdo.
Hay otro uso de la fórmula de Kelly además de establecer el apalancamiento óptimo:

también nos dice cómo asignar de manera óptima nuestro poder adquisitivo a diferentes
carteras o estrategias. Denotemos F como un vector de columna de apalancamiento F
óptimo que deberíamos aplicar a las diferentes carteras en función de un fondo común de
capital. (Por ejemplo, si tenemos un valor de $ 1, entonces F = [3.2 1.5] T significa que la
primera cartera debe tener un valor de mercado de $ 3.2 mientras que la segunda cartera
debe tener un valor de mercado de $ 1.5. La T significa la transposición de la matriz T. ) La
fórmula de Kelly dice
donde C es la matriz de covarianza de los rendimientos de las carteras y C M es la M

media de los rendimientos en exceso de estas carteras.
Hay un amplio ejemplo sobre cómo utilizar esta fórmula en el comercio cuantitativo.
Pero, ¿qué debemos hacer si nuestro corredor ha establecido un apalancamiento máximo F
max F que es menor que el apalancamiento bruto total x ∑ n i | F i F |? (Nos preocupa el
apalancamiento bruto, que es igual a la suma absoluta de los valores de mercado largo y
corto dividida por nuestro capital, no el apalancamiento neto, que es el neto de los valores de
mercado largo y corto dividido por nuestro capital). La recomendación habitual es multiplicar
todo F i F por el factor F max F / ∑ ni | F i F | de modo que el apalancamiento bruto total sea
igual a F max F. El problema con este enfoque es que la tasa de crecimiento compuesto ya
no será óptima bajo esta restricción de apalancamiento máximo. He construido el ejemplo
8.2 para demostrar esto. El resultado de ese ejemplo es que cuando F max F es mucho
menor que x ∑ ni | F i F |, a menudo es óptimo (con respecto a maximizar la tasa de
crecimiento) simplemente invertir la mayor parte o todo nuestro poder adquisitivo en la
cartera o estrategia con la mayor rentabilidad media en exceso.
TRADUCCIÓN 129
Optimización de la tasa de crecimiento esperada mediante retornos

simulados
Si uno relaja la suposición gaussiana y sustituye la distribución de rendimientos por otra
forma analítica (por ejemplo, t de Student) para tener en cuenta las colas gruesas, aún
podemos seguir las derivaciones de la fórmula de Kelly en la fórmula F | de Thorp | calculado
de esta manera excede el apalancamiento máximo F max F que nos impone nuestra
correduría o nuestro gestor de riesgos. Con esta restricción, a menudo no es óptimo
multiplicar todos estos F i F por el factor F max F / ∑ n i | F i F |, como demostraré aquí.
Suponga que tenemos dos estrategias, 1 y 2. La estrategia 1 tiene un exceso de rendimiento
medio anualizado y una volatilidad del 30 y el 26 por ciento, respectivamente. La estrategia 2
tiene un exceso de rendimiento medio anualizado y una volatilidad del 60 y el 35 por ciento,
respectivamente. Suponga además que sus distribuciones de rendimientos son gaussianas y
que hay una correlación cero entre los rendimientos de 1 y 2. De modo que los
apalancamiento de Kelly para ellos son 4.4 y 4.9, respectivamente, con un apalancamiento
bruto total de 9.3. La tasa de crecimiento compuesto anualizada es (Thorp, 1997)
donde también hemos supuesto que la tasa libre de riesgo es 0. Ahora, digamos que
nuestra agencia de corretaje nos dice que se nos permite un apalancamiento máximo de 2.
¿Pero estos apalancamiento realmente generan el máximo g bajo nuestra restricción de
apalancamiento máximo? Podemos averiguarlo estableciendo F 1 en F max F F - F 2 F, y
graficar g como una función de F 2 F sobre el rango permitido de 0 a F max F F = F 2 F. Es
obvio que la tasa de crecimiento se optimiza cuando F 2 F = F max F F = x 2. = La g
optimizada es 0.96, que es mayor que el 0.82 dado en la Ecuación 8.4. Esto muestra que
cuando tenemos dos o más estrategias con tasas de crecimiento independientes muy
diferentes, y cuando tenemos una restricción de apalancamiento máximo que es mucho
menor que el apalancamiento de Kelly, a menudo es óptimo aplicar todo nuestro poder
adquisitivo en la estrategia. que tiene la tasa de crecimiento más alta.
papel y llegar a otro apalancamiento óptimo, aunque la fórmula no será tan simple como
la Ecuación 8.1. (Esto es cierto siempre que la distribución tenga un número finito de
momentos, a diferencia de, por ejemplo, la distribución Pareto Levy). Para algunas
distribuciones, puede que ni siquiera sea posible llegar a una respuesta analítica. Aquí es
donde las simulaciones de Monte Carlo pueden ayudar.
El valor esperado de la tasa de crecimiento compuesto en función del apalancamiento f

es (asumiendo por simplicidad que la tasa libre de riesgo es cero) f
donde … indica un promedio sobre algún muestreo aleatorio del rendimiento por barra
sin apalancamiento R (t) de la estrategia (no de los precios de mercado) basado en alguna
distribución de probabilidad de R. (Normalmente usamos barras diarias para R ( t), pero la
TRADUCCIÓN 130
barra puede ser tan larga o corta como queramos.) Si esta distribución de probabilidad es
gaussiana, entonces g (f) se puede reducir analíticamente a g (f) = fm - f 2 m 2/2, que es lo
mismo que la Ecuación 8.4 en el caso de estrategia única. Además, los máximos de g (f)
pueden, por supuesto, determinarse analíticamente tomando la derivada de g (f) con
respecto af o y poniéndola a cero. Esto reproducirá la fórmula de Kelly en la ecuación 8.1 y
reproducirá la tasa de crecimiento máxima indicada por la ecuación 8.3 en el caso de
estrategia única. Pero este no es nuestro interés aquí. Nos gustaría calcular la Ecuación 8.5
utilizando una distribución no gaussiana de R.
Aunque no conocemos la verdadera distribución de R, podemos usar el llamado sistema

Pearson (ver www.mathworks.com/help/toolbox/stats /br5k833-1.html o
mathworld.wolfram.com/PearsonSystem.html ) para modelarlo. El sistema de Pearson toma
como entrada la media, la desviación estándar, la asimetría y la curtosis de la distribución
empírica de R, y la modela como una de las siete distribuciones de probabilidad expresable
analíticamente que abarca Gaussiana, beta, gamma, t de Student, etc. Por supuesto, estas no
son las distribuciones más generales posibles. La distribución empírica puede tener
momentos más altos distintos de cero que no son capturados por el sistema de Pearson y
podrían, de hecho, tener momentos infinitos más altos, como en el caso de la distribución de
Pareto Levy. Pero capturar todos los momentos superiores invita al sesgo de espionaje de
datos debido a la cantidad limitada de datos empíricos generalmente disponibles. Entonces,
para todos los propósitos prácticos, usamos el sistema Pearson para nuestro muestreo
Monte Carlo.
Ilustramos esta técnica de Monte Carlo utilizando la estrategia de reversión a la media

descrita en el ejemplo 5.1. Pero primero, podemos usar los rendimientos diarios en el
conjunto de prueba para calcular fácilmente que el apalancamiento de Kelly es 18,4.
Debemos tener en cuenta este número al compararlo con los resultados de Monte Carlo. A
continuación, usamos los primeros cuatro momentos de estos retornos diarios para
construir un sistema de Pearson y generar 100.000 retornos aleatorios de este sistema.
Podemos usar la función pearsrnd de MATLAB Statistics Toolbox para esto. (El código
completo de d está en monteCarloOptimLeverage.m.)
RECUADRO 8.1
Suponemos que los rendimientos diarios de la estrategia están contenidos en la matriz
Nx1 ret. Usaremos los primeros cuatro momentos de ret para generar una distribución t del
sistema de Pearson, a partir de la cual se puede generar cualquier número de retornos
simulados ret_sim. momentos = {media (ret), std (ret), sesgo (ret), curtosis (ret)};
[ret_sim, type] = pearsrnd (momentos {:}, 100000, 1);

TRADUCCIÓN 131
En el código, ret contiene los retornos diarios del backtest de la estrategia, mientras que
ret_sim son 100.000 retornos diarios generados aleatoriamente con los mismos cuatro
momentos que ret. La función pearsrnd también devuelve el tipo d, que indica qué tipo de
distribución se ajusta mejor a nuestros datos. En este ejemplo, el tipo es 4, lo que indica que
la distribución no es una de las estándar, como la t de Student. (Pero no nos preocupa en
absoluto si tiene un nombre). Ahora podemos usar ret_sim para calcular el promedio de g (f).
En nuestro código, g (f) es una función en línea con apalancamiento f y una serie de retorno f
R como entradas.
RECUADRO 8.2
Una función en línea para calcular la tasa de crecimiento compuesta basada en el
apalancamiento fy el rendimiento por barra de R.
g = en línea ('suma (log (1 + f * R)) / longitud (R)', 'f', 'R');
Graficar g (f) para fr = 0 a fo = 23 revela que g (f) de hecho tiene un máximo cercano a 19
(ver Figura 8.2), y una optimización numérica usando la función fminbnd de MATLAB
Optimization Toolbox produce un d f óptimo de 19, sorprendentemente cerca del ff óptimo de
Kelly de 18.4. F
RECUADRO 8.3
Encontrar el mínimo de la tasa de crecimiento negativa basada en el apalancamiento f y
los rendimientos simulados f ret_sim (lo mismo que encontrar el máximo de la tasa de
crecimiento positiva). Por supuesto, si ejecuta este programa con una semilla aleatoria
diferente y, por lo tanto, una serie diferente de rendimientos simulados, encontrará un valor
algo diferente para la f óptima, pero idealmente no será muy diferente de mi valor. . (Como
nota al margen, la única razón por la que minimizamos −g - en lugar de maximizar g es que
MATLAB no tiene una función fmaxbnd). D Hay otro resultado interesante al ejecutar esta
optimización de Monte Carlo. Si intentamos f de 31, encontraremos que la tasa de
crecimiento es f −1; es decir, ruina. Esto se debe a que el rendimiento más negativo por
período es −0,0331, por lo que cualquier apalancamiento superior a 1 / 0,0331 = 30,2
resultará en una pérdida total durante ese período.
Optimización de la tasa de crecimiento histórico

En lugar de optimizar el valor esperado de la tasa de crecimiento utilizando nuestra
distribución de probabilidad analítica de rendimientos como hicimos en la sección anterior,
TRADUCCIÓN 132
uno puede, por supuesto, optimizar la tasa de crecimiento histórica en el backtest con
respecto al apalancamiento. Solo necesitamos un conjunto particular de retornos realizados:
el que realmente ocurrió en el backtest. Este método adolece del inconveniente habitual de la
optimización de parámetros en el backtest: sesgo de búsqueda de datos. En general, el
apalancamiento óptimo para esta realización histórica particular de los retornos de la
estrategia no será óptimo para una realización diferente que ocurrirá en el futuro. A diferencia
de la optimización de Monte Carlo, los rendimientos históricos ofrecen datos insuficientes
para determinar un apalancamiento óptimo que funciona bien para muchas realizaciones.
A pesar de estas advertencias, la optimización de fuerza bruta sobre los retornos de

backtest a veces da una respuesta muy similar tanto al apalancamiento de Kelly como a la
optimización de Monte Carlo. Utilizando la misma estrategia que en la sección anterior, y
modificando ligeramente el programa de optimización para incorporar los rendimientos
históricos ret en lugar de los rendimientos simulados ret_sim.
RECUADRO 8.4
Encontrar el mínimo de lo negativo de la tasa de crecimiento con base en el
apalancamiento fy los rendimientos históricos ret. menosG = @ (f) -g (f, ret); óptimo F =
fminbnd (menos G, 0, 21);
obtenemos el óptimo f de 18.4, que es nuevamente el mismo que el óptimo de Kelly f f.
Reducción máxima
Para aquellos gestores de carteras que gestionan los activos de otras personas,
maximizar la tasa de crecimiento a largo plazo no es el único objetivo. A menudo, sus
clientes (o empleadores) insistirán en que el valor absoluto de la reducción (rendimiento
calculado a partir de la marca de agua máxima histórica) nunca debe exceder un
determinado máximo. Es decir, dictan cuál puede ser la reducción máxima. Este requisito se
traduce en una restricción adicional en nuestro problema de optimización de
apalancamiento. Desafortunadamente, esta traducción no es tan simple como multiplicar el
apalancamiento óptimo sin restricciones por la proporción de la reducción máxima permitida
y la reducción máxima original sin restricciones. Utilizando el ejemplo de la sección sobre
optimización de la tasa de crecimiento esperada con retornos simulados ret_sim, la
reducción máxima es un escalofriante -0,999. Esto es con un óptimo f sin restricciones de
19,2. Suponga que nuestro administrador de riesgos permite una reducción máxima de solo
la mitad de esta cantidad. Usar la mitad de la f óptima de 9,6 f aún genera una reducción
máxima de -0,963. Por ensayo y error, encontramos que tenemos que reducir el
apalancamiento en un factor de 7, a 2,7 más o menos, para reducir la magnitud de la
TRADUCCIÓN 133
reducción máxima a aproximadamente 0,5. (Nuevamente, todos estos números dependen de

la serie exacta de rendimientos simulados, por lo que no son exactamente reproducibles).
RECUADRO 8.5
Usando mi función calculateMaxDD (disponible en http://epchan.com/book2) para
calcular las reducciones máximas con diferentes apalancamiento en la misma serie de
retornos simulados ret_sim. maxDD = calculateMaxDD (cumprod (1 + óptimoF / 7 * ret_sim) -
1);
Por supuesto, establecer el apalancamiento igual a este límite superior solo evitará que
la reducción simulada supere el máximo permitido, pero no evitará que nuestra futura
reducción lo haga. La única forma de garantizar que la futura reducción no supere este
máximo es utilizar un seguro de proporción constante o imponer un límite de pérdidas.
Discutiremos estas técnicas en las próximas dos secciones.
Vale la pena señalar que este método de estimación de la reducción máxima se basa en
una serie simulada de retornos estratégicos, no en los retornos estratégicos históricos
generados en un backtest. Por supuesto, podemos usar los retornos históricos de la
estrategia para calcular la reducción máxima y usarla para determinar el apalancamiento
óptimo. En este caso, encontraremos que solo necesitamos disminuir el óptimo no
restringido f l por un factor de 1.5 (a 13) para f reducir la reducción máxima por debajo de
−0.49.
¿Qué método debemos utilizar? La ventaja de utilizar rendimientos simulados es que

tienen una significación estadística mucho mayor. Son similares a la metodología de valor en
riesgo (VaR) utilizada por los principales bancos o fondos de cobertura para determinar la
probabilidad de que pierdan una cierta cantidad de dinero durante un período determinado.
La desventaja es que la reducción máxima que ocurre en la simulación puede ser tan rara
que realmente no sucederá más de una vez en un millón de años (una de las excusas
favoritas de los administradores de fondos cuando se enfrentan al duelo). Además, los
rendimientos simulados inevitablemente pasan por alto algunas correlaciones seriales
cruciales que pueden estar presentes en los rendimientos históricos y que pueden persistir
en el futuro. Estas correlaciones pueden estar reduciendo la reducción máxima en el mundo
real. La ventaja de utilizar los rendimientos históricos de la estrategia es que capturan
completamente estas correlaciones y, además, la reducción cubriría una vida útil realista de
una estrategia, no un millón de años. La desventaja es, por supuesto, que los datos son
demasiado limitados para capturar el peor de los casos. Un buen compromiso puede ser un
apalancamiento entre los generados por los dos métodos.
TRADUCCIÓN 134
■ Seguro de cartera de proporción constante

Ya se han discutido los objetivos, a menudo contradictorios, de querer maximizar la tasa
de crecimiento compuesto mientras se limita la reducción máxima. Existe un método que
nos permite cumplir ambos deseos: el seguro de cartera de proporción constante (CPPI).
Suponga que se determina que el apalancamiento de Kelly óptimo de nuestra estrategia

es f. f f Y supongamos que se nos permite una reducción máxima de −D. Simplemente
podemos apartar D del capital total de nuestra cuenta inicial para negociar y aplicar un
apalancamiento de f f a esta subcuenta para determinar el valor de mercado de nuestra
cartera. El otro 1 - D de la cuenta estará en efectivo. Entonces podemos estar seguros de que
no perderemos todo el capital de esta subcuenta o, de manera equivalente, no sufriremos una
reducción de más de −D en nuestra cuenta total. Si nuestra estrategia comercial es rentable y
el capital total de la cuenta alcanza una nueva marca de agua, entonces podemos restablecer
el capital de nuestra subcuenta para que sea nuevamente D del capital total, moviendo algo
de efectivo a la cuenta "efectivo". Sin embargo, si la estrategia sufre pérdidas, no
transferiremos efectivo entre el efectivo y la subcuenta comercial. Por supuesto, si las
pérdidas continúan y perdemos todo el capital en la subcuenta comercial, tenemos que
abandonar la estrategia porque ha alcanzado nuestra reducción máxima permitida de −D.
Por lo tanto, además de limitar nuestra reducción, este esquema sirve como una forma
elegante y basada en principios para reducir una estrategia perdedora. (La forma más
común, menos óptima, de liquidar una estrategia es impulsada por el colapso emocional del
administrador de la cartera).
Observe que debido a esta separación de cuentas, este esquema no es equivalente a

usar simplemente un apalancamiento de L = fD en el capital total de nuestra cuenta.
ff No hay garantía de que la reducción máxima no exceda -D incluso con un

apalancamiento reducido de ff D. Incluso si tuviéramos que imponer más un stop ff pérdida
de -D, o si la reducción nunca fue por debajo de -D, aplicando el El apalancamiento de ff D ff a
la cuenta completa todavía no generará exactamente el mismo rendimiento compuesto que
el CPPI, a menos que los rendimientos de cada período sean positivos (es decir, la reducción
máxima es cero). Mientras tengamos una reducción, CPPI disminuirá el tamaño del pedido
mucho más rápido que la alternativa, por lo que es casi imposible (debido al uso del
apalancamiento de Kelly en la subcuenta) que la cuenta se acerque a la reducción máxima -
D.
No sé si hay una prueba matemática de que el CPPI será lo mismo que usar un
apalancamiento de ff D ff en términos de la tasa de crecimiento a largo plazo, pero podemos
usar los mismos rendimientos simulados en las secciones anteriores para demostrar que
después de 100.000 días, la tasa de crecimiento de CPPI es muy similar al esquema
alternativo: 0,002484 frente a 0,002525 por día en una simulación con D = 0,5. La principal
TRADUCCIÓN 135
ventaja de CPPI es evidente solo cuando observamos la reducción máxima. Por diseño, la
magnitud de la reducción en CPPI es menos de 0.5, mientras que la del esquema alternativo
sin usar stop loss es un doloroso 0.9 incluso con solo la mitad del apalancamiento óptimo. El
código para calcular la tasa de crecimiento utilizando CPPI se muestra en el Cuadro 8.6.
RECUADRO 8.6
Calcular la tasa de crecimiento usando CPPI Suponga que la serie de retorno es ret_sim y
el apalancamiento óptimo es óptimoF, ambos de cálculos anteriores. Suponga también que
la reducción máxima permitida es -D = -0,5. para t = 1: longitud (ret_sim) g_cppi = g_cppi + log
(1+ ret_sim (t) * D * optimalF * (1 + drawdown)); reducción = min (0, (1 + reducción) * (1+
ret_sim (t)) - 1); end g_cppi = g_cppi / length (ret_sim); Tenga en cuenta que este esquema
solo debe aplicarse a una cuenta con una sola estrategia. Si se trata de una cuenta
multiestrategia, es muy posible que las estrategias rentables estén "subvencionando" las no
rentables, de modo que la reducción nunca sea lo suficientemente grande como para cerrar
la lista completa de estrategias. Obviamente, esta no es una situación ideal a menos que
piense que la estrategia perdedora volverá a la salud de alguna manera en algún momento.
Hay un problema con el uso de CPPI, un problema que comparte con el uso de stop loss:
no puede evitar que ocurra una gran reducción durante la brecha de la noche a la mañana o
siempre que se haya suspendido la negociación en un mercado. Las compras de opciones
fuera del dinero antes de un cierre de mercado esperado pueden eliminar parte de este
riesgo.
■ Stop Loss
Hay dos formas de utilizar los stop loss. El uso común es utilizar stop loss para salir de
una posición existente siempre que su P&L no realizado caiga por debajo de un umbral. Pero
después de salir de esta posición, podemos volver a entrar en una nueva posición, tal vez
incluso en una del mismo signo, algún tiempo después. En otras palabras, no nos preocupan
las pérdidas y ganancias acumuladas o la reducción de la estrategia.
El uso menos común es usar stop loss para salir de la estrategia por completo cuando
nuestra reducción cae por debajo de un umbral. Este uso de stop loss es incómodo: solo
puede suceder una vez durante la vida útil de una estrategia, e idealmente nunca tendríamos
que usarlo. Esa es la razón por la que se prefiere CPPI al uso de stop loss para la misma
protección. El resto de esta sección se ocupa del primer uso más común del stop loss.
El stop loss solo puede evitar que las pérdidas y ganancias no realizadas excedan
nuestro límite autoimpuesto si el mercado siempre está abierto cuando mantenemos una
TRADUCCIÓN 136
posición. Por ejemplo, es efectivo si no mantenemos posiciones después del cierre del
mercado o si estamos operando en divisas o en algunos futuros donde el mercado
electrónico está siempre abierto excepto los fines de semana y feriados. De lo contrario, si
los precios "bajan" o suben cuando el mercado reabre, el stop loss puede ejecutarse a un
precio mucho peor de lo que dicta nuestra pérdida máxima permitida. Como dijimos
anteriormente, las compras de opciones serán necesarias para eliminar este riesgo, pero eso
puede ser costoso de implementar y solo es valioso para el tiempo de inactividad esperado
del mercado.
En algunas circunstancias extremas, el stop loss es inútil incluso si el mercado está

abierto pero cuando todos los proveedores de liquidez deciden retirar su liquidez
simultáneamente. Esto sucedió durante el colapso repentino del 6 de mayo de 2010, ya que
los creadores de mercado de hoy en día simplemente necesitan mantener una oferta de $
0.01 (la infame "cotización de talón") en tiempos de estrés del mercado (Arnuk y Saluzzi,
2012). Es por eso que una orden de stop de venta desafortunada en Accenture, una compañía
con ingresos multimillonarios, se ejecutó a $ 0.01 por acción ese día.
Pero incluso si el mercado está abierto y hay liquidez normal, es motivo de controversia
si deberíamos imponer un stop loss para las estrategias de reversión de la media. A primera
vista, el stop loss parece contradecir el supuesto central de la reversión a la media. Por
ejemplo, si los precios bajan y entramos en una posición larga, y los precios bajan un poco
más y por lo tanto inducen una pérdida, deberíamos esperar que los precios suban
eventualmente si creemos en la reversión a la media de esta serie de precios. Por lo tanto, no
es sensato "detener pérdidas" y salir de esta posición cuando el precio es tan bajo. De hecho,
nunca he probado ninguna estrategia de reversión a la media cuyo APR o ratio de Sharpe se
incrementa al imponer un stop loss.
Solo hay un problema con este argumento: ¿Qué sucede si el modelo de reversión a la
media ha dejado de funcionar permanentemente mientras estamos en una posición? En las
finanzas, a diferencia de la física, las leyes no son inmutables. Como he estado repitiendo, lo
que antes era cierto para una serie de precios puede no serlo en el futuro. Por lo tanto, una
serie de precios con reversión a la media puede sufrir un cambio de régimen y convertirse en
una serie de precios con tendencia durante un período prolongado, tal vez para siempre. En
este caso, un stop loss será muy eficaz para prevenir pérdidas catastróficas y nos dará
tiempo para considerar la posibilidad de que simplemente debamos cerrar la estrategia antes
de incurrir en una pérdida del 100 por ciento. Además, este tipo de series de precios
"cambiantes" que el cambio de régimen de la reversión de la media al impulso nunca
aparecería en nuestro catálogo de estrategias de reversión de la media de rentabilidad
porque nuestro catálogo no habría incluido estrategias de reversión de la media que fallaron
en sus backtests. El sesgo de supervivencia estaba en acción cuando dije anteriormente que
el stop loss siempre reduce el rendimiento de las estrategias de reversión de la media. Es
TRADUCCIÓN 137
más exacto decir que el stop loss siempre reduce el rendimiento de las estrategias de
reversión a la media cuando los precios siguen revertiendo a la media, ¡pero ciertamente
mejora el desempeño de esas estrategias cuando los precios sufren un cambio de régimen y
comienzan a tener tendencia! Dada esta consideración del cambio de régimen y el sesgo de
supervivencia, ¿cómo deberíamos imponer un stop loss en una estrategia de reversión de la
media, ya que cualquier estrategia de reversión de la media probada con éxito sufre un sesgo
de supervivencia y siempre mostrará un rendimiento reducido si imponemos un stop loss?
Claramente, deberíamos imponer un stop loss que sea mayor que la reducción máxima
intradía del backtest. En este caso, el stop loss nunca se habría activado en el período de
backtest y no podría haber afectado el rendimiento del backtest, pero aún así puede prevenir
eficazmente que un evento de cisne negro en el futuro lleve a la ruina.
A diferencia de las estrategias de reversión a la media, las estrategias de impulso se

benefician del stop loss de una manera muy lógica y sencilla. Si una estrategia de impulso
está perdiendo, significa que el impulso se ha revertido, por lo que, lógicamente, deberíamos
estar saliendo de la posición y tal vez incluso invirtiendo la posición. Por lo tanto, una señal
de negociación de impulso actualizada continuamente sirve como un stop loss de facto. Esta
es la razón por la que los modelos de impulso no presentan el mismo tipo de riesgo de cola
que los modelos de reversión a la media.
■ Indicadores de riesgo
Muchas de las medidas de gestión de riesgos que discutimos anteriormente son
reactivas: reducimos el tamaño de la orden cuando incurrimos en una pérdida, o dejamos de
operar por completo cuando se alcanza una reducción máxima. Pero sería mucho más
ventajoso si pudiéramos evitar de manera proactiva esos períodos de tiempo en los que es
probable que la estrategia incurra en pérdidas. Este es el papel de los principales indicadores
de riesgo.
La distinción obvia entre los indicadores de riesgo principales y la noción más general de
indicadores de riesgo es que los indicadores de riesgo principales nos permiten predecir si el
próximo período será riesgoso para nuestra inversión, mientras que los indicadores de riesgo
generales son contemporáneos de un período de riesgo.
No existe un indicador de riesgo que sea aplicable a todas las estrategias: lo que es un
período de riesgo para una estrategia puede ser un período muy rentable para otra. Por
ejemplo, podríamos intentar usar el VIX, el índice de volatilidad implícita, como el principal
indicador de riesgo para predecir el riesgo del retorno al día siguiente de la estrategia de
compra de acciones con brecha descrita en el Capítulo 4. Esa estrategia tenía un promedio
anualizado. rendimiento de alrededor del 8,7 por ciento y un índice de Sharpe de 1,5 desde el
11 de mayo de 2006 al 24 de abril de 2012. Pero si el VIX del día anterior es superior a 35, un
TRADUCCIÓN 138
umbral común para períodos de alto riesgo, el rendimiento promedio anualizado del día será
de 17,2 por ciento con una relación de Sharpe de 1,4. ¡Claramente, esta estrategia se
beneficia del llamado riesgo! Sin embargo, VIX> 35 es un indicador de riesgo líder muy bueno
para la estrategia de brecha de apertura FSTX descrita en el Capítulo 7. Esa estrategia tuvo
un rendimiento promedio anualizado de alrededor del 13 por ciento y un índice de Sharpe de
1.4 desde el 16 de julio de 2004 al 17 de mayo. 2012. Si el VIX del día anterior es superior a
35, entonces el rendimiento promedio anualizado del día cae a 2.6 por ciento y el índice de
Sharpe a 0.16. Claramente, VIX nos dice que evitemos operar al día siguiente.
Además del VIX, otro indicador de riesgo líder de uso común es el diferencial TED. Es la
diferencia entre la tasa de interés con oferta interbancaria de Londres (LIBOR) a tres meses y
la tasa de interés de las letras del tesoro a tres meses, y mide el riesgo de incumplimiento
bancario. En la crisis crediticia de 2008, el diferencial de TED se elevó a un récord de 457
puntos básicos. Dado que el mercado crediticio está dominado por grandes actores
institucionales, presumiblemente están más informados que aquellos indicadores basados
en el mercado de valores donde el instinto gregario de los inversores minoristas contribuye a
su valoración. (El diferencial TED es útil a pesar de la manipulación fraudulenta de las tasas
LIBOR por parte de los bancos para que parezcan más bajas, como descubrieron Snider y
Youle, 2010. Lo que importa es el valor relativo del diferencial TED a lo largo del tiempo, no su
valor absoluto).
Hay otros activos de riesgo que en diferentes momentos han servido como indicadores
de riesgo, aunque tendríamos que probarlos cuidadosamente para ver si son indicadores
adelantados. Estos activos incluyen bonos de alto rendimiento (representados, por ejemplo,
por ETF HYG) y monedas de mercados emergentes como el peso mexicano (MXN). Durante
la crisis de la deuda europea de 2011, el MXN se volvió particularmente sensible a las malas
noticias, a pesar de que la economía mexicana se mantuvo saludable en todo momento. Los
comentaristas atribuyeron esta sensibilidad al hecho de que los operadores están usando el
MXN como un proxy para todos los activos de riesgo en general.
Más recientemente, los operadores también pueden ver el ONN y OFF del ETF. ONN sube
cuando el mercado está en un estado de ánimo de "riesgo"; es decir, cuando se suben los
precios de los activos de riesgo. ONN básicamente tiene una canasta de activos riesgosos.
OFF es solo la imagen especular de ONN. Por lo tanto, un valor alto de APAGADO puede ser
un buen indicador de riesgo adelantado. En el momento de escribir este artículo, estos ETF
tienen solo unos siete meses de historia, por lo que no hay suficiente evidencia para
confirmar que tienen valor predictivo.
Como mencionamos en la sección sobre comercio de alta frecuencia en el Capítulo 7, en

escalas de tiempo cortas, aquellos que tienen acceso a la información del flujo de pedidos
pueden detectar un cambio grande y repentino en el flujo de pedidos, lo que a menudo indica
TRADUCCIÓN 139
que ha entrado información importante. la posesión de comerciantes institucionales. Este

gran cambio en el flujo de pedidos es negativo si el activo en cuestión es riesgoso, como
acciones, materias primas o divisas de riesgo; es positivo si el activo es de bajo riesgo, como
los bonos del Tesoro de EE. UU. o USD, JPY o CHF. Como aprendimos antes, el flujo de
pedidos es un predictor de cambios futuros de precios (Lyons, 2001). Por lo tanto, el flujo de
pedidos se puede utilizar como un indicador adelantado de riesgo a corto plazo antes de que
la información se disperse más ampliamente en el mercado y haga que el precio cambie más.
También existen indicadores de riesgo que son muy específicos de una estrategia. En el
Capítulo 4 mencionamos que el precio del petróleo es un buen indicador de riesgo adelantado
para el par de operaciones GLD frente a GDX. Los precios de otras materias primas, como el
del oro, también pueden ser buenos indicadores de riesgo para la negociación de pares de
ETF para los países o empresas que los producen. De manera similar, el Baltic Dry Index
puede ser un buen indicador adelantado para los ETF o las monedas de los países orientados
a la exportación.
Sin embargo, debería concluir con un problema con el backtesting de los principales
indicadores de riesgo. Dado que la ocurrencia de crisis o pánico financiero es relativamente
rara, es muy fácil caer víctima del sesgo de espionaje de datos cuando intentamos decidir si
un indicador es útil. Y, por supuesto, ningún indicador financiero puede predecir desastres
naturales y otros desastres no financieros. Como el indicador de flujo de pedidos funciona
con una frecuencia más alta, puede resultar el más útil de todos.
• Maximización de la tasa de crecimiento a largo plazo:
• ¿Su objetivo es maximizar su patrimonio neto a largo plazo? Si es así, considere usar el
apalancamiento óptimo de media Kelly.
• ¿Son los retornos de su estrategia de cola gruesa? Es posible que desee utilizar
simulaciones de Monte Carlo para optimizar la tasa de crecimiento en lugar de confiar en la
fórmula de Kelly.
• Teniendo en cuenta el sesgo de búsqueda de datos, a veces puede optimizar

directamente el apalancamiento en función de la tasa de crecimiento compuesta de los
rendimientos de sus backtest.
• ¿Quiere asegurarse de que su reducción no supere un máximo preestablecido y, al

mismo tiempo, disfrute de la tasa de crecimiento más alta posible? Utilice un seguro de
cartera de proporción constante.
• Detener la pérdida de:

TRADUCCIÓN 140
• El stop loss generalmente reducirá el rendimiento de las pruebas retrospectivas de las

estrategias de reversión a la media debido al sesgo de supervivencia, pero puede prevenir
eventos de cisne negro.
• El stop loss para las estrategias de reversión de la media debe establecerse de modo
que nunca se activen en backtests.
• Stop Loss para las estrategias de impulso forma una parte natural y lógica de tales
estrategias.
• Indicadores de riesgo:
• ¿Quieres evitar periodos de riesgo? Puede considerar uno de estos posibles

indicadores principales de riesgo: VIX, TED spread, HYG, ONN / OFF, MXN.
• Tenga cuidado con el sesgo de búsqueda de datos cuando pruebe la eficacia de los
principales indicadores de riesgo.
• El flujo de pedidos cada vez más negativo de un activo de riesgo puede ser un indicador
de riesgo adelantado a corto plazo.
CONCLUSION
A pesar de que este libro contiene una gran cantidad de estrategias que deberían ser
interesantes y atractivas para los comerciantes independientes o incluso institucionales, no
ha sido una receta de estrategias ni una guía paso a paso para implementarlas. Las
estrategias descritas en este libro sirven sólo para ilustrar la técnica o el concepto general,
pero no se garantiza que carezcan de los mismos escollos que detallé en el Capítulo 1.
Incluso si tuviera que eliminarlos cuidadosamente de los escollos, las buenas estrategias aún
pueden ser víctimas de cambios de régimen. Se invita y anima a los lectores a realizar
pruebas fuera de la muestra sobre las estrategias de este libro para que las vean por sí
mismos.
En lugar de recetas, lo que espero transmitir son las razones más profundas, los
principios básicos, por qué ciertas estrategias deberían funcionar y por qué otras no. Una vez
que comprendemos las ineficiencias básicas de ciertos mercados (por ejemplo, la regresión
a la media, la presencia de retornos de rollo en futuros, la necesidad de reequilibrio al final
del día en fondos negociados en bolsa apalancados [ETF]), en realidad es bastante fácil idear
una estrategia para explotarlos. Esta noción de comprender la ineficiencia primero y
construir una estrategia más tarde es la razón por la que enfaticé las estrategias simples y
lineales. ¿Por qué crear todo tipo de reglas arbitrarias cuando la ineficacia puede ser
TRADUCCIÓN 141
aprovechada por un modelo simple?
La otra noción que quería transmitir es que el enfoque del comercio algorítmico puede
ser bastante científico. En ciencia, formamos una hipótesis, la expresamos como un modelo
cuantitativo y luego la probamos con datos nuevos e invisibles para ver si el modelo es
predictivo. Si el modelo falló con ciertos datos, tratamos de averiguar las razones de los
fallos, quizás agreguemos ciertas variables al modelo e intentamos nuevamente. Este es un
proceso muy similar a cómo deberíamos abordar el comercio algorítmico. Recuerde el par
ETF GLD versus GDX que dejó de cointegrarse en 2008 (consulte el Capítulo 4). Se formó una
hipótesis que tenía que ver con el alto precio del crudo. Cuando se agregó el precio del
petróleo a las variables de entrada, el modelo de cointegración comenzó a funcionar
nuevamente. Este proceso científico es más útil cuando una estrategia tiene un rendimiento
inferior al backtest, y queríamos saber por qué. En lugar de agregar ciegamente más reglas,
más indicadores al modelo y esperar que mejoren milagrosamente el rendimiento del
modelo, debemos buscar una razón fundamental y luego probar cuantitativamente si esta
razón fundamental es válida.
A pesar de los esfuerzos para hacer que el proceso de negociación esté basado en
normas científicas, todavía hay áreas en las que el juicio subjetivo es importante. Por
ejemplo, cuando se avecina un evento importante, ¿confía en que su modelo se comportará
como predijo su backtest, o reduce su apalancamiento o incluso cierra temporalmente el
modelo con anticipación? Otro ejemplo lo ofrece la aplicación de la fórmula de Kelly a una
cartera de estrategias. ¿Debemos asignar capital entre estas estrategias en función del
patrimonio de toda la cartera, de modo que el buen desempeño de algunas estrategias esté
subsidiando el pobre desempeño de otras en el corto plazo? ¿O deberíamos aplicar la
fórmula de Kelly a cada estrategia por sí sola, de modo que desaparezcamos rápidamente
aquellas estrategias que recientemente funcionan mal? Las matemáticas nos dicen que la
primera solución es óptima, pero eso supone que los rendimientos esperados y las
volatilidades de las estrategias no cambian. ¿Se puede realmente decir que tales
expectativas no han cambiado dado un período reciente de severa reducción?
(A primera vista, mi experiencia ha sido que si su modelo ha sobrevivido al backtest

durante períodos estresantes previos, no hay razón para reducir su apalancamiento frente a
la crisis que se avecina. Es mucho mejor comenzar con un modelo más apalancamiento
conservador durante los buenos tiempos que tener que bajarlo en los malos. Como dijo una
vez Donald Rumsfeld, son las "incógnitas desconocidas" las que nos dañarán, no las
"incógnitas conocidas". Desafortunadamente, no podemos cerrar nuestros modelos antes de
que surjan las incógnitas. En el segundo juicio, mi experiencia ha sido que aplicar Kelly a
cada estrategia de forma independiente para permitir que cada una se debilite y muera
rápidamente cuando tiene un rendimiento inferior es más práctico que aplicar la asignación
de activos de Kelly en todas las estrategias).
TRADUCCIÓN 142
Como muestran estos ejemplos, a menudo se necesita un juicio subjetivo porque las
propiedades estadísticas de las series de tiempo financieras no son estacionarias, y la
ciencia realmente solo puede tratar con estadísticas estacionarias. (Estoy usando
estacionario en un sentido diferente de la estacionariedad de las series de tiempo en el
Capítulo 2. Aquí, significa que la distribución de probabilidad de los precios permanece sin
cambios a lo largo del tiempo.) A menudo, cuando encontramos que nuestra experiencia
comercial en vivo difiere de la prueba retrospectiva , no es porque hayamos cometido alguno
de los errores durante el backtesting. Es porque ha habido un cambio fundamental en la
estructura del mercado, un cambio de régimen, debido a cambios regulatorios o
macroeconómicos del gobierno. Por lo tanto, los administradores de fondos aún tienen un
papel activo y continuo incluso si la estrategia es supuestamente algorítmica y automatizada;
su papel es hacer juicios juiciosos de alto nivel basados en su comprensión fundamental de
los mercados sobre si los modelos siguen siendo válidos.
Sin embargo, el hecho de que a veces se necesite juicio no significa que el desarrollo de
reglas cuantitativas sea inútil o que los operadores algorítmicos sean menos "inteligentes"
que los operadores discrecionales. Como escribió el frecuentemente citado Daniel
Kahneman, los expertos son uniformemente inferiores a los algoritmos en todos los dominios
que tienen un grado significativo de incertidumbre o imprevisibilidad, desde decidir los
ganadores de los partidos de fútbol hasta predecir la longevidad de los pacientes con cáncer.
Cabe esperar que el mercado financiero no sea una excepción a esta regla.
Todos los ejemplos de este libro se basan en códigos MATLAB y todos están disponibles
para su descarga en www.wiley.com/go / algotrading (contraseña: chan2E). Una vez
redirigido al sitio web con los códigos, se le pedirá otro nombre de usuario y contraseña, use
"kelly" para ambos. Los lectores que no estén familiarizados con MATLAB pueden querer
estudiar el tutorial en Quantitative Trading o ver los seminarios web gratuitos en
www.mathworks.com. Además, ocasionalmente se utilizó MATLAB Statistics Toolbox.
(Todos los productos de MATLAB están disponibles como pruebas gratuitas en MathWorks).
Para obtener más información del autor sobre el tema del comercio algorítmico y más,
visite www.epchan.com o http://epchan.blogspot.com.
INDEX
Referencias
Arnuk, Sal L., and Joseph C. Saluzzi. Broken Markets: How High Frequency Trading and
Predatory Practices on Wall Street Are Destroying Investor Coni - dence and Your Portfolio.
TRADUCCIÓN 143
Upper Saddle River, NJ: FT Press, 2012. Beckert, Walter. Course notes on Financial
Econometrics, Birkbeck University of London, 2011. Available at www.ems.bbk.ac.uk/for
_students/bsc_FinEcon/i n_economEMEC007U/adf.pdf.
Bernard, Victor L., and Jacob K. Thomas. “Post-Earnings-Announcement Drift: Delayed Price
Response or Risk Premium?” Journal of Accounting Research 27 (1989): 1–36.
Berntson, M. “Steps in Signii cance/Hypothesis Testing Using the Normal Distribution.”

Course notes for Introduction to Sociology, Grinnell College, 2002. Available at
http://web.grinnell.edu/courses/sst/s02 /sst115-03/practice/hypothesisteststeps1.pdf.
Bollen, Johan, Huina Mao, and Xiao-Jun Zeng. “Twitter Mood Predicts the Stock Market,”
2010. Available at http://arxiv.org/pdf/1010.3003.pdf.
Bryant, Martin. “Investment Fund Set to Use Twitter to Judge Emotion in the Market,” The
Next Web, December 16, 2010. Available at http://
thenextweb.com/uk/2010/12/16/investment-fund-set-to-use -twitter-to-judge-emotion-in-the-
market/.
Buy the Hype, “The ‘Twitter Hedge Fund’ Has an Out-of-Sample Experi- ence,” Buy the Hype
(blog), May 3, 2012. Available at http://sellthenews
.tumblr.com/post/22334483882/derwents-performance.
Chan, Ernest. Quantitative Trading: How to Build Your Own Algorithmic Trading Business.
Hoboken, NJ: John Wiley & Sons, 2009.
Cheng, Minder, and Ananth Madhavan. “The Dynamics of Leveraged and In- verse Exchange-
Traded Funds.” Journal of Investment Management, Winter 2009. Available at SSRN:
http://ssrn.com/abstract=1393995.
Clare, Andrew, and Roger Courtenay. “What Can We Learn about Monetary Policy
Transparency from Financial Market Data?” Economic Research Centre of the Deutsche
Bundesbank, 2001. Available at www.olsen .ch/i
leadmin/Publications/Client_Papers//200102-ClareCourtenay -
WhatLearnMonetaryPolTransparencyFinMkts.pdf.
Coval, Joshua, and Erik Staf ord. “Asset Fire Sales (and Purchases) in Equity Markets.”
Journal of Financial Economics 86 (2007): 479–512. Available at www.people.hbs.edu/estaf
ord/Papers/AFS.pdf.
Daniel, Ken, and Tobias Moskowitz. “Momentum Crashes.” Preprint, 2011. Available at
TRADUCCIÓN 144
www.columbia.edu/~kd2371/papers/unpublished /mom4.pdf.
Dever, Michael. Jackass Investing. Thornton, PA: Ignite LLC, 2011.
Dueker, Michael J., and Christophe r J. Neely. “Can Markov Switching Models Predict Excess
Foreign Exchange Returns?” Federal Reserve Bank of St. Louis Working Paper 2001-021F,
2001. Available at http://research .stlouisfed.org/wp/2001/2001-021.pdf.
Dupoyet, Brice, Robert T. Daigler, and Zhiyao Chen. “A Simplii ed Pricing Model for Volatility
Futures.” Journal of Futures Markets 31, no. 4 (2011): 307–339. Available at www2.i
u.edu/~dupoyetb/vix_futures.pdf.
Durbin, Michael. All About High-Frequency Trading. New York: McGraw-Hill, 2010.
Durden, Tyler. “Why the Market Is Slowly Dying,” Zero Hedge (blog), April 14, 2012,
www.zerohedge.com/news/why-market-slowly-dying.
Engle, R. F., and C. W. Granger. “Co-integration and Error-Correction: Rep- resentation,

Estimation, and Testing.” Econometrica 55 (1987): 251–276.
Erb, Claude B., and Campbell R. Harvey. “The Strategic and Tactical Value of Commodity
Futures.” Financial Analysts Journal 62, no. 20 (2006): 69. Available at
http://ciber.fuqua.duke.edu/~charvey/Research
/Published_Papers/P91_The_strategic_and.pdf.
Falkenberry, Thomas N. “High Frequency Data Filtering,” 2002. Available at

www.tickdata.com/pdf/Tick_Data_Filtering_White_Paper.pdf.
Fama, Eugene F., and Marshall E. Blume. “Filter Rules and Stock-Market Trading.” Journal of
Business 39, no. 1 (1966): 226–231. Available at www.e-m-h.org/FaBl66.pdf.
Friedman, Thomas. “A Good Question.” New York Times Op-ed, February 25, 2012.
Gill, Jef . “The Insignii cance of Null Hypothesis Signii cance Testing.” Po- litical Research
Quarterly 52, no. 3 (1999): 647–674. Available at
www.artsci.wustl.edu/~jgill/papers/hypo.pdf.
Greenblatt, Joel. The Little Book that Beats the Market. Hoboken, NJ: John Wiley & Sons,
2006. Also see magicformulainvesting.com.
Hafez, Peter A. “Event Trading Using Market Response,” July 22, 2011,
TRADUCCIÓN 145
www.ravenpack.com/research/marketresponsepaperform.htm.
Hafez, Peter A., and Junqiang Xie. “Short-Term Stock Selection Using News Based Indicators,”
May 15, 2012, www.ravenpack.com/research /shorttermstockselectionpaperform.htm.
Harris, Larry. Trading and Exchanges. New York: Oxford University Press, 2003.
Hellström, Jörgen, and Ola Simonsen. “Does the Open Limit Order Book Reveal Information
About Short-run Stock Price Movements?” Umeå Economic Studies, 2006.
Hull, John C. Options, Futures, and Other Derivatives, 3rd ed. Upper Saddle River, NJ: Prentice-
Hall, 1997.
Johnson, Barry. Algorithmic Trading & DMA. London: 4Myeloma Press, 2010.
Kahneman, Daniel. Thinking, Fast and Slow. New York: Farrar, Straus and Giroux. 2011.
Khandani, Amir, and Andrew Lo. “What Happened to the Quants in August 2007?” Preprint,
2007. Available at http://web.mit.edu/alo/www /Papers/august07.pdf.
Kleeman, Lindsay. “Understanding and Applying Kalman Filtering.” Course notes on Robotic
Motion Planning, Carnegie Mellon University, 2007. Available at
www.cs.cmu.edu/~motionplanning/papers/sbp_papers
/integrated3/kleeman_kalman_basics.pdf.
Kozola, Stuart. “Automated Trading with MATLAB-2012.” Webinar, 2012.

www.mathworks.com/matlabcentral/i leexchange/37932-automated -trading-with-matlab-
2012.
Kuznetsov, Jev. “ActiveX vs Java API What’s the Dif erence?” Quantum blog, November 25,
2010, http://matlab-trading.blogspot.ca/2010/11 /activex-vs-java-api-whats-dif erence.html.
LeSage, James P. “Spatial Econometrics,” 1998. Available at www.spatial-

econometrics.com/html/wbook.pdf.
Lo, Andrew W., and A. Craig MacKinlay. A Non-Random Walk Down Wall Street. Princeton, NJ:
Princeton University Press, 2001.
Lo, Andrew W., Harry Mamaysky, and Jiang Wang. “Foundations of Technical Analysis:
Computational Algorithms, Statistical Inference, and Empiri- cal Implementation.” Journal of
Finance 55, no. 4 (2000): 1705–1770. Available at
TRADUCCIÓN 146
http://ideas.repec.org/p/nbr/nberwo/7613.html.
Lyons, Richard. The Microstructure Approach to Exchange Rates. Cambridge, MA: MIT Press,
2001.
Malkiel, Burton. A Random Walk Down Wall Street: The Time-Tested Strategy for Successful
Investing. New York: W. W. Norton, 2008.
Maslov, Sergei, and Mark Mills. “Price Fluctuations from the Order Book Perspective:
Empirical Facts and a Simple Model.” Physica A 299, no. 1–2 (2001): 234–246.
Montana, Giovanni, Kostas Triantafyllopoulos, and Theodoros Tsagaris. “Flexible Least

Squares for Temporal Data Mining and Statistical Arbitrage.” Expert Systems with
Applications 36 (2009): 2819–2830. Avail- able at
www2.econ.iastate.edu/tesfatsi/FLSTemporalDataMining .GMontana2009.pdf.
Moskowitz, Tobias, Hua Ooi Yao, and Lasse Heje Pedersen. “Time Series Momentum.”
Journal of Financial Economics 104, no. 2 (2012): 228–250.
Osler, Carol. “Support for Resistance: Technical Analysis and Intraday Ex- change Rates.”
Federal Reserve Bank of New York Economic Policy Review 6 (July 2000): 53–65.
Osler, Carol. “Currency Orders and Exchange-Rate Dynamics: An Explana- tion for the
Predictive Success of Technical Analysis,” 2001. Forthcom- ing, Journal of Finance. Available
at http://newyorkfed.org/research /staf _reports/sr125.pdf.
Patterson, Scott. The Quants. New York: Crown Business, 2010. Philips, Matthew. “Unlocking
the Crude Oil Bottleneck at Cushing.” Bloomberg Business Week, May 16, 2012. Available at
www.businessweek .com/articles/2012-05-16/unlocking-the-crude-oil-bottleneck-at-
cushing#p1.
Rajamani, Murali. “Data-Based Techniques to Improve State Estimation in Model Predictive

Control.” PhD thesis, University of Wisconsin- Madison, 2007.
Rajamani, Murali R., and James B. Rawlings. “Estimation of the Disturbance Structure from
Data Using Semidei nite Programming and Optimal Weighting. Automatica 45 (2009): 142–
148.
Reverre, Stephane. The Complete Arbitrage Deskbook. New York: McGraw-Hill, 2001.
Rodier, Arthur, Edgar Haryanto, Pauline M. Shum, and Walid Hejazi. “In- traday Share Price
TRADUCCIÓN 147
Volatility and Leveraged ETF Rebalancing.” October 2012. Available at SSRN:

http://ssrn.com/abstract=2161057.
Schoenberg, Ron, and Alan Corwin. “Does Averaging-in Work?” 2010.

www.optionbots.com/DOE/does_averaging_in_work.pdf. Accessed January 10, 2010.
Serge, Andrew. “Where Have All the Stat Arb Proi ts Gone?” Columbia Uni- versity Financial
Engineering Practitioners Seminars, January 2008.
Shankar, S. Gowri, and James M. Miller. “Market Reaction to Changes in the S&P SmallCap
600 Index.” Financial Review 41, no. 3 (2006): 339–360. Available at SSRN:
http://papers.ssrn.com/sol3/papers.cfm?abstract _id=886141.
Simon, David P., and Jim Campasano. “The VIX Futures Basis: Evidence and Trad- ing
Strategies,” 2012. Available at SSRN: http://papers.ssrn.com/sol3 /papers.cfm?
abstract_id=2094510.
Sinclair, Euan. Option Trading: Pricing and Volatility Strategies and Techniques. Hoboken, NJ:
John Wiley & Sons, 2010.
Snider, Connan Andrew, and Thomas Youle. “Does the LIBOR Rel ect Banks’ Borrowing
Costs?” 2010. Available at SSRN: http://papers .ssrn.com/sol3/papers.cfm?
abstract_id=1569603.
Sorensen, Bent E. Course notes on Economics. University of Houston, 2005. Available at

www.uh.edu/~bsorense/coint.pdf. “The Wacky World of Gold.” The Economist, June 2011.
Thorp, Edward. “The Kelly Criterion in Blackjack, Sports Betting, and the Stock Market,” 1997.
Available at www.EdwardOThorp.com.
E rnest Chan is the managing member of QTS Capital Management, LLC, a commodity pool
operator. Ernie has worked for various investment banks (Morgan Stanley, Credit Suisse,
Maple) and hedge funds (Mapleridge, Millennium Partners, MANE) since 1997. He received
his PhD in phys- ics from Cornell University and was a member of IBM’s Human Language
Technologies group before joining the i nancial industry. He was a cofound- er and principal
of EXP Capital Management, LLC, a Chicago-based investment i rm. He is also the author of
Quantitative Trading: How to Build Your Own Algorithmic Trading Business, published by
John Wiley & Sons in 2009, and a popular i nancial blogger at http://epchan.blogspot.com.
Find out more about Ernie at www.epchan.com.

Ernie Chan - Algorithmic Trading - Es

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Ernie Chan - Algorithmic Trading - Es

Cargado por

Copyright:

Formatos disponibles

Accelerating the world's research

Ernie Chan - Trading algorítmico

¿Necesitas citar este ¿Quieres más papeles como este?

translated with Academia.edu 

Ernie Chan - Trading algorítmico

Se extraerán ejemplos de estrategias de reversión de la media a partir de modelos de

En el campo del impulso, comenzamos explicando algunas pruebas estadísticas para el

Siempre he sostenido que es fácil encontrar estrategias publicadas, supuestamente

También he prestado atención a la elección de la plataforma de software adecuada para

Este libro es una continuación de mi libro anterior, Quantitative Trading. Allí, me

Cuando escribí mi primer libro, era un comerciante independiente, aunque había

Mi experiencia en administración de fondos no ha cambiado mi enfoque en el

■ Una nota sobre fuentes y agradecimientos

También he impartido talleres regulares en Londres y Singapur sobre diversos temas en

También tengo el privilegio de haber colaborado con muchos profesionales financieros

Y reducirá o eliminará las posibilidades de cometer los escollos antes mencionados.

■ La importancia del backtesting

A menudo, la rentabilidad de una estrategia depende sensiblemente de los detalles de la

El backtesting de una estrategia publicada le permite realizar pruebas verdaderas fuera

Finalmente, al hacer backtesting de una estrategia nosotros mismos, a menudo

Como enfaticé anteriormente, el desempeño de una estrategia a menudo es muy

■ Errores comunes del backtesting

Sesgo de búsqueda de datos y la belleza de la linealidad

La forma de detectar el sesgo de búsqueda de datos es bien conocida: debemos probar

Si no está dispuesto a descartar un modelo debido a su rendimiento en un conjunto de

Existe un enfoque general para la construcción de estrategias comerciales que puede

Suponga que intentamos predecir el precio mediante una simple extrapolación de la

Encontrará varios ejemplos de modelos de comercio lineal en este libro porque la

donde f (i) es el i-ésimo factor, puede predecir el rendimiento R de mañana mediante

Divisiones de acciones y ajustes de dividendos

De manera similar, cuando una empresa paga un dividendo en efectivo (o en acciones)

Puede encontrar información histórica sobre partidas y dividendos en muchos sitios

Sesgo de supervivencia en la base de datos de existencias

El sesgo de supervivencia es más peligroso para las estrategias de acciones de reversión

Puede comprar datos históricos a precios razonables sin sesgo de supervivencia en

Precios de acciones primarios versus consolidados

Si no tenemos acceso a esos datos, todo lo que podemos hacer es mantener un

Dependencia del lugar de las cotizaciones de divisas

Restricciones de venta corta

Contratos continuos de futuros

esta serie de precios ajustados: (p (T + 1) - p (T)) / (p (T) + q (T + 1) - p (T + 1)) , no (p (T + 1) -

Esta sutileza a la hora de elegir el método de retroajuste correcto es más importante

Precios de cierre de futuros frente a precios de liquidación

En la mayoría de los casos, deberíamos usar el precio de liquidación, porque si hubiera

Si tiene una estrategia de diferencial intradiario o está utilizando precios de futuros

como precios comerciales) es cqgdatafactory.com.

Hay un detalle general en el backtesting de diferenciales entre mercados que no debe

■ Significación estadística del backtesting: prueba de hipótesis

El marco general de la prueba de hipótesis aplicada al backtesting sigue estos pasos:

1. Basándonos en una prueba retrospectiva de una muestra finita de datos, calculamos

El paso de este procedimiento que requiere más reflexión es el paso 3. ¿Cómo

determinamos la distribución de probabilidad bajo la hipótesis nula? Quizás podamos

Otra forma de estimar la distribución de probabilidad de la hipótesis nula es utilizar los

En el ejemplo 1.1, comparo estas tres formas de probar la importancia estadística de un

Ejemplo 1.1: Prueba de hipótesis en una estrategia de impulso de

La segunda prueba de hipótesis implica generar un conjunto de datos de rendimientos

para muestra = 1: 100000

P = randperm (longitud (largos)); No hay una sola muestra de 100.000 en la que el

■ Cuándo no realizar una prueba retrospectiva de una estrategia

Ejemplo 2: Una estrategia de futuros de petróleo crudo a largo plazo arrojó un

Ejemplo 5: Una estrategia de negociación de futuros de E-mini S&P 500 de alta

■ ¿Una prueba retrospectiva podrá predecir los rendimientos

■ Decimalización de las cotizaciones de las acciones de EE. UU. El 9 de abril de 2001.

■ Elección de una plataforma de ejecución automatizada y