Está en la página 1de 24

J. Quant. Anal.

Deportes 2019; 15 (4): 289–312

Edgar Santos-Fernandez *, Paul Wu y Kerrie L. Mengersen

La estadística bayesiana se encuentra con el deporte: una

revisión completa
https://doi.org/10.1515/jqas-2018-0106 1. Introducción
Resumen: Los métodos bayesianos son cada vez más
Las técnicas estadísticas generalmente caen dentro de la categoría
populares en la analítica deportiva. Las ventajas identificadas
“Bayesiana” cuando se basan en el teorema de Bayes, tratan los
del enfoque bayesiano incluyen la capacidad de modelar
parámetros desconocidos de manera probabilística y dan un
problemas complejos, obtener estimaciones probabilísticas y
tratamiento subjetivo a las probabilidades (Bernardo y Smith 2009). Las
predicciones que tengan en cuenta la incertidumbre,
estadísticas bayesianas han ido ganando terreno rápidamente en la
combinar fuentes de información y actualizar el aprendizaje a
ciencia del deporte en los últimos años. Debido a la reciente y gran
medida que se disponga de nuevos datos. El volumen y la
cantidad de artículos bayesianos en la literatura deportiva, estamos
variedad de datos producidos en las actividades deportivas
motivados a revisar algunas de las técnicas y métodos más
durante los últimos años y la disponibilidad de paquetes de
comúnmente utilizados. Las principales preguntas que abordamos son:
software para la computación bayesiana han contribuido
(1) ¿Cuáles son las principales novedades ?, (2) ¿Cuáles son las técnicas
significativamente a este crecimiento. Esta encuesta completa
más populares ?, (3) ¿En qué deportes? y
revisa y caracteriza los últimos avances en las estadísticas
(4) ¿Cuáles son los principales desafíos? Sin embargo, el propósito
bayesianas en el deporte, incluidos los métodos y
del artículo no es establecer una comparación directa entre los
aplicaciones. Encontramos que una gran proporción de estos
métodos frecuentista y bayesiano.
artículos se enfoca en modelar / predecir el resultado de los
Se puede encontrar una amplia gama de técnicas
juegos deportivos y en el desarrollo de estadísticas que
bayesianas en la literatura deportiva. Por ejemplo, modelos
brinden una mejor imagen del desempeño de los atletas. y
jerárquicos bayesianos (por ejemplo, Reich et al. 2006; Albert
beisbol. También resumimos las fuentes de datos utilizadas
2008; Baio y Blangiardo 2010; Miller et al. 2014), regresión
para el análisis y el software más utilizado para el cálculo
bayesiana (BR) (Jensen, Shirley y Wyner 2009b; Albert 2016;
bayesiano. Encontramos un número similar de publicaciones
Deshpande y Jensen 2016; Silva y Swartz 2016; Boys y
entre 2013 y 2018 en comparación con las publicadas en las
Philipson 2018), análisis espacial y espacio-temporal (Jensen et
tres décadas anteriores, lo que es un indicio de la creciente
al. 2009b; Yousefi y Swartz 2013; Miller et al. 2014), Hidden
tasa de adopción de los métodos bayesianos en el deporte.
Markov Models (HMM) ( Franks y col.
Palabras clave: Modelado bayesiano; Regresión bayesiana; ciencia 2015), etc.
deportiva; estadísticas deportivas. La ciencia moderna del deporte se caracteriza y se cuestiona
por el volumen y la variedad de datos disponibles. Buenos
ejemplos de esto son la tecnología de seguimiento de baloncesto
STATS SportVU, el béisbol MLB PITCHf / xy el sistema de golf
ShotLink. Si bien los análisis estadísticos tradicionales se centraron
en los puntos anotados, los promedios y el número de goles, los

* Autor para correspondencia: Edgar Santos-Fernandez, avances recientes en la analítica deportiva consideran temas más
Universidad de Tecnología de Queensland, Facultad de Ciencias e complejos como la interacción de los jugadores en acciones
Ingeniería, Facultad de Ciencias Matemáticas, Bloque Y, Piso 8, ofensivas y defensivas. Ver, por ejemplo, Gudmundsson y Horton
Campus de Gardens Point Universidad de Tecnología de Queensland,
(2017).
GPO Box 2434, Brisbane, Queensland, Australia; y el Centro de
Existen varias ventajas teóricas y computacionales
Excelencia para Fronteras Matemáticas y Estadísticas (ACEMS) del
Australian Research Council (ARC), Victoria, Australia,
para elegir técnicas bayesianas para modelar (Bernardo y
correo electrónico: santosfe@qut.edu.au , Smith 2009; Berger 2013). Más específicamente en el
edgar.santosfdez@gmail.com. https://orcid.org/0000-0001-5962-5417 contexto de los deportes, cada vez más científicos se están
Paul Wu y Kerrie L. Mengersen: Universidad de Tecnología de volviendo bayesianos porque estos métodos permiten:
Queensland, Facultad de Ciencias e Ingeniería, Facultad de Ciencias
1. incorporar información de expertos o creencias previas,
Matemáticas, Brisbane, Queensland, Australia; y el Centro de Excelencia del
2. utilizar el aprendizaje bayesiano donde la distribución posterior
Consejo Australiano de Investigación (ARC) para las fronteras matemáticas
y estadísticas (ACEMS), Victoria, Australia, correo electrónico: actual se convierte en la anterior para los datos futuros,
p.wu@qut.edu.au ; k.mengersen@qut.edu.au 3. proporcionar estimaciones probabilísticas en lugar de puntuales,
290 | E. Santos-Fernandez et al .: la estadística bayesiana se encuentra con el deporte: una revisión completa

4. obtener distribuciones posteriores para los parámetros de Gozó de gran popularidad entre los practicantes de las estadísticas
interés, deportivas durante décadas.
5. incluir variables latentes, La búsqueda comenzó el 05 de enero de 2018 y finalizó el
6. modelar problemas complejos, 31 de agosto de 2018. Nos centramos en artículos y libros
7. integrar y combinar de manera eficiente datos que provienen revisados por pares de revistas en inglés relevantes
de diferentes fuentes, publicados desde 1985 utilizando métodos estadísticos
8. actualizar periódicamente el modelo cuando haya nuevos datos bayesianos para modelar y analizar deportes de equipo e
disponibles, individuales, incluidos baloncesto, béisbol, fútbol, maratón,
9. tratar con eficacia los datos faltantes, natación, triatlón, etc. artículos sobre temas o tecnologías
10. tratar más eficazmente con pequeños conjuntos de datos utilizando relevantes relacionados con estos deportes, incluidas las
información previa para mejorar las estimaciones de los parámetros, tecnologías portátiles y el dopaje. Sin embargo, los juegos de
11. uso de distribuciones no estándar, azar, la visión por computadora y el análisis de video están
12. obtener clasificaciones probabilísticas de jugadores o equipos más allá del alcance de esta revisión.
utilizando las cadenas MCMC, Nos centramos en (1) el método estadístico, (2) los hallazgos y
13. hacer predicciones teniendo en cuenta la las conclusiones más relevantes, (3) el área de aplicación y el tipo
incertidumbre, de deporte, (4) las fuentes de datos, incluida la temporada o
14. capturar información espacial vecina utilizando competición y el país y ( 5) el software que utilizaron para el
distribuciones previas e incorporar dependencia espacial. análisis (si se menciona). Los metadatos de los artículos (por
ejemplo, la afiliación de los autores) se extrajeron de los
El resto del artículo se ha organizado de la siguiente manera. La documentos PDF utilizandoR (R Core Team 2017).
siguiente sección analiza el método que adoptamos para llevar a cabo
la revisión. A continuación, en la sección de resultados, examinamos
varias de estas técnicas bayesianas y luego discutimos los principales
3 resultados
desarrollos experimentados por los deportes relevantes.

En total n = Inicialmente se identificaron 96 artículos a partir de la búsqueda


en la base de datos, mientras que 31 se encontraron a través del proceso de
2 Materiales y métodos para la revisión o fueron identificados por los autores en investigaciones anteriores.

proceso de revisión integral Un total den = Se excluyeron 42 artículos porque se salieron de tema o no
eran bayesianos. La figura 1 muestra el proceso de revisión.

La revisión de la literatura se realizó de acuerdo con las directrices


Los autores de estas publicaciones eran de Estados
PRISMA (Preferred Reporting Items for SystematicReviews and
Unidos (36%), Australia (9%), Reino Unido (8%), Canadá
Meta-Analyzes) (Liberati et al. 2009), con el objetivo de reducir el
(8%), Suecia (8%), Suiza (7%), Brasil. (4%), Alemania (3%),
sesgo de publicación tanto como sea posible. Buscamos en las
Holanda (3%), Japón (3%) y Hong Kong (3%).
bases de datos de Google Scholar, Scopus y PubMed utilizando la
palabra clave: "deporte *" junto con: "Regresión bayesiana",
"Estadísticas bayesianas", "Muestra de Gibbs", "Modelo jerárquico
bayesiano", "Métodos empíricos Bayes", “Modelo de Markov
3.1 Métodos estadísticos bayesianos
oculto”, “Cadena de Markov Monte Carlo” o “MCMC”, “distribución
posterior” y “previa”, “análisis espacial” y “modelado espacio-
Los modelos estadísticos bayesianos se basan en el teorema
temporal”. No se incluyeron otras técnicas relacionadas porque no
de Bayes. La distribución posterior para el parámetro de
son totalmente bayesianas, es decir, no dan un tratamiento
interésθ se obtiene usando:
subjetivo a las probabilidades. Por ejemplo, el ingenuo Bayes se
menciona en los periódicos deportivos y, a pesar de que utilizan la
regla de Bayes, no se da una interpretación subjetiva de la f (θ |z) = ∫ fz |θ) f (θ) (1)
fz |θ) f (θ) dθ
probabilidad (HandandYu 2001) y, por lo tanto, no se consideran
completamente bayesianos. De manera similar, Empirical Bayes dónde f (θ) y fz |θ) son la distribución previa y la probabilidad,
(EBA) no se clasifica como completamente bayesiano porque la respectivamente.
distribución previa generalmente se obtiene a partir de datos Las siguientes subsecciones describen artículos agrupados
observados. Sin embargo, los métodos de la ABE se incluyeron en por técnicas que incluyen modelos de regresión bayesiana y
esta revisión ya que métodos que explican el espacio y el tiempo.
E. Santos-Fernandez et al .: La estadística bayesiana se encuentra con el deporte: una revisión completa | 291

Figura 1: Diagrama de flujo del proceso de revisión integral basado en la metodología PRISMA (Liberati et al. 2009).

3.1.1 Regresión bayesiana (BR) Mengersen et al. Propusieron un enfoque de regresión bayesiana
para los pequeños efectos del tratamiento, que se encuentran
La regresión lineal bayesiana es el modelo de elección más comúnmente en los estudios de rendimiento deportivo.
común al evaluar la asociación entre una respuesta (2016) como una alternativa a la inferencia tradicional basada en
variable y y pag predictores x = (x1, X2, · · ·, Xpag). En el la magnitud sugerida por Batterham y Hopkins (2006). Estos
formulación más simple, autores abordaron el efecto de los regímenes de entrenamiento
en altitud sobre el rendimiento de la carrera y los parámetros
yyo = β1XI1 + β2XI2 + · · · + βkXik + εI (2) sanguíneos (masa de hemoglobina, concentración máxima de
lactato en sangre) en el triatlón. Consideraron G = 3 tratamientos:
dónde yo = 1, 2, · · ·, norte es el número de observación y ε es vivo de tren alto bajo (LHTL), exposición hipóxica intermitente
el residual que se supone que está distribuido normalmente con (IHE) y placebo, y 8 participantes por grupo. Otro predictor en el
media cero y varianza constante σ2. A continuación, los prioritarios modelo (X) fue el cambio (en%) en la carga de entrenamiento
se colocan en el vector de parámetros. β y σ2. Ver Gelman et al. antes y después de cada participante.
(2014) para más detalles. A continuación se dan algunos ejemplos del Dejando I1 y I2 ser valores indicadores para los tratamientos 1 y 2,

uso de este paradigma de modelado. respectivamente, este modelo puede describirse de una manera similar
292 | E. Santos-Fernandez et al .: la estadística bayesiana se encuentra con el deporte: una revisión completa

manera de Eq. (2) o de manera jerárquica equivalente Emplearon el siguiente modelo logístico:
como:
u, B u, CA u, CO tu
logitpagi) = ΘB + + Θpag + Θco + f (x, z) (7)
arriba

( ) ΘCalifornia

yij ∼ norte µij, σ2 j ,


dónde b, ca, co, p y tu son los efectos parciales de la masa,
∑2
µij = β0 + β1X + βj +1Ij (3) receptor, cuenta, lanzador y el árbitro. La ubicación de la cancha
j =1 es dado por F u (x, z). Otros factores como el tipo de
lanzamiento (bola rápida, bola curva, etc.) y la velocidad
donde el I-La observación reside dentro de grupos (j), teniendo también podrían haberse incluido en el modelo de manera
cada grupo una varianza potencialmente diferente. sencilla. En otros ejemplos, Miskin, Fellingham y Florence
En otro ejemplo, Deshpande y Jensen (2016) estimaron las (2010) utilizaron regresión logística para evaluar la importancia de
contribuciones de los jugadores de baloncesto a las probabilidades de varias habilidades en el voleibol y Cafarelli, Rigdon y Rigdon (2012)
ganar de su equipo utilizando una regresión dimensional alta. para obtener la probabilidad de convertir un tercer down en la
sion. DejaryI ser la probabilidad de ganar del equipo local en el National Football League (NFL) en función del número de yardas
Ith turno, donde los turnos son los períodos entre sustituciones restantes.
ciones. Utilizaron la siguiente ecuación de regresión: Otro modelo útil para las variables de respuesta binaria
en la literatura es la regresión probit, que se basa en la
yyo = µ + θhI1 · · · + θhI5 - θaI1 · · · - θaI5 función de enlace probit:

+ τHI - τAyo + σεI (4) pagyo = Φ (β1XI1 + β2XI2 + · · · + βkXik + ε) (8)

dónde µ es la ventaja de la cancha local. Los subíndicesh y donde Φ es la función de distribución acumulativa normal
a representan a los equipos locales y visitantes, respectivamente. La estándar.
θson el efecto del jugador y por lo tanto θhI1 y θaI1 son los La regresión probit fue utilizada por Jensen et al. (2009b)
efectos del jugador 1 en el equipo local y el equipo visitante, para construir un modelo defensivo de béisbol y predecir la
respectivamente. Para cada uno de los 488 jugadores de la liga, probabilidad de captura dada la ubicación del defensor en
adquirido θ estimados. Los parametrosτHI y τAI son el efecto el campo, la v (elocidad de la pelota y la dirección.
parcial asociado con los equipos de local y visitante. definió su modelo como:
σ denota una medida de la variabilidad. El marginal pos- terior
densidades paraθ proporcionar una buena imagen de la pagij = Φ βI0 + βI1Dij + β I2DijFij + βI3DijVij

contribución del jugador a la victoria. )


+ βI4DijVijFij + ε (9)
A menudo, la respuesta yI es una variable binaria que
sigue una distribución de Bernoulli, por ejemplo, si el jugador
Este modelo da la probabilidad de que la pelota j ser
anotado o no. Este caso se aborda con frecuencia utilizando un
atrapado por el jugador I. Aquí, Dij representa la distancia
modelo de regresión logística, que se puede definir como sigue:
recorrida por el jugador y Vij es la velocidad. La variable
Fij es 1 cuando se avanza y 0 en caso contrario. Tenga en cuenta
yI ∼ Berna (pI), (5)
que este modelo considera la interacción entre predictores

logitpagi) = Iniciar sesión(pagI /(1 - pagI))


e incluye una variable categórica. También permite calcular la
contribución del jugador a la defensa en términos de carreras
= β1XI1 + β2XI2 + · · · + βkXik + εI . (6) salvadas, en comparación con el resto de jugadores en la
misma posición.
Aquí, εI representa la variación extra-Bernoulli; Besag y ver La regresión logística multinomial en McFadden
col. (1995) para más detalles. (1973) es un método generalizado para los casos en los que una
Deshpande y Wyner (2017) abordaron el tema del “encuadre” variable de respuesta categorial toma más de dos valores, por
del campo de béisbol desde una perspectiva jerárquica bayesiana ejemplo, los posibles resultados de un tiro en baloncesto. y =
utilizando regresión logística. El término "encuadre" se refiere a {0, 1, 2, 3}. Reich y col. (2006) utilizaron este modelo para
una acción que a menudo realizan los receptores haciendo que un evaluar la relación entre predictores como la fuerza defensiva
lanzamiento se parezca más a un strike. Con el fin de evaluar el del equipo de oposición y jugar en casa o fuera, primera o
impacto del receptor en la decisión, estimaron la probabilidad de segunda mitad, y las variables de respuesta: (1) ubicación al
que un lanzamiento se denomine strike por un incidente y otras disparar, (2) la frecuencia de disparo y (3) ) la efi-
covariables como la ubicación del lanzamiento (x, z), la jarra, etc. eficiencia. DejanyI ser una región en la cancha para un tiro dado
E. Santos-Fernandez et al .: La estadística bayesiana se encuentra con el deporte: una revisión completa | 293

I que sigue una distribución multinomial con parámetro de la variable observada, y. La forma de z determina el tipo de modelo
θ (η), y definieron un predictor empleado: si z es categórico u ordinal, entonces un modelo de Markov
oculto (HMM) es apropiado, mientras que un modelo continuo z
ηyo = Iniciar sesión(A) + xIβ (10) conduce a un modelo de espacio de estados (SSM).
Varios autores han utilizado los HMM (por ejemplo, Albert
dónde A es un vector del área de la sección j, ya que de algunos
1993, Jensen, McShane y Wyner 2009a, Dadashi et al. 2013,
las secciones tienen diferentes áreas. El modelo es luego
Koulis, Muthukumarana y Briercliffe 2014). Dadashi y col.
definido como:
(2013) propuso un HMM para estimar la coordinación del
( ( ) )
tiempo entre manos y pies mediante la estimación de las fases
θj (ηi) = ∑registro exp
pag exp Aj + XI (′A)
(registro β·j+ x ′β . (11) temporales de la natación braza. El modelo utiliza información
l =1 l I ·l)
de tres ejes de unidades de medición inercial (IMU) que se
Véase también Glickman y Hennessy (2015) para ver otro ejemplo llevan puestos en brazos y piernas, y predice
del uso de un modelo logit multinomial para la clasificación de los tres estados ocultos [Q = (q1, q2, q3)] correspondiente al planeo,
competidores en las competiciones de esquí alpino. propulsión y recuperación en movimientos de piernas y brazos.
Los modelos mixtos lineales bayesianos también están en aumento. Normalmente, un modelo HMM se define como λ = (A, B, π),
Revie y col. (2017) consideraron modelos mixtos para mostrar la viabilidad dónde A es la matriz de probabilidad de transición de estado,
de las percepciones de los jugadores (a través de encuestas) para predecir B es la matriz de probabilidad de emisión que relaciona los
los niveles de aptitud física en los casos en que una medición directa de la estados ocultos con las observaciones del sensor portátil y π
aptitud es inconveniente o imposible. es la probabilidad del estado inicial. El modelo HMM se
Los modelos de regresión bayesianos no paramétricos y entrenó mediante el aprendizaje supervisado de un video
semiparamétricos también se han empleado, aunque con anotado por expertos. Los autores informaron que el modelo
menos frecuencia, en el análisis deportivo. Por ejemplo, detectó correctamente las fases el 93,5% de las veces en
Wimmer et al. (2011) para modelar el rendimiento de los brazadas y el 94,4% en piernas. Ver Dadashi et al. (2013) para
puntos en eventos de decatlón asumiendo cuatro habilidades una descripción detallada.
latentes (sprint, salto, lanzamiento y resistencia). Pradier, Ruiz Koulis et al. (2014) para modelar el rendimiento de
y Perez-Cruz (2016) sugirieron otro modelo bayesiano no bateo en el cricket. Utilizaron un enfoque bayesiano con
paramétrico que se basa en un modelo de mezcla de procesos múltiples estados relacionados con el desempeño del
de Dirichlet para modelar el efecto de covariables como la bateador, donde la variable observada es el número de
edad, el género y el entorno en el rendimiento de los carreras producidas por juego. Un HMM bayesiano
corredores de maratón. también fue utilizado por Franks et al. (2015) tomodelos de
Otras técnicas de regresión populares son los modelos log- baloncesto defensivos, donde los estados ocultos son el
lineales. Véase, por ejemplo, Boys y Philipson (2018), que jugador ofensivo custodiado por cada defensor.
emplearon un modelo log-lineal aditivo para clasificar a los Glickman y Stern (1998) sugirieron un enfoque de espacio de
jugadores de cricket, teniendo en cuenta factores como el año y la estado bayesiano para predecir las fortalezas de los equipos de fútbol
edad del jugador. Varios otros modelos log-lineales se discutirán americano utilizando un proceso autoregresivo de primer orden.
en la subsección 3.2.2 de fútbol. Descubrieron que este modelo podía predecir los resultados de los
juegos un poco mejor que el creador de probabilidades de la línea de
apuestas de Las Vegas. Glickman (2001) sugirió una versión no lineal de
3.1.2 Contabilización del tiempo este modelo para evaluar las comparaciones por pares en el fútbol
americano y el ajedrez de la NFL.
El tiempo es un factor crítico en el modelado y análisis de muchos Stephenson y Tawn (2013) y Kovalchik y Albert (2017)
deportes (Kovalchik y Albert 2017). Se sabe que el rendimiento de sugirieron algunos otros enfoques que tienen en cuenta el
los atletas y los equipos cambia durante la temporada e incluso tiempo. Stephenson y Tawn (2013) aplicaron conceptos de la
durante el transcurso de un juego debido a factores como la teoría del valor extremo para modelar los mejores tiempos de
fatiga. A menudo, es interesante analizar factores como la fatiga o carrera anuales en atletismo considerando una tendencia
el impulso que son difíciles o poco prácticos de medir. Un enfoque exponencialmente decreciente. Esto facilita la comparación de
común para dicho análisis a lo largo del tiempo es emplear un atletas que se desempeñaron en diferentes décadas. En tenis,
modelo de espacio de estados (SSM) o un modelo de Markov Kovalchik y Albert (2017) ajustaron los datos temporales (tiempo
oculto (HMM). Ambos modelos asumen que hay una variable de servicio) utilizando un modelo jerárquico bayesiano y las
latente subyacente,z digamos, que gobierna el valor covariables señalan la importancia y la duración del rally anterior.
294 | E. Santos-Fernandez et al .: la estadística bayesiana se encuentra con el deporte: una revisión completa

3.1.3 Contabilización del espacio y el tiempo 3.1.4 Otros métodos

Como se mencionó anteriormente, la tecnología de seguimiento Las variaciones y extensiones de las clases generales de modelos
moderna proporciona la ubicación de los jugadores y la pelota en anteriores también se han utilizado en la analítica deportiva. Por
pequeños intervalos de tiempo regulares. Esto abre la puerta al análisis ejemplo, Swartz, Gill y Muthukumarana (2009) desarrollaron un
espacio-temporal, en el que la cancha (baloncesto), el campo (golf) o el simulador para predecir los resultados de los juegos de cricket de
campo (béisbol) a menudo se discretizan mediante una cuadrícula. Esta un día utilizando un enfoque de variable latente. Ofoghi y col.
cuadrícula es a menudo un cuadrado en los sistemas cartesianos, por (2013) consideraron la selección de atletas de carreras en el omnium
ejemplo, cuadrantes de un pie cuadrado (Miller et al. 2014) o un corte de ciclismo de eventos múltiples utilizando Redes Bayesianas.
en el sistema de coordenadas polares, por ejemplo, Reich et al. Véase también, por ejemplo, Stenling et al. (2015) para el
(2006); Yousefi y Swartz (2013). modelo de ecuación estructural bayesiana (SEM) con aplicación a
En el caso del baloncesto, una tarea común es calcular la la psicología del deporte. Los autores estimaron varios factores
probabilidad de anotar en función de la ubicación. Esto latentes asociados con la regulación del comportamiento del
generalmente produce un mapa de calor de probabilidades atleta medidos con la Escala de Motivación Deportiva. Encontraron
de puntuación. Por ejemplo, Reich et al. (2006) utilizaron la un mejor ajuste a los datos utilizando un enfoque bayesiano en
regresión bayesiana multinomial logit para evaluar la relación comparación con el método tradicional basado en la máxima
entre la ubicación del tiro en la cancha y algunas covariables verosimilitud.
como la presencia de jugadores clave del mismo equipo en la Empirical Bayes es una técnica estadística muy popular en la
cancha, la fuerza defensiva, jugar en casa o fuera, etc. la que la distribución previa en la ecuación. (1) se obtiene a partir de
importancia de estos predictores sobre la frecuencia y la datos observados, por ejemplo, obtenidos de juegos anteriores o
eficiencia de los disparos en diferentes regiones medidos de jugadores con características similares o la misma posición.
utilizando coordenadas polares (la distancia a la canasta y el Esto hace que la ABE se considere pseudo o no completamente
ángulo). Utilizaron condicionalmente autorregresivos (CAR) y bayesiana.
dos anteriores CAR de relación de vecinos para lograr una Los modelos de EBA son generalmente jerárquicos cuando se
superficie más suave tomando prestada información de los supone que el parámetro de interés proviene de una distribución
vecinos. agrupada común. EBA es particularmente útil en parte porque
Shortridge, Goldsberry y Adams (2014), por ejemplo, conduce a cálculos rápidos. Durante décadas, la EBA ha disfrutado
ampliaron esta idea calculando la variabilidad espacial en la de un uso constante en el béisbol para modelar promedios de
puntuación dentro de un marco empírico bayesiano. Utilizaron un bateo Efron y Morris (1973); Brown (2008); Neal y col. (2010); Jiang
enfoque de contracción para obtener una superficie de y col. (2010). Por ejemplo, las estimaciones de los promedios de
probabilidad de puntuación más suave. Los patrones de disparo béisbol de los jugadores con algunos turnos al bate se pueden
espacial también se han modelado utilizando un proceso log- obtener utilizando el promedio de la liga como distribución previa.
Gaussian Cox (LGCP) (Miller et al. 2014; Franks et al. 2015). Véase una discusión ampliada en Robinson (2017). En baloncesto,
También en baloncesto, Cervone et al. (2016) sugirieron el uso de los modelos espaciales de efectividad de tiro se construyen
un modelo autorregresivo condicional para calcular la puntuación comúnmente usando EBA porque se puede obtener una superficie
esperada en función de factores como el jugador en posesión de de intensidad de puntuación suave (por ejemplo, Shortridge et al.,
la pelota, la posición defensiva, etc. Aquí, el CAR a priori da cuenta 2014). Otro ejemplo se puede encontrar en Baker y McHale
de la autocorrelación espacial agregando un efecto aleatorio para (2017) quien recientemente sugirió un enfoque para estimar las
el jugador. Ver Cervone et al. (2016) para más detalles. fortalezas de los jugadores basado en Bayes empíricos.
En béisbol, Jensen et al. (2009b) utilizaron un modelo Finalmente, otra área de interés en la analítica deportiva
jerárquico para estimar la probabilidad de que un jugador es el diseño experimental. Ver, por ejemplo, Glickman
defensivo atrape una pelota considerando, entre otros (2008) quien desarrolló un enfoque de diseño bayesiano localmente
parámetros, la ubicación del jugador. Colocar coordenadas óptimo para competiciones basadas en nocauts.
horizontales y verticales alrededor delzona de anotación se
consideraron para estimar la probabilidad de huelga
Deshpande y Wyner (2017). Yousefi y Swartz (2013) 3.2 Deportes
introdujeron una métrica para el rendimiento del putt de golf
considerando la distancia al pin y el ángulo. Este enfoque Si bien la sección anterior se centró en los métodos y dio
divide el área "verde" en ocho cortes centrados en el pin, ejemplos de deportes en los que se habían empleado esos
donde la probabilidad de puntuación dentro del corte métodos, también es interesante centrarse en los deportes y
depende de la distancia. revisar los métodos que se han empleado. Esta sección
E. Santos-Fernandez et al .: la estadística bayesiana se encuentra con el deporte: una revisión completa | 295

presenta una discusión de este tipo para los tres deportes regresión para predecir el resultado de los juegos de la baloncesto
más comunes en la revisión de la literatura, a saber, NBA.
baloncesto, fútbol, béisbol e incluye temas relevantes como
la racha y el dopaje.
3.2.2 Fútbol

3.2.1 Baloncesto Numerosos estudios han intentado modelar el resultado de


los partidos de fútbol (Rue y Salvesen 2000; Karlis y Ntzoufras
El baloncesto es uno de los deportes más populares, dinámicos y 2008; Baio y Blangiardo 2010). Por ejemplo, Karlis y Ntzoufras
competitivos del mundo. En este juego, dos equipos de jugadores (2008) utilizaron una distribución de diferencias de Poisson
interactúan en diferentes lugares de la cancha de acuerdo con un para modelar la diferencia de goles en los partidos de fútbol.
conjunto de reglas dado con el objetivo de anotar en la canasta del utilizando datos de la Premier League inglesa. DejarXI y YI
equipo oponente. ser el resultado de los equipos locales y visitantes en el Ith juego.
Uno de los primeros artículos de Reich et al. (2006) utilizaron Definieron una estadística ZI como sigue
la regresión bayesiana multinomial logit para evaluar la relación
entre la ubicación del tiro en la cancha y algunas covariables como Zyo = XI - YI ∼ PD (λ1I , λ2I) (12)
la presencia de jugadores clave del mismo equipo en la cancha, la
donde PD es la distribución de la diferencia de Poisson con tasas
fuerza defensiva, jugar en casa o fuera, etc. La inferencia en este
λ1I y λ2I, que se obtienen utilizando el siguiente log-lineal
trabajo se limitó a un jugador de la NBA (Sam Cassell) durante la
funciones de enlace:
temporada 2003-2004.
La adopción de la tecnología de seguimiento de
Iniciar sesión(λ1i) = µ + H + AHTyo + DAI (13)
jugadores SportVU después de 2010 en la NBA marca un hito
en el análisis de baloncesto. Mejoró los niveles de estadísticas Iniciar sesión(λ2i) = µ + AAyo + DHTI (14)
individuales al capturar (a 25 cuadros por segundo) las
coordenadas de cada jugador (x, y) y la pelotax, y, z). Como dónde µ es un parámetro constante. H es el equipo de casa coef-
resultado, se dispuso de estadísticas detalladas, como la ficiente. A y D son los parámetros para el teamattack y la
distancia recorrida por los jugadores en un juego y la defensa.
velocidad desarrollada al acercarse a la canasta. Baio y Blangiardo (2010) sugirieron algunas mejoras en el
El éxito del trabajo de Goldsberry (2012) sobre el modelado modelo de Karlis y Ntzoufras (2008) para predecir los
espacial de la efectividad del tiro motivó un gran número de resultados de fútbol en el campeonato de la Serie A italiana.
publicaciones en esta área. Véase, por ejemplo, Shortridge et al. Obtuvieron el número de goles de cada equipo utilizando una
(2014) quien sugirió métricas como el número esperado de puntos distribución de Veneno en lugar de modelar la diferencia
por tiro para una ubicación determinada dentro de la cancha como sugirieron Karlis y Ntzoufras (2008). El modelo produce
ofensiva y puntos por encima del promedio de la liga para cada estimaciones de las distribuciones posteriores de ataque y
jugador. defensa.
También se han propuesto otros modelos espaciales que Suzuki y col. (2010) sugirió un modelo bayesiano para
incorporan explícitamente información espacial. Por ejemplo, pronosticar los resultados de la Copa del Mundo de 2006 teniendo
Miller et al. (2014) emplearon un proceso de Cox log-gaussiano en cuenta la Clasificación Mundial de la FIFA. En este enfoque, el
como un previo espacial y lo combinaron con la reducción de número de goles de cada equipo se ajusta utilizando Poisson
dimensiones para obtener las intensidades de tiro de los distribuciones.
jugadores y la identificación de los hábitos de tiro. ( )
Cervone y col. (2016) introdujeron una estadística llamada XAB | λA ∼ Pois (λ RAA R) (15)
valor de posesión esperado (EPV) representado como el número B

esperado de puntos en una determinada jugada ofensiva que un


equipo podría anotar en función del tiempo (de 0 a 25 segundos). XBA | λB ∼ Pois λ RB B RA (dieciséis)

Esta métrica depende del jugador en posesión del balón, su


ubicación, la posición de la defensa, etc. La contribución de los Los valores RA y RB son las calificaciones del equipo A
jugadores a la probabilidad de ganar del equipo fue evaluada por y B, respectivamente. Las distribuciones anteriores paraλA y λB
Deshpande y Jensen (2016) mediante regresión lineal bayesiana. se establecieron como distribuciones Gamma, y el conocimiento experto

modelo. Ver también Lam (2018) que usó un Bayesiano se incorporó mediante elicitación. Este enfoque no
296 | E. Santos-Fernandez et al .: la estadística bayesiana se encuentra con el deporte: una revisión completa

considere otras variables relevantes como las habilidades enfoque no paramétrico. En otro ejemplo, Bendtsen
ofensivas / defensivas. (2017) sugirió redes bayesianas para modelar regímenes
Otros artículos utilizaron métodos bayesianos para evaluar la profesionales.
importancia de las habilidades del jugador (Thomas, Fellingham y
Vehrs 2009), el rendimiento funcional (Carvalho et al.
2017), tiempos óptimos de sustitución (Silva y Swartz 2016). 3.2.4 Otros deportes de equipo

En hockey sobre hielo, Thomas (2006) modeló la probabilidad de


3.2.3 Béisbol puntuación como un proceso de Markov de tiempo continuo, y
Gramacy, Jensen y Taddy (2013) introdujeron un modelo de regresión
En el béisbol se ha utilizado una amplia gama de técnicas logística bayesiana para evaluar el impacto de los jugadores de hockey
bayesianas. La predicción de los promedios de los bateadores ha en la puntuación del equipo. Este último modelo es una alternativa al
fascinado a los investigadores y estadísticos durante mucho enfoque más-menos y se basa en un previo de Laplace para los
tiempo y "varios autores recientemente han abordado el coeficientes de regresión para facilitar la selección de variables, que se
tema" (Neal et al. 2010). Por ejemplo, Efron y Morris (1973); marrón requiere en estos problemas de regresión de alta dimensión
(2008); Neal y col. (2010); Jiang y col. (2010) predijo los caracterizados por una gran cantidad de jugadores. Véase también
promedios del béisbol dentro de un enfoque empírico de Thomas et al. (2013) quien introdujo un método para determinar las
Bayes. En otros ejemplos, Albert (1993, 2008) usó modelos habilidades de los jugadores modelando la tasa de puntuación del
ocultos de Markov para evaluar las rayas entre los bateadores. equipo como un proceso semi-Markov usando funciones de peligro.
Jensen y col. (2009a) utilizaron un modelo jerárquico log-
lineal para predecir el número de jonrones de los jugadores por Giles y col. (2017) utilizaron un modelo de regresión
temporada. La edad, la posición del jugador y el estadio local son bayesiano para evaluar la asociación entre la tenacidad
predictores incluidos en el modelo junto con el rendimiento de mental y la perseverancia conductual que explica la aptitud
temporadas anteriores. Se utiliza un modelo mixto en el término física en los futbolistas australianos. Encontraron asociación
de intercepción para crear grupos de bateadores de jonrones entre estas variables excepto en presencia de fatiga. También
(élite y no élite). La probabilidad de que un bateador sea miembro se pueden encontrar múltiples ejemplos en el cricket. Véase,
del grupo de élite se determina utilizando un modelo de Markov por ejemplo, Damodaran (2006); Brewer (2008); Swartz y col.
oculto. Se demostró que este modelo tiene una mayor precisión (2009); Niños y Philipson (2018).
predictiva que otros métodos de la competencia. McShane y col.
(2011) utilizaron también un modelo bayesiano jerárquico para la
selección de variables de desempeño que describen mejor las 3.2.5 Otros problemas relacionados

habilidades ofensivas.
Una buena defensa es fundamental para ganar partidos. Sin Rayos: Otro grupo de publicaciones abordó el tema de las
embargo, este aspecto es difícil de cuantificar ya que la evaluación rayas (también conocido como el mano caliente
tradicional es bastante subjetiva, lo que dificulta la comparación fenómeno). Digamos, por ejemplo, cuando un jugador de
de la contribución de los jugadores. Jensen y col. (2009b) abordó béisbol muestra un patrón que indica una proporción
este problema utilizando un modelo de regresión probit sustancialmente mayor (que la media) de golpes (éxitos) en un
bayesiano para evaluar la efectividad del fildeador. Calculó la período de tiempo. Se supone que este fenómeno apócrifo lo
contribución del jugador a la defensa en términos de carreras experimentan los atletas durante la temporada y ha sido
salvadas, en comparación con el resto de jugadores que jugaban ampliamente estudiado, entre otros, por Gilovich, Vallone y
en la misma posición. El modelo predice la probabilidad de Tversky (1985); Albright (1993); Bar-Eli, Avugos y Raab
captura dada la ubicación del defensor en el campo, la velocidad (2006).
de la pelota y la dirección hacia la que el fildeador debe moverse Albert (1993), por ejemplo, inspirado en la tesis de
(hacia adelante o hacia atrás). Sería interesante ver una extensión Albright (1993), utilizó cadenas de Markov ocultas de dos
de este análisis considerando las limitaciones del parque de estados, mientras que Albert (2008) empleó el factor de
béisbol. Bayes para detectar cambios no aleatorios en el
Healey (2017) sugirió nuevas estadísticas para el rendimiento de rendimiento de bateo. Wetzels et al. (2016) que analizó las
los jugadores basadas en parámetros de pelota bateada (velocidades, tasas de racha en el baloncesto. Yang (2004) sugirió un
ángulos verticales y horizontales) dentro de la filosofía bayesiana. Las método de segmentación binaria bayesiana para analizar
estimaciones de densidad de probabilidad se obtienen utilizando un éxitos o fracasos consecutivos. Este método
E. Santos-Fernandez et al .: La estadística bayesiana se encuentra con el deporte: una revisión completa | 297

se basa en el factor de Bayes para evaluar el cambio en las Efecto de la edad relativa: El Efecto de edad relativa (RAE)
tasas de éxito. El autor analizó varios eventos populares establece que los niños / atletas que nacieron en los primeros
considerados como el resultado de una racha de meses después del corte del año escolar tienen más posibilidades
desempeño en baloncesto, béisbol y golf. Reich et al. de éxito. Ishigami (2016) utilizó un modelo de regresión bayesiana
(2006) como predictor de la frecuencia y ubicación de los de Poisson para investigar el impacto del RAE y el lugar de
disparos en la cancha de baloncesto. Sin embargo, no nacimiento en las posibilidades de convertirse en atleta
encontraron relación entre ellos. profesional en Japón. El autor informó que aquellos que nacieron
en el primer mes después del corte tenían tres veces más
probabilidades de convertirse en atletas profesionales.

Dopaje: Los estudios antidopaje sobre marcadores biológicos


generalmente se abordan utilizando un enfoque longitudinal
dentro de un marco bayesiano para tener en cuenta la variación 3.3 Software para cálculo bayesiano
dentro y entre atletas. Los elementos de la inferencia bayesiana
son particularmente útiles, desde el enfoque antidopaje de Las técnicas de cálculo bayesiano están incluidas en la mayoría de
referencia basado en la población establecido hasta un sistema de los paquetes de software estadístico. Presentamos un resumen
pasaporte individual. del software más popular para realizar análisis bayesianos en la
Sottas y col. (2006), por ejemplo, sugirió un método para la ciencia de datos deportivos, según los artículos que revisamos
detección de valores anormales de la relación T / E (glucurónido (Figura 2). Para su inclusión, los autores debían indicar claramente
de testosterona / glucurónido de epitestosterona). Este enfoque el nombre del paquete de software empleado.
compara los resultados de la prueba con un umbral de corte En los artículos que revisamos, R fue, con mucho, el software
obtenido mediante la inferencia bayesiana y la población estimada más popular, representando aproximadamente la mitad del total
y la media intraindividual y el coeficiente de variación. Robinson y de menciones. MATLAB (2017),WinBUGS (Lunn y col.
col. (2007) ampliaron este enfoque para la detección de otra droga 2000) y Stan (Stan Development Team 2017) completó los
ilegal (eritropoyetina humana recombinante) y Schulze et al. (2009) cuatro primeros. Curiosamente, el lenguaje Python (Python
agregaron el genotipo (UGT2B17) como predictor en un marco Software Foundation 2017) hasta ahora no parece ser popular
bayesiano sugerido por Sottas et al. (2006) para lograr una mayor entre los científicos deportivos. Los paquetes más
sensibilidad de la prueba. La inferencia bayesiana también es comúnmente mencionados dentro delR el medio ambiente era
utilizada por Van Renterghem et al. (2011) para la detección de MCMCpack (Martin, Quinn y Park 2011) y los rjagsPlummer
testos- 2016), seguido de depmixS4 (Visser y Speekenbrink 2010),
terone basado en nuevos biomarcadores. R2WinBUGS (Sturtz, Ligges y Gelman 2005), rstanStan

48,33%
28
26
24
Software
22
R
20
18 MATLAB
Frecuencia

dieciséis Stan
14 WinBUGS
12 Mplus
10
13,33% Weka
8
10% 10% Otros
6 8,33%
6,67%
4
3,33%
2
0

R MATLAB Stan WinBUGS Mplus Weka Otros

Software

Figura 2: El software más popular utilizado para análisis bayesianos en ciencias del deporte.
298 | E. Santos-Fernandez et al .: la estadística bayesiana se encuentra con el deporte: una revisión completa

Tabla 1: Símbolos y definiciones. Equipo de desarrollo 2018), HiddenMarkov (Harte 2017) y


brmsBürkner 2017).
Símbolo Técnica

BHM Modelado jerárquico bayesiano


BR Regresión bayesiana (por ejemplo, logística, múltiple, etc.)
3.4 Resumen de métodos y aplicaciones
LS Estudios longitudinales
ABE Enfoque empírico bayesiano La variedad y complejidad de las técnicas estadísticas bayesianas

SASTA Análisis espacial y / o espacio-temporal aplicadas a los problemas de las ciencias del deporte han aumentado
TS Series de tiempo sustancialmente en los últimos 15 años. Para obtener una mejor
BN Redes bayesianas comprensión, presentamos un resumen de los artículos de
MMM Modelo de Markov oculto investigación en el Apéndice (Tabla 3). Los agrupamos por deporte
MC Cadena de Markov
(béisbol, fútbol, etc.) o por categoría (dopaje, rayas, etc.). Presentamos
BNP Bayesiano no paramétrico, modelos de supervivencia bayesianos, etc.
los deportes de primer equipo seguidos de los individuales.
Otro Otras técnicas, incluida la estructura bayesiana
La columna método se refiere a una clasificación de la Tabla
modelado de ecuaciones
1. También incluimos las estadísticas paquete de software
utilizado para los cálculos. En el caso de Rpackages, algunos
autores no mencionaron la versión. Por tanto, citamos aquí los
Tabla 2: Tabulación cruzada de la técnica bayesiana contra el
período de publicación. más recientes. La última columna se refiere a las fuentes deldatos
especificando la competencia, la (s) temporada (es) y el tamaño de
A AST BHM BR ABE Otro Suma la muestra si se menciona.
La Tabla de contingencia 2 contiene el uso de la técnica
(1985, 2005) 2 0 1 1 0 4 8
(2005, 2009] 4 5 8 5 2 1 25 estadística a lo largo del tiempo. La columnaContabilización del
(2009, 2013) 1 3 5 5 2 4 20 tiempo (AT) contiene series de tiempo, estudios longitudinales y
(2013, 2018) 4 8 12 13 3 9 49 HMM. Contabilización del espacio y el tiempo (AST) comprenden

Suma 11 dieciséis 26 24 7 18 102 los artículos que consideran la asociación espacial y temporal. La
evolución por año se muestra en la Figura 3.
AT, contabilización del tiempo; AST, teniendo en cuenta el espacio y hora;
BHM, modelos jerárquicos bayesianos; BR, regresión bayesiana; Los modelos jerárquicos bayesianos (BHM) y la regresión
EBA, enfoque bayesiano empírico bayesiana (BR) son las técnicas más populares, seguidas

15

Técnica

AST
10
Contar

BHM

BR

ABE

5 Otro

1988 1991 1994 1997 2000 2003 2006 2009 2012 2015 2018
Año

Figura 3: Evolución de la técnica bayesiana por año.


E. Santos-Fernandez et al .: la estadística bayesiana se encuentra con el deporte: una revisión completa | 299

Deporte
21,05%
dieciséis 19,74% Béisbol

14 Baloncesto

15,79% Fútbol
12 14,47%
Dopaje

10 Grillo
Frecuencia

Hockey sobre hielo


8
Ciclismo
6 6,58%
Golf
5,26%
4 3,95% Natación
2,63% 2,63% 2,63% 2,63% 2,63% Tenis
2
Vóleibol
0 Otros
e

f
to

o
o

ol

s
aj

el
l

s
n
lo

l
l
bo

o
es

hi

bo
o

ni

op

G
is

tr
ril

e
tb

br
nc

Te
cl
is

ac

O
so

le
G
D

Ci

lo

at
ey


Ba

k
oc

N
H

Deporte

Figura 4: Número de artículos sobre cada deporte, incluida la categoría de dopaje. La categoríaotros incluye una mención de los siguientes deportes:
Fútbol americano, atletismo, fútbol australiano, juegos de pelota, decatlón, peso libre, frisbee, maratón, deportes múltiples, paralímpico
deportes, remo, rugby, running, esquí, triatlón y lucha libre.

por métodos que contabilizan el espacio y el tiempo. Las frecuencias realizado sobre los métodos bayesianos en las estadísticas deportivas.
durante el período 2013-2018 son aproximadamente similares a las de Podemos agrupar la mayoría de los artículos revisados según el
1985 a 2013. Esto muestra un tremendo aumento en el uso de problema que intentan resolver de la siguiente manera. Se centran en:
métodos bayesianos. Sin embargo, tenga en cuenta que no conocemos
la tasa de crecimiento de los artículos científicos en estadísticas - identificación de factores o covariables que contribuyen a
deportivas (frecuentistas + bayesianos). puntuar, ganar o a un mejor desempeño,
La figura 4 muestra el número de publicaciones en cada deporte. - previsión y predicción,
Tenga en cuenta que aproximadamente el 50% de las publicaciones se - eficacia espacial y temporal entre y dentro de la
realizaron en tres deportes de equipo (baloncesto, béisbol y fútbol). temporada,
- interacción y dinámica de los jugadores,
- resultados raros inusuales (rachas),
- desarrollo de nuevas métricas,
4. Discusión - ventaja de la cancha local, posesión del balón y evaluación de
los juicios de los árbitros, diseño de torneos,
En los últimos años, un número creciente de publicaciones - las habilidades de los jugadores, clasificaciones, comparaciones de pares

científicas han mostrado los beneficios, el potencial y las de jugadores y contribuciones a sus equipos en entornos de ataque y

limitaciones de la filosofía bayesiana en las estadísticas defensivos,

deportivas (Ivarsson et al. 2015; Gucciardi y Zyphur 2016; - optimización de recursos como sustitución, lista, selección de
Guciardi et al. 2016). ; Mengersen et al.2016). Estos atletas, orden de bateo, ubicación de los jugadores en el
beneficios incluyen la capacidad de modelar problemas campo,
deportivos complejos y hacer predicciones teniendo en - efectividad, resistencia, fortaleza mental de los regímenes de
cuenta la incertidumbre. Al realizar esta revisión, entrenamiento,
encontramos un número sustancial de publicaciones en - visualizaciones y comparación de modelos,
múltiples áreas y aplicaciones que van desde golf, rugby, - tecnología portátil, identificación de actividades y reconocimiento
baloncesto, cricket, etc. de patrones,
Este estudio fue diseñado para proporcionar una - dopaje.
caracterización integral del estado del arte de las estadísticas
deportivas bayesianas como una disciplina de rápida maduración. Encontramos un tremendo desarrollo y una gran proporción
A nuestro leal saber y entender, esta es la revisión más completa. de los artículos que tratan con datos de las principales
300 | E. Santos-Fernandez et al .: la estadística bayesiana se encuentra con el deporte: una revisión completa

ligas deportivas profesionales en los Estados Unidos (MLB y adoptar los principios de la ciencia abierta, por ejemplo, códigos,
NBA), en parte porque estas han estado generando datos de datos y metodología de fuente abierta. Buenos ejemplos del tercer
alta resolución durante muchos años. punto son Cervone et al. (2016) y Mengersen et al.
De manera similar, se identificó mucha más investigación en (2016).
deportes de equipo que en individuales, posiblemente porque los Como sugiere la Figura 4, una gran cantidad de deportes
deportes de equipo son más complejos y estadísticamente más están bastante inexplorados hasta la fecha y el advenimiento de
ricos. Aunque los artículos considerados representan casi todos datos de alta resolución en el futuro próximo atraerá sin duda
los continentes, se concentraron principalmente en los Estados múltiples investigaciones y colaboraciones. Estos conjuntos de
Unidos, Australia, Canadá, el Reino Unido y Suecia. Una pregunta datos de gran tamaño y alta dimensión motivarán y se
en nuestras mentes antes de realizar esta investigación era si beneficiarán del desarrollo de métodos BayesianMCMC más
estas contribuciones eran de científicos deportivos o de eficientes en esta área.
estadísticos. Descubrimos que la mayoría de ellos han sido
aportados por estadísticos y científicos de datos. Como señalaron
Bernards et al. (2017) “la mayoría de los científicos deportivos
5. Conclusión
actuales no están capacitados en métodos bayesianos” (todavía).
Un gran número de estas publicaciones caen dentro del segundo
La revolución bayesiana ha llegado a la analítica deportiva. Desde
criterio de Swartz (2018) para unabuen papel deportivo: “Abordan
2005 ha habido un aumento sustancial en el modelado bayesiano
un problema deportivo real” y, por tanto, se consideran
en los deportes. Encontramos que el número de artículos entre
investigación aplicada.
2013 y 2018 fue similar a los publicados en las tres décadas
Identificamos algunos nichos bien establecidos donde se utilizan
anteriores (1985-2013). Según la revisión, la regresión bayesiana y
intensamente modelos bayesianos específicos. Estos incluyeron
los modelos jerárquicos bayesianos surgieron como las técnicas
modelos longitudinales bayesianos en estudios antidopaje y modelos
más populares, pero otros métodos como el HMM y el análisis
log-lineales para modelar los resultados de los juegos de fútbol y EBA
espacial bayesiano están en aumento. Cada vez más científicos del
para la estimación de promedios de béisbol. Encontramos un gran
deporte están incorporando creencias previas en el modelo y
interés en la búsqueda de los mejores atletas en múltiples deportes,
utilizando distribuciones posteriores para hacer inferencias sobre
por ejemplo, el atletismo (Stephenson y Tawn
parámetros dentro de un paradigma bayesiano. Nuevas fuentes
2013), golf (Baker y McHale 2015), tenis (Baker y McHale
de datos recientes han motivado la exploración de nuevas
2017), ajedrez (Glickman 1999).
metodologías y conocimientos. Similar, Los recientes avances de la
Los métodos bayesianos no son una panacea para todos los
investigación han mejorado la forma en que resumimos y
problemas de análisis de datos. Por ejemplo, tratar con datos
hacemos inferencias sobre los deportes mediante la introducción
deficientes o modelos deficientes tendrá un éxito limitado en el
de nuevas métricas y métodos. Estos avances seguirán siendo
contexto bayesiano, a pesar de que se puede hacer alguna
complementados por la creciente confianza de los científicos del
compensación adoptando un enfoque bayesiano. Muchos de los
deporte para mirar más allá de los límites de la analítica
métodos basados en MCMC pueden ser computacionalmente
tradicional y explorar métodos utilizados en otros campos.
intensivos. Sin embargo, enfoques recientes como el Bayes
variacional proporcionan una aceleración computacional
sustancial (Ruiz y Perez-Cruz 2015; Blei, Kucukelbir y McAuliffe
2017). Otra limitación es la escalabilidad del modelo a problemas Expresiones de gratitud: Esta investigación fue apoyada por
de big data, aunque los últimos avances estadísticos están el Programa de Becas Laureate del Consejo Australiano de
haciendo posible aprovechar las ventajas de la computación Investigación (ARC) y el Centro de Excelencia para Fronteras
paralela moderna (Angelino, Johnson y Adams 2016; Minsker et al. Matemáticas y Estadísticas (ACEMS) y por el proyecto
2017). “Aprendizaje Bayesiano para la Toma de Decisiones en la Era
Algunos desafíos para la investigación futura son (1) lidiar con de Big Data” (ID: FL150100150 ). Primer investigador: D. Prof.
conjuntos de datos cada vez más complejos mientras se exponen los Kerrie Mengersen. Gracias a Jacinta Holloway que ayudó en la
métodos / aplicaciones para una audiencia sin una base estadística selección de los trabajos. También agradecemos al Dr. Richard
profunda, (2) la creación de herramientas listas para usar Boys por sus perspicaces comentarios durante las primeras
por ejemplo, aplicaciones brillantes, que permiten a los practicantes y entusiastas etapas del artículo. Los autores declaran no tener conflictos
del deporte implementaciones y análisis fáciles, y (3) posiblemente de intereses.
E. Santos-Fernandez et al .: la estadística bayesiana se encuentra con el deporte: una revisión completa | 301

Apéndice

Resumen de métodos y aplicaciones

Tabla 3: Resumen de publicaciones incluidas en la revisión.

Autor (es) Método Descripción Paquete de software Deporte Datos

Reich y col. BR, Regresión multinomial logit para evaluar la R Baloncesto datos de la tabla de tiros de la
(2006) BHM, relación entre la ubicación del disparo y la temporada 2003-2004 de la NBA
SASTA frecuencia (variables de respuesta) y del jugador Sam Cassell

predictores como bloqueos defensivos, (Minnesota Timberwolves)


ventaja de jugar en casa, etc.

Shortridge EBA, Calcula la efectividad espacial del disparo R, ClassInt (Bivand Baloncesto Datos de ESPN de la NBA
et al. SASTA utilizando estimaciones empíricas de tasa 2017), sp (Bivand, (2011-2012) de tiros de campo
(2014) de suavizado bayesiano. Proporciona Pebesma y realizados y fallidos. Usaron las
estimaciones del número esperado de Gómez-Rubio ubicaciones en
puntos por tiros por área en la cancha. 2013), pesos Coordenadas cartesianas de los goles
(Pasek et al. 2016) de campo
Miller y col. BHM, Modelado de intensidad de disparo e R, NMF (Gaujoux Baloncesto Disparos realizados y fallidos
(2014) SASTA identificación de hábitos de disparo de los y Seoighe 2018) obtenidos de los datos de
jugadores mediante un proceso Log Gaussian seguimiento del jugador óptico.
Cox (LGCP). Sugirieron un Temporada de la NBA 2012-2013
Enfoque de reducción de dimensionalidad temporada regular
mediante factorización matricial no negativa
Francos SASTA, Evaluación de la efectividad defensiva Stan Baloncesto Datos de seguimiento óptico de

et al. BR, mediante análisis espacial y espacio-temporal jugadores de la temporada de la NBA

(2015) MMM y HMM 2013-2014. Las ubicaciones de


los jugadores se obtienen de las
cámaras y se registran a 25
fotogramas por segundo Datos
Lamas BHM Inferencia bayesiana para calcular las R, MCMCpack Baloncesto obtenidos mediante vídeo de seis
et al. probabilidades de resultado basadas en (Martin et al. 2011) partidos de play-off de la Liga
(2015) acciones ofensivo-defensivas ACB en España
(2010-2011). n = 1548 dinámica
de creación de espacio (SCD) y
dinámica de protección del
espacio (SPD)
Deshpande BR Modelo de regresión lineal bayesiana para R, monomvn Baloncesto Datos de ESPN jugada por jugada
y Jensen evaluar la contribución de los jugadores a la (Gramacy 2017a) de la NBA (2006–2014)
(2016) probabilidad de ganar del equipo
Cervone SASTA, Cálculo del valor de posesión esperado R, R-INLA Baloncesto Temporada de la NBA 2013-2014

et al. MC (EPV) utilizando un modelo de Markov Datos de seguimiento óptico de

(2016) jugadores de la temporada de la NBA

2013-2014 de STATS LLC.


Proporcionan un conjunto de
datos de juego de muestra (Miami
Heat vs.Brooklyn Nets)
Lam (2018) BR Regresión bayesiana para predecir las Pitón Baloncesto Temporadas de la NBA 2013-2015.
probabilidades de ganar de los equipos en Datos de
función de los juegos pasados y de los jugadores. Baloncesto-Referencia
actuación que consta de 17 métricas, por ejemplo,

goles de campo por minuto,

Goles de campo de 3 puntos


por minuto, etc.
302 | E. Santos-Fernandez et al .: la estadística bayesiana cumple deportes: una revisión completa

Tabla 3 (continuado)

Autor (es) Método Descripción Paquete de software Deporte Datos

Bar-Eli y BF Evaluación de crisis psicológica utilizando - Baloncesto Cuestionario de 28


Tenenbaum la razón de verosimilitud bayesiana expertos en baloncesto
(1988)

Wetzels y col. MMM Modelo de Markov oculto para analizar Ry Baloncesto (1) tiros libres de baloncesto de las
(2016) la tasa de rayado HiddenMarkov y temporadas de la NBA 2005-2010 y
(Harte 2017) psicología (2) una tarea de discriminación
visual (4
Participantes)

Efron y ABE Predicción de promedios de bateo - Béisbol Proporción de hits en los primeros 45
Morris (1973) de béisbol para ilustrar el uso del turnos de catorce jugadores de béisbol
estimador de James-Stein en la temporada de la MLB 1970

Albert (1993) BHM, Estimación de probabilidad de rachas - Béisbol Temporada de la MLB 1988–1989.

MC de aciertos utilizando un modelo de n = 200 jugadores, 100 de cada


Markov de dos estados y un modelo temporada (1988 y 1989), siendo 50
jerárquico bayesiano de cada liga por año

Albert (2008) BHM Evaluación de la racha de golpes - Béisbol Golpes y outs de 287 jugadores de
mediante inferencia bayesiana la temporada 2005 de MLB

Marrón (2008) BHM, Predicción de los promedios de bateo - Béisbol Primera y segunda mitad de la
ABE de béisbol utilizando el enfoque de temporada 2005 en la MLB (número
Bayes empírico y jerárquico de hits y outs)

Jensen y col. BR, Evaluación del rendimiento defensivo del - Béisbol Datos de alta resolución de la ubicación
(2009b) SASTA jugador mediante el enfoque empírico de de las bolas bateadas (temporadas de la
Bayes y la regresión probit MLB 2002–2005) de Baseball Info
Solutions. norte 120.000 ≈

Jiang y col. ABE Promedios de bateo de béisbol - Béisbol número de hits y turnos al bate de la
(2010) utilizando el enfoque empírico de temporada 2005 de MLB. Jugadores
Bayes y modelos lineales con más de 11 turnos al bate

Neal y col. EBA BR Enfoque empírico de Bayes para predecir los - Béisbol Temporada de MLB 2004-2005.
(2010) promedios de béisbol en la segunda mitad de la Datos de hits y turnos obtenidos de
temporada en función de la primera mitad https://www.retrosheet.org/

Jensen y col. BHM Predicción de golpes de jonrones - Béisbol Temporadas de la MLB 1990–2005 de
(2009a) MMM utilizando un modelo jerárquico log-lineal. Lahman Baseball Database.
Usaron un modelo oculto de Markov para n = 10,280 años-jugador
separar a los bateadores en dos
categorías (élite y no élite)

McShane BHM Implementaron un modelo jerárquico de - Béisbol Base de datos de Appelman MLB
et al. (2011) MMM selección de variables bayesianas para una Temporadas 1974-2008. 50 estadísticas
mejor evaluación de las habilidades de los ofensivas (individuales, dobles,
jugadores. jonrones, etc.) den = 8596 temporadas
de jugadores y 1575 jugadores

Albert (2016) BR Modelo de efectos aleatorios para R Béisbol Lahman MLB Baseball Database de
estimar el rendimiento de bateo la temporada 2011.
Ponches, jonrones,
hit-in-play y out-in-play

Ishigami BR; BHM Regresión Bayesiana de Poisson para R, rjags; Stan Béisbol Temporada 2012. 12 equipos
(2016) estimar el efecto del Efecto de la Edad y Nippon Professional Baseball
Relativa (RAE) y el lugar donde nacieron fútbol Organización (NPB); y 198
los atletas jugadores. Liga de fútbol
profesional de Japón (J. League); 277
jugadores
E. Santos-Fernandez et al .: La estadística bayesiana se encuentra con el deporte: una revisión completa | 303

Tabla 3 (continuado)

Autor (es) Método Descripción Paquete de software Deporte Datos

Bendtsen BN Redes bayesianas para modelar R, depmixS4 Béisbol Una muestra aleatoria de 30
(2017) regímenes profesionales (Visser y jugadores que debutaron durante
Speekenbrink 2005 o después obtenida de
2010) www.retrosheet.org

Deshpande BHM, BR Modelo jerárquico bayesiano y R, Stan (Stan Béisbol Coordenadas horizontales y verticales
y Wyner regresión logística bayesiana para Desarrollo obtenidas del conjunto de datos de
(2017) entramado de tono Equipo 2017), seguimiento de tono de alta resolución
rstan (Stan MLB PITCHf / x (temporadas 2011-2015)
Desarrollo
Equipo 2018)

Healey BR Se sugirieron nuevas estadísticas para el R Béisbol HIT f / x (temporada 2014) de MLB
(2017) rendimiento de los jugadores basadas en Sportvision que comprende
los parámetros de la pelota bateada mediciones de más de
(velocidades, ángulos verticales y 100,000 bolas bateadas
horizontales) dentro de la filosofía

bayesiana. Las estimaciones de densidad de


probabilidad se obtienen utilizando un
enfoque no paramétrico

Rue y BR TS Modelo de Poisson logarítmico-lineal dinámico Biblioteca LAPACK Fútbol Premier League y división 1
Salvesen para predecir los resultados de los juegos. Este (Anderson y col. durante 1993-1995 y
(2000) enfoque dependiente del tiempo 1999) Temporadas 1997-1998
considera las fortalezas de ataque y
defensa de los equipos y un
efecto psicológico

Karlis y BHM Modelado bayesiano de las diferencias de R, WinBUGS Fútbol goles / partido anotados en la
Ntzoufras coincidencia utilizando la distribución de (Lunn et al. Premiership inglesa por los 20
(2008) diferencias de Poisson 2000) equipos en la temporada
2006-2007

Baio y BHM Modelo de efecto aleatorio log-lineal R, WinBUGS Fútbol goles / partido marcado en el
Blangiardo bayesiano para predecir resultados de fútbol campeonato de la Serie A
(2010) italiana. Temporadas 1991-1992
y 2007-2008. 20 equipos

Suzuki BR Modelo de Poisson log-lineal bayesiano para - Fútbol goles marcados por cada uno de los 32
et al. predecir los resultados de los partidos en función equipos que compiten en la Copa
(2010) de las opiniones de los expertos y las Mundial de Fútbol de 2006
clasificaciones del equipo

ShahtahmassebBIHM Distribución de diferencias de Poisson R Fútbol Goles marcados en la Serie A


y generalizada (GPDD) para modelar italiana (2012-2013) obtenidos de
Moyeed diferencias de objetivos ESPN. 20 equipos y 380 partidos
(2016)

Koopman TS Análisis de series de tiempo utilizando la Oxmetrics Fútbol Premier League inglesa de fútbol
y encendido distribución de Poisson bivariada para modelar (temporadas 2003-2012). Goles
(2015) las diferencias de objetivos de los equipos marcados en los 3420 partidos

Thomas BR Regresión lineal bayesiana para evaluar MATLAB (MATLAB Fútbol Datos de anotaciones de video de la

et al. la importancia de las habilidades 2017) División I de la Asociación Nacional de


(2009) Atletismo Universitario de Mujeres.

n = 10 juegos

Carvalho LS, BHM Modelo bayesiano multinivel para ajustar el R, brms (Bürkner Fútbol Crecimiento del tamaño corporal y
et al. rendimiento funcional y las curvas de 2017), Stan capacidades funcionales en n = 33
(2017) crecimiento para la masa corporal y la (Stan juveniles menores de 11 años de un
estatura. Desarrollo club de primera división español
Equipo 2017)
304 | E. Santos-Fernandez et al .: la estadística bayesiana se encuentra con el deporte: una revisión completa

Tabla 3 (continuado)

Autor (es) Método Descripción Paquete de software Deporte Datos

Silva y Swartz BR Regresión logística bayesiana para WinBUGS Fútbol Liga Premier Inglesa
(2016) determinar los tiempos óptimos de (2009-2010), la Bundesliga
sustitución alemana (2009-2010), la Liga
española (2009-2010), la Serie A
italiana
(2009-2010), la Major League Soccer
de América del Norte (2010) y la
Copa del Mundo de 2010

Razali y col. BN Redes bayesianas para predecir los Weka (Hall et al. Fútbol Premier League inglesa (EPL)
(2017) resultados de los partidos 2009) (2010-2011, 2011-2012 y
2012-2013). Los datos de los 20
equipos se obtuvieron de http://
www.football-data.co.uk

Swartz y col. BHM Desarrolló un simulador del WinBUGS Grillo 472 juegos que comprenden
(2009) resultado del juego basado en un 257,922 bolas de bolos de la CPI desde

modelo de variable latente bayesiano enero de 2001 hasta julio de 2006

Koulis y col. MMM Poisson HMM para modelar el Grillo Datos históricos de los 20 mejores

(2014) rendimiento de bateo en el cricket. bateadores de ODI clasificados el 7 de julio,

Utilizaron un enfoque bayesiano con 2013, obtenido de


múltiples estados relacionados con el www.espncricinfo.com)
desempeño del bateador, donde la
variable observada es el número de
carreras producidas por juego.

Stevenson y Otro, Utilizando un enfoque de Muestreo anidado Grillo Test Match data (bateadores de
Cervecero (2017) BHM supervivencia bayesiano, evaluaron la implementado en Nueva Zelanda durante las décadas
hipótesis de que batear es una tarea Julia (Bezanson de 1990 y 2000) del sitio web de
más difícil al comienzo del juego. El et al. 2012) Statsguru y Cricinfo
modelo construido permite estimar
las habilidades de bateo durante las
etapas de bateo.

Chicos y BR Modelo logarítmico lineal aditivo para clasificar a R, coda Grillo n = 2855 jugadores de críquet de partidos de

Philipson (2018) los jugadores de críquet, teniendo en cuenta (Plummer et al. prueba desde 1877 hasta agosto de 2017

factores como el año, la edad del jugador, etc. 2006)

Thomas (2006) MC Modeló la probabilidad de puntuación Hockey sobre hielo Anotación manual de 18 juegos del
como un proceso de Markov de tiempo equipo universitario de hockey
continuo masculino de Harvard
(Temporada 2004-2005)

Gramacy y col. BR, Un enfoque para evaluar el impacto del R; reglogit Hockey sobre hielo Jugadores en el hielo de los juegos
(2013) BHM desempeño de los jugadores en la Gramacy (2017b) de las temporadas 2007-2011
puntuación utilizando un modelo de textir (Taddy obtenido de www.nhl.com. Un
regresión logística 2013) total de 1467 jugadores y
18.154 goles registrados

Thomas y col. BHM Tasa de puntuación del equipo como un R y C ++ Hockey sobre hielo Cambios desde la temporada 2007-2008
(2013) proceso semi-Markov usando funciones (NHL) hasta 2011-2012. 30 equipos
de peligro

Glickman y TS Un enfoque de espacio de estado bayesiano - americano Resultados de los 28 equipos en las
Popa (1998) para predecir las diferencias de puntajes de fútbol temporadas 1988-1993 de la Liga

juegos basado en un proceso de Nacional de Fútbol Americano (NFL)


autorregresión de primer orden
E. Santos-Fernandez et al .: La estadística bayesiana se encuentra con el deporte: una revisión completa | 305

Tabla 3 (continuado)

Autor (es) Método Descripción Paquete de software Deporte Datos

Cafarelli BHM, BR Modelos logísticos bayesianos WinBUGS americano yardas para el final, resultado de cada

et al. para modelar la probabilidad de fútbol primer intento por equipo de la temporada

(2012) convertir un tercer down play 2007 de la Liga Nacional de Fútbol

Americano (NFL)

Revie y col. BR, BHM Modelo mixto lineal bayesiano y máquina R Sindicato de rugby Cuestionario de 38
(2017) de vectores de apoyo (SVM) para modelar jugadores profesionales de enero a
la aptitud de los jugadores en función de abril de 2012 y datos de las pruebas de
las percepciones de los jugadores cuando salto de movimiento de contador (CMJ)
las mediciones directas de la aptitud no
son posibles

Miskin BR, MC Evaluación de la importancia de la habilidad - Vóleibol Saque, pase, cava y ataca
et al. del voleibol utilizando cadenas de Markov y durante la temporada
(2010) regresión logística bayesiana. Esto permite competitiva de 2006 de una
obtener puntuaciones de importancia. En el división femenina I
proceso de Markov, la matriz de

probabilidad de transición se obtuvo


utilizando un Dirichlet previo

Mendes BHM, Enfoque jerárquico longitudinal para R, brms, Stan Vóleibol Cuestionario de n = 78 jugadores
et al. LS, BR modelar las horas acumuladas de masculinos de élite de clubes
(2018) voleibol estructurado y otras prácticas brasileños de voleibol
deportivas

Bar-Eli BF Razón de verosimilitud bayesiana para evaluar Juegos de pelota Cuestionario realizado por ochenta atletas
et al. el comportamiento del árbitro en las profesionales masculinos de Israel
(1995) competiciones

Yang BF Método de segmentación binaria RNBIN del Equipo y Secuencia de ensayos de Bernoulli
(2004) bayesiana para analizar las rayas Internacional individuos (victoria / derrota) de Golden State
(éxitos consecutivos o Matemáticas y Deportes: Warriors en la NBA
fallas). Las pruebas del factor de Bayes Biblioteca de estadísticas baloncesto, (2000-2001). Secuencia de victorias o

se utilizan para evaluar el cambio en la béisbol y derrotas de Tiger Woods en los principales

tasa de éxito. golf campeonatos de golf de la PGA

(1996-2001). Patrón de bateo de


jonrones de Barry Bonds en la
temporada 2001 de la MLB

Murray BHM Modelo bayesiano de victorias y derrotas con R Último Resultados 2016 USA
(2017) puntuación aumentada del equipo (frisbee) Ultimate Club Division

Mengersen BR Enfoque de inferencia bayesiana para R, BRugs Triatlón Se midieron tres variables (masa
et al. efectos pequeños como alternativa a (Thomas y col. de hemoglobina,
(2016) la inferencia tradicional basada en la 2006), economía de carrera submáxima
magnitud sugerida por Batterham y R2WinBUGS y concentración máxima de
Hopkins (2006) (Sturtz y col. lactato en sangre) en 24
2005), participantes en 3 grupos (en vivo,
MCMCpack bajo, exposición hipóxica
(Martin y col. intermitente y placebo
2011)

Wimmer BR Utiliza modelos semiparamétricos de R MCMCpack Decatlón 3103 competiciones de los


et al. variables latentes para ajustar los mejores récords de rendimiento
(2011) resultados de rendimiento del decatlón del mundo (1998-2009)
utilizando la edad y el mes de la
competencia como covariables.

Pradier BNP Enfoque de modelos no paramétricos MATLAB Maratón Ciudad de Nueva York (2006-2011,
et al. bayesianos (BNP) para modelar el 249.899 corredores), maratones
(2016) rendimiento de los corredores de maratón de Boston y Londres (2010-2011,
117.255 corredores)
306 | E. Santos-Fernandez et al .: la estadística bayesiana se encuentra con el deporte: una revisión completa

Tabla 3 (continuado)

Autor (es) Método Descripción Paquete de software Deporte Datos

Stephenson Otro Inferencia bayesiana basada en métodos de Atletismo Mejores tiempos anuales masculinos /
y Tawn valores extremos para identificar el mejor femeninos en eventos de pista de distancia
(2013) rendimiento del atleta asumiendo una tendencia olímpica (100 m, 200 m, etc.)
decreciente exponencial 1908-2010

Dadashi MMM Fases temporales de natación modeladas - Natación 7 nadadores bien entrenados (4
et al. usando HMM (seno- hombres y 3 mujeres) equipados
(2013) carrera) con inercial portátil
unidades de medida

Dadashi, BR Enfoque bayesiano para estimar la - Natación Ocho nadadores profesionales y


Mijo y velocidad de nado de ciclos utilizando (seno- siete nadadores recreativos con
Aminiano datos de tecnología portátil carrera) IMU
(2015)

Kovalchik BHM Modelo jerárquico bayesiano de rutina de R, rjags Tenis 175 partidos del Abierto de Australia
y Albert servicio (tiempo de servicio) considerando la (Plummer 2016) 2016 con multicámara Hawk-Eye
(2017) importancia del punto de las covariables y la
duración del rally anterior. Punto

Panadero y ABE Extensión del modelo empírico de Bayes para - Tenis Grand Slams (1968-2016),
McHale estimar las fortalezas de los jugadores 21,921 partidos y 1123
(2017) jugadores

Glickman BHM Modelo logit multinomial para la R, rjags Esquiar Competiciones femeninas de
y clasificación de competidores basado en descenso alpino (2002-2013)
Hennessy la distribución de valor extremo
(2015)

Usami LS Método longitudinal bayesiano para - Sumo 10 luchadores de la Asociación de


(2017) comparaciones pareadas basado en el lucha Sumo de Japón (2005-2009)
modelo de Bradley-Terry

Ofoghi BN Selección de atletas de carreras utilizando Weka Ciclismo Campeonato de Australia 2009,
et al. técnicas de aprendizaje automático y redes (omnium) Campeonato del Mundo
(2013) bayesianas en el omnium de ciclismo de 2007-2010, las Copas del Mundo UCI
múltiples eventos (2010-2011) y los Campeonatos de
Oceanía 2010

Yousefi SASTA, Modelo espacial bayesiano para estimar - Golf Datos de ShotLink del PGA Tour 2012
y Swartz BHM el número esperado de putts dentro del
(2013) green según la distancia al hoyo y el
ángulo. Este enfoque, basado en una
distribución de Poisson truncada, permite
evaluar el putt

contabilidad del rendimiento para la


dificultad de los putts

Vetter, Yu, BR, Regresión bayesiana para evaluar el R Varios Datos combinados de 34 estudios
y Foose BHM impacto de varios predictores (edad, entre 1984 y 2015
(2017) capacidad, entrenamiento e intensidad) en
los resultados del entrenamiento en cuatro
tipos de ejercicio (fuerza muscular,
velocidad, potencia y cardiorrespiratorio)

Percy BHM Método de contracción bayesiano para Sobresalir Paralímpico Finales de carrera de 100 m
(2013) handicap de clase (que permite a los atletas Deportes femeninos y natación estilo libre de
competir en igualdad de condiciones). Este 100 m masculino. Juegos
método permitiría reducir la gran cantidad Paralímpicos de Pekín 2008
real de clases de handicap (a menudo con
solo unas pocas
competidores) agrupando a los
competidores en un número menor
de clases
E. Santos-Fernandez et al .: la estadística bayesiana se encuentra con el deporte: una revisión completa | 307

Tabla 3 (continuado)

Autor (es) Método Descripción Paquete de software Deporte Datos

Glickman BR Modelo bayesiano de comparaciones C - Datos simulados


(2008) pareadas en competiciones basadas en
eliminatorias utilizando el

Enfoque de Thurstone-Mosteller. Este


método empareja a los competidores
con el objetivo de maximizar la
probabilidad de que el mejor jugador
avance en la competencia tanto como
sea posible. Dada la fuerza de cada
uno
competidor, el modelo calcula la
probabilidad de que uno derrote al
otro, colocando una normal
multivariante antes de la fuerza

Sottas LS Análisis longitudinal bayesiano de MATLAB (MATLAB Dopaje Dos estudios longitudinales: (1)
et al. muestras de sangre para detectar valores 2017) estudio doble ciego, 17 deportistas
(2006) anormales de un biomarcador y 332 observaciones. (2) 188
muestras de 11 atletas masculinos

Robinson LS Inferencia bayesiana de una muestra de sangre - Dopaje 135 perfiles de sangre de 1039
et al. longitudinal para la detección de dopaje muestras de los tres estudios
(2007) (atletas de élite, aficionados
deportistas y voluntarios)

Schulze LS Modelo bayesiano longitudinal que - Dopaje Muestras de orina en 55 voluntarios


et al. considera la información del genotipo para la varones que tienen uno, dos o
(2009) derivación de los puntos de corte del dopaje ningún alelo del gen UGT2B17

Sottas, LS, BHM Estudio longitudinal de biomarcadores - Dopaje 432 muestras de orina de 28
Saugy y basado en inferencia bayesiana participantes
Saudan
(2010)

camioneta LS Modelo adaptativo basado en inferencia MATLAB Dopaje 42 muestras de orina de seis
Renterghem bayesiana para encontrar nuevos voluntarios varones sanos
et al. biomarcadores que se utilizarán en la
(2011) detección de dopaje

Stenling Otro Analiza el uso de modelos de ecuaciones Mplus (Muthén Múltiple 380 sujetos de escuelas secundarias
et al. estructurales bayesianas en entornos de y Muthén equipo y y equipos deportivos en Suecia
(2015) psicología deportiva ilustrados con datos 1998-2012) individual
de una Escala de motivación deportiva II. Deportes

Informaron un mejor ajuste a la fecha


utilizando este enfoque bayesiano en
comparación con el máximo tradicional

probabilidad

Tamminen Otro Evaluación de la regulación de las Mplus Múltiple n = 451 atletas adolescentes de
et al. emociones utilizando un enfoque de Deportes de equipo 45 equipos en Ontario y
(2016) modelado de ecuaciones estructurales Columbia Británica, Canadá
bayesianas multinivel. Se encontró que la
regulación de las emociones a nivel
personal y de equipo estaba asociada con
el disfrute y el disfrute de los atletas.
compromiso
308 | E. Santos-Fernandez et al .: la estadística bayesiana cumple deportes: una revisión completa

Tabla 3 (continuado)

Autor (es) Método Descripción Paquete de software Deporte Datos

Gucciardi Otro Evaluación de resistencia mental Mplus Múltiple Atletas masculinos y femeninos
et al. autoinformada que tiene en cuenta las individual de Australia (n = 353), China (n =
(2016) diferencias culturales mediante el modelado y equipo 254) y Malasia (n = 341)
de ecuaciones estructurales bayesianas y la Deportes

invariancia de medición aproximada

Josefsson Otro Diseño bayesiano transversal y Mplus Múltiple 172 atletas de élite masculinos y
et al. longitudinal para modelar la Deportes 69 femeninos de Suecia
(2017) atención plena en la rumia y la
regulación de las emociones

Giles y col. BR Regresión bayesiana para evaluar la Mplus australiano 38 futbolistas masculinos de la
(2017) asociación entre tenacidad mental y reglas Liga de Fútbol de Australia
comportamiento fútbol Occidental y la Liga de Fútbol
perseverancia que explica la aptitud Amateur de Australia Occidental
física. Aunque encontraron
asociación entre estas variables, la
tenacidad mental no fue un buen
predictor de la perseverancia conductual
en presencia de fatiga

Referencias Hallazgos de la teoría y la investigación ”. Revista de Ciencias del Deporte


6: 141-149. http://www.tandfonline.com/doi/abs/10.1080/
02640418808729804.
Albert, J. 1993. “Un análisis estadístico de las rachas de golpes en la base-
bola: comentario ". Revista de la Asociación Estadounidense de Estadística
Bar-Eli, M., N. Levy-Kolker, JS Pie y G. Tenenbaum. 1995. “A
Análisis relacionado con la crisis del comportamiento percibido de los
88: 1184-1188.
árbitros en la competencia ". Revista de psicología deportiva aplicada 7: 63–
Albert, J. 2008. "Streaky Hitting in Baseball". Revista de cuantitativa
Análisis en el deporte 4: 1184-1188. 80. Bar-Eli, M., S. Avugos y M. Raab. 2006. “Veinte años de 'Hot

Albert, J. 2016. “Predicciones de componentes mejoradas de bateo y Mano 'Investigación: revisión y crítica ". Psicología del deporte y el

Medidas de lanzamiento ". Revista de análisis cuantitativo en el deporte


ejercicio 7: 525–553.

12: 73–85. Batterham, AM y WG Hopkins. 2006. “Making Meaningful

Albright, SC 1993. “Un análisis estadístico de las rachas de golpes en Inferencias sobre Magnitudes ". Revista internacional de fisiología y

Béisbol." Revista de la Asociación Estadounidense de Estadística rendimiento deportivos 1: 50–57.

88: 1175-1183. Bendtsen, M. 2017. "Regimes in Baseball Players 'Career Data".

Anderson, E., Z. Bai, C. Bischof, LS Blackford, J. Demmel, J. Don- Minería de datos y descubrimiento de conocimientos 31:

garra, J. Du Croz, S. Hammarling, A. Greenbaum, A. McKenney y col. 1580-1621. http://link.springer.com/10.1007/s10618-017-0510-5.

1999.Guía del usuario de LAPACK (tercera edición). Filadelfia, PA, Berger, JO 2013.Teoría de la decisión estadística y bayesiana

EE.UU .: Sociedad de Matemáticas Industriales y Aplicadas. Angelino, E., Análisis. Nueva York: Springer Science & Business Media. Bernardo, JM
MJ Johnson y RP Adams. 2016. “Patrones de y AF Smith. 2009.Teoría Bayesiana. Volumen 405,
Inferencia bayesiana escalable ". Fundamentos y Tendencias® en Inglaterra: John Wiley & Sons.
aprendizaje automático 9: 119–247. Bernards, JR, K. Sato, GG Haff y CD Bazyler. 2017. “Actual
Baio, G. y M. Blangiardo. 2010. “Modelo jerárquico bayesiano para Investigación y prácticas estadísticas en la ciencia del deporte y una

la predicción de los resultados del fútbol ". Revista de estadísticas aplicadas necesidad de cambio ". Deportes (Basilea) 5 (4): 87.

37: 253-264. Besag, J., P. Green, D. Higdon y K. Mengersen. 1995. “Bayesiano


Baker, RD e IG McHale. 2015. “Evolución determinista de Computación y sistemas estocásticos ”. Ciencia estadística
Fortaleza en modelos de comparaciones múltiples: ¿Quién es el mejor 10: 3-41.
golfista? " Revista Escandinava de Estadística 42: 180-196. http: // Bezanson, J., S. Karpinski, VB Shah y A. Edelman. 2012. “Julia:
doi.wiley.com/10.1111/sjos.12101. Un lenguaje dinámico rápido para la informática técnica ".
Baker, RD e IG McHale. 2017. “Un modelo empírico de Bayes preimpresión de arXiv arXiv: 1209.5145.
para las clasificaciones de comparaciones pareadas que varían en el Bivand, R. 2017. classInt: elija Intervalos de clase univariados. https: //
tiempo: ¿Quién es la mejor jugadora de tenis? ” Revista europea de CRAN.R-project.org/package=classInt, versión del paquete R
investigación operativa 258: 328–333. http://linkinghub.elsevier.com/ 0,1-24.
retrieve / pii / S0377221716306828. Bivand, RS, E. Pebesma y V. Gomez-Rubio. 2013.Aplicado
Bar-Eli, M. y G. Tenenbaum. 1988. “Time Phases and the Análisis de datos espaciales con R. Segunda edicion. Nueva York,
Crisis psicológica individual en la competición deportiva: NY: Springer. http://www.asdar-book.org/.
E. Santos-Fernandez et al .: La estadística bayesiana se encuentra con el deporte: una revisión completa | 309

Blei, DM, A. Kucukelbir y JD McAuliffe. 2017. “Variacional y extensión ". Revista de ciencia y medicina en el deporte
Inferencia: una revisión para estadísticos ". Revista de la Asociación 21: 640–645.
Estadounidense de Estadística 112 (518): 859–877. Gilovich, T., R. Vallone y A. Tversky. 1985. "The Hot Hand in
Niños, RJ y PM Philipson. 2018. “En el ranking de Test Match Baloncesto: sobre la percepción errónea de las secuencias aleatorias ".
Bateadores ". preimpresión de arXiv arXiv: 1806.05496. Psicología cognitiva 17: 295–314.
Brewer, BJ 2008. “Poner la vista en: un análisis bayesiano Glickman, ME 1999. “Estimación de parámetros en Large Dynamic
de salidas anticipadas en Cricket ". preimpresión de arXiv arXiv: 0801. Experimentos de comparación emparejados ". Revista de la Royal
4408. Statistical Society: Serie C (Estadísticas aplicadas) 48: 377–394. Glickman, ME
Brown, LD 2008. “Predicción de promedios de bateo durante la temporada: A 2001. “Modelos de comparación dinámica por pares
Prueba de campo de las metodologías empíricas Bayes y Bayes ”. Los con variaciones estocásticas ". Revista de estadísticas aplicadas
anales de las estadísticas aplicadas 2: 113-152. 28: 673–689.
Bürkner, P.-C. 2017. “brms: un paquete R para multinivel bayesiano Glickman, ME 2008. “Diseño localmente óptimo bayesiano de Knock-
Modelos que utilizan Stan ". Revista de software estadístico 80: 1–28. fuera de los torneos ". Revista de planificación e inferencia estadística
Cafarelli, R., CJ Rigdon y SE Rigdon. 2012. “Modelos para Tercera 138: 2117–2127.
Conversión a la baja en la Liga Nacional de Fútbol ". Revista de Glickman, ME y HS Stern. 1998. “A State-Space Model for
análisis cuantitativo en el deporte 8. Resultados de la Liga Nacional de Fútbol ”. Revista de la Asociación
Carvalho, HM, JA Lekue, SM Gil e I. Bidaurrazaga-Letona. Estadounidense de Estadística 93: 25–35.
2017. “Desarrollo puberal del tamaño corporal y capacidades funcionales Glickman, ME y J. Hennessy. 2015. “Un rango estocástico
específicas del fútbol en jugadores adolescentes”. Investigación en Medicina Modelo de Logit ordenado para clasificar juegos y deportes de
Deportiva 25: 421–436. https://www.tandfonline.com/ doi / full / 10.1080 / múltiples competidores ". Revista de análisis cuantitativo en el deporte
15438627.2017.1365301. 11: 131-144. https://www.degruyter.com/view/j/jqas.2015.11.issue-3/
Cervone, D., A. D'Amour, L. Bornn y K. Goldsberry. 2016. “A Mul- jqas- 2015-0012 / jqas-2015-0012.xml.
tiresolution Modelo de proceso estocástico para predecir los resultados de Goldsberry, K. 2012. “Courtvision: nueva analítica visual y espacial
posesión del baloncesto ". Revista de la Asociación Estadounidense de para la NBA ". en 2012Conferencia de MIT Sloan Sports Analytics.
Estadística 111: 585–599. Gramacy, RB 2017a. monomvn: Estimación para multivariante nor-
Dadashi, F., A. Arami, F. Crettenand, GP Millet, J. Komar, L. Seifert, datos mal y Student-t con ausencias monótonas. https: // CRAN.R-
y K. Aminian. 2013. "Un modelo de Markov oculto de las fases project.org/package=monomvn, versión del paquete R
temporales de natación de brazada de pecho utilizando unidades de 1.9-7.
medida inerciales portátiles". enBody Sensor Networks (BSN), Gramacy, RB 2017b. reglogit: Regularizado basado en simulación
Conferencia Internacional IEEE 2013 sobre, IEEE, 1–6. Dadashi, F., GP Regresión logística. https://CRAN.R-project.org/package= reglogit,
Millet y K. Aminian. 2015. “A Bayesian versión del paquete r 1.2-5.
Enfoque para la estimación generalizada de la velocidad de la braza Gramacy, RB, ST Jensen y M. Taddy. 2013. “Estimating Player
utilizando una IMU portátil ". Computación móvil y generalizada Contribución en Hockey con Regresión Logística Regularizada ”.
19: 37–46. Revista de análisis cuantitativo en el deporte 9: 97-111. Gucciardi,
Damodaran, U. 2006. “Dominancia estocástica y análisis de ODI D. y M. Zyphur. 2016. “Exploratory Structural Equa-
Rendimiento de bateo: El equipo de críquet de la India, 1989-2005 ". Modelado y Estimación Bayesiana ”. enUna introducción a los
Revista de ciencia y medicina del deporte 5: 503. Deshpande, análisis intermedios y avanzados para científicos del deporte y el
SK y ST Jensen. 2016. “Estimación de una NBA ejercicio. Reino Unido: John Wiley & Sons, págs. 172-194.
Impacto del jugador en las posibilidades de ganar de su equipo ".
Revista de análisis cuantitativo en el deporte 12: 51–72. https:// Gucciardi, DF, C.-Q. Zhang, V. Ponnusamy, G. Si y A. Stenling.
www.degruyter.com/view/j/jqas.2016.12.issue-2/ 2016. “Invarianza transcultural del inventario de tenacidad mental
jqas-2015-0027 / jqas-2015-0027.xml. entre atletas australianos, chinos y malasios: un enfoque de estimación
Deshpande, SK y A. Wyner. 2017. “A Hierarchical Bayesian bayesiano”. Revista de psicología del deporte y el ejercicio 38: 187–202.
Modelo de encuadre de tono ". Revista de análisis cuantitativo en el http: // journals.humankinetics.com/doi/10.1123/jsep.2015-0320.
deporte 13: 95-112. Gudmundsson, J. y M. Horton. 2017. “Análisis espacio-temporal de
Efron, B. y C. Morris. 1973. “Combinando estimaciones posiblemente relacionadas
problemas de solución ". Revista de la Royal Statistical Society. Serie B Deportes de equipo." Encuestas de computación de ACM (CSUR) 50:22.

(Metodológica)35: 379–421. Hall, M., E. Frank, G. Holmes, B. Pfahringer, P. Reutemann e IH


Franks, A., A. Miller, L. Bornn, K. Goldsberry. 2015. “Caracterización Witten. 2009. "El software de minería de datos WEKA: una actualización".
la estructura espacial de la habilidad defensiva en el baloncesto Exploraciones SIGKDD 11: 10-18.
profesional ". Los anales de las estadísticas aplicadas 9 (1): 94-121. Hand, DJ y K. Yu. 2001. "Idiot's Bayes, no tan estúpido después de todo?"
Gaujoux, R. y C. Seoighe. 2018.El paquete NMF: páginas del manual. Revisión estadística internacional 69: 385–398. Harte, D. 2017.
https://cran.r-project.org/package=NMF, versión del paquete r HiddenMarkov: Modelos ocultos de Markov. Wellington:
0.21.0. Asociados de Investigación en Estadística. http://www.statsresearch.co.
Gelman, A., JB Carlin, HS Stern, DB Dunson, A. Vehtari y nz / dsh / sslib /, paquete R versión 1.8-11.
DB Rubin. 2014.Análisis de datos bayesianos. Volumen 2, Boca Healey, G. 2017. “Aprender, visualizar y evaluar una
Raton, FL: CRC Press. Modelo del valor intrínseco de una bola bateada ". Acceso IEEE
Giles, B., PS Goods, DR Warner, D. Quain, P. Peeling, KJ 5: 13811-13822.
Ducker, B. Dawson y DF Gucciardi. 2017. “Resistencia mental y Ishigami, H. 2016. “Edad relativa y efecto del lugar de nacimiento en japonés
perseverancia conductual: una réplica conceptual Deportes profesionales: una evaluación cuantitativa utilizando un
310 | E. Santos-Fernandez et al .: la estadística bayesiana se encuentra con el deporte: una revisión completa

Modelo de Poisson jerárquico bayesiano ". Revista de ciencias del Martin, AD, KM Quinn y JH Park. 2011. “MCMCpack: Markov
deporte 34: 143-154. Cadena Monte Carlo en R. " Revista de software estadístico 42:22.
Ivarsson, A., MB Andersen, A. Stenling, U. Johnson y M. Lind- http://www.jstatsoft.org/v42/i09/.
pared. 2015. "Cosas que aún no hemos aprendido (hasta ahora)".Revista MATLAB. 2017. “Lanzamiento de MATLAB and Statistics Toolbox”. La
de psicología del deporte y el ejercicio 37: 449–461. MathWorks, Natick, MA, Estados Unidos. McFadden, D. 1973.Análisis
Jensen, ST, BB McShane y AJ Wyner. 2009a. “Jerarqui- logit condicional de elección cualitativa
Cal modelo Bayesiano del rendimiento de los golpes en el béisbol ". Comportamiento. Frontiers of Econometrics, Nueva York: Academic
Análisis bayesiano 4 (4): 631–652. Press.
Jensen, ST, KE Shirley y AJ Wyner. 2009b. "Bayesball: McShane, BB, A. Braunstein, J. Piette y ST Jensen. 2011. “A
Un modelo jerárquico bayesiano para evaluar el campo en las Enfoque jerárquico de selección de variables bayesianas para las
Grandes Ligas ". Los anales de las estadísticas aplicadas métricas de golpes de las Grandes Ligas ". Revista de análisis
3 (2): 491–520. cuantitativo en el deporte 7: 1–26.
Jiang, W., C.-H. Zhang y col. 2010. “Empirical Bayes In-Season Pre- Mendes, FG, JV Nascimento, ER Souza, C. Collet, M. Milistetd,
dicción de los promedios de bateo de béisbol ". enFortaleza del J. Côté y HM Carvalho. 2018. “Análisis retrospectivo de la práctica
endeudamiento: Teoría que potencia las aplicaciones: un Festschrift para estructurada acumulada: un análisis bayesiano multinivel de
Lawrence D. Brown. Beachwood, Ohio, EE. UU .: Instituto de Matemáticas jugadores brasileños de voleibol de élite”.Estudios de alta capacidad
Estadísticas, págs. 263–273. https://projecteuclid.org/euclid.imsc/ 29 (2): 1–15.
1288099025.
Mengersen, KL, CC Drovandi, CP Robert, DB Pyne y CJ
Josefsson, T., A. Ivarsson, M. Lindwall, H. Gustafsson, A. Stenling,
Sangre. 2016. “Estimación bayesiana de pequeños efectos en el
J. Böröy, E. Mattsson, J. Carnebratt, S. Sevholt y E. Falkevik.
ejercicio y la ciencia del deporte”.Más uno 11: e0147311. http: //
2017. “Mecanismos de atención plena en los deportes: efectos mediadores
dx.plos.org/10.1371/journal.pone.0147311.
de la regulación de la rumia y las emociones en la conducción específica
Miller, A., L. Bornn, R. Adams y K. Goldsberry. 2014. “Factorizado
del deporte”. Consciencia 8: 1354-1363. http://link.springer.com/
Intensidades del proceso puntual: un análisis espacial del baloncesto
10.1007 / s12671-017-0711-4.
profesional ". enConferencia Internacional sobre Aprendizaje Automático,
Karlis, D. e I. Ntzoufras. 2008. “Modelado bayesiano de pie-
págs. 235–243.
Resultados de la pelota: uso de la distribución de Skellam para la
Minsker, S., S. Srivastava, L. Lin y DB Dunson. 2017.
diferencia de goles ". Revista IMA de Matemáticas Administrativas
“Bayes robustos y escalables a través de una mediana de medidas
20: 133-145.
posteriores del subconjunto”. The Journal of Machine Learning Research
Koopman, SJ y R. Lit. 2015. “Un modelo dinámico de Poisson bivariante
18: 4488–4527.
para analizar y pronosticar los resultados de los partidos en la Premier
Miskin, MA, GW Fellingham y LW Florence. 2010. “Habilidad
League inglesa ”. Revista de la Royal Statistical Society: Serie A
Importancia en el voleibol femenino ”. Revista de análisis
(Estadísticas en la sociedad) 178: 167-186. http://doi.wiley.com/
cuantitativo en el deporte 6.
10.1111 / rssa.12042.
Murray, TA 2017. “Clasificación de Ultimate Teams usando un Bayesiano
Koulis, T., S. Muthukumarana y CD Briercliffe. 2014. “A
Modelo de ganancia-pérdida con puntaje aumentado ". Revista de análisis
Modelo estocástico bayesiano para la evaluación del rendimiento de
cuantitativo en el deporte 13: 63–78. http://www.degruyter.com/ view / j /
bateo en críquet de un día ”. Revista de análisis cuantitativo en el
jqas.2017.13.issue-2 / jqas-2016-0097 / jqas-2016-
deporte 10: 1-13.
0097.xml.
Kovalchik, SA y J. Albert. 2017. “Un enfoque bayesiano multinivel
Muthén, L. y B. Muthén. 1998-2012.Guía del usuario de Mplus (7ª ed.).
para modelar el tiempo de servicio en el tenis profesional ".
Los Ángeles, CA: Muthén & Muthén.
Revista de análisis cuantitativo en el deporte 13: 49–62. http: //
www.degruyter.com/view/j/jqas.2017.13.issue-2/jqas-2016- 0091 / Neal, D., J. Tan, F. Hao y SS Wu. 2010. “Simplemente mejor:

jqas-2016-0091.xml. Uso de modelos de regresión para estimar los promedios de bateo

Lam, MW 2018. “Pronóstico de un partido por delante en dos equipos de las Grandes Ligas ". Revista de análisis cuantitativo en el deporte

Deportes con regresiones bayesianas apiladas ". Revista de 6: 1-14.

investigación en inteligencia artificial y computación blanda 8: Ofoghi, B., J. Zeleznikow, C. MacMahon y D. Dwyer. 2013.

159-171. "Apoyo a la selección de atletas y la planificación estratégica en el

Lamas, L., F. Santana, M. Heiner, C. Ugrinowitsch y G. Felling- ciclismo en pista Omnium: un enfoque estadístico y de aprendizaje

jamón. 2015. "Modelado de la interacción ofensiva-defensiva y automático" Ciencias de la información 233: 200–213.

resultados resultantes en el baloncesto".Más uno 10: e0144435. http:// Pasek, J., con la ayuda de Alex Tahk, algunos modelos de código
dx.plos.org/10.1371/journal.pone.0144435. Liberati, A., DG Altman, J. extraído de R-core, Contribuciones adicionales de Gene Culter y M.
Tetzlaff, C. Mulrow, PC Gøtzsche, Schwemmle. 2016.Pesos: ponderación y estadísticas ponderadas.
JP Ioannidis, M. Clarke, PJ Devereaux, J. Kleijnen y https://CRAN.R-project.org/package=weights, paquete R versión
D. Moher. 2009. “Declaración de Prisma para informar revisiones 0.85.
sistemáticas y metaanálisis de estudios que evalúan intervenciones de Percy, DF 2013. “Hándicap genérico para deportes paralímpicos”.
atención médica: explicación y elaboración”.Medicina PLoS 6: Revista IMA de Matemáticas Administrativas 24: 349–361. https: //
e1000100. academic.oup.com/imaman/article-lookup/doi/10.1093/ imaman /
Lunn, DJ, A. Thomas, N. Best y D. Spiegelhalter. 2000. dps013.
"WinBUGS: un marco de modelado bayesiano: conceptos, Plummer, M. 2016. rjags: modelos gráficos bayesianos que utilizan MCMC.
estructura y extensibilidad". Estadística y Computación 10: 325– https://CRAN.R-project.org/package=rjags, paquete R versión 4-6.
337.
E. Santos-Fernandez et al .: La estadística bayesiana se encuentra con el deporte: una revisión completa | 311

Plummer, M., N. Best, K. Cowles y K. Vines. 2006. “Coda: Con- Biomarcadores longitudinales con una aplicación a la relación T / E ”.
diagnóstico de vergencia y análisis de salida para MCMC ". R Noticias Bioestadística 8: 285-296.
6: 7-11. https://journal.r-project.org/archive/. Sottas, P.-E., M. Saugy y C. Saudan. 2010. “Esteroide endógeno
Pradier, MF, FJ Ruiz y F. Perez-Cruz. 2016. “Diseño previo para Elaboración de perfiles en el pasaporte biológico del deportista ”.
Procesos de Dirichlet dependientes: una aplicación al modelado de Clínicas de Endocrinología y Metabolismo 39: 59–73. Equipo de desarrollo
maratones ". Más uno 11: e0147402. Fundación de software Python. de Stan. 2017.La biblioteca Stan Core. http: // mc-
2017.Referencia del lenguaje Python. stan.org.
http://www.python.org. Equipo de desarrollo de Stan. 2018.RStan: la interfaz R para Stan.
Equipo R Core. 2017.R: Un lenguaje y un entorno para la estadística http://mc-stan.org/, paquete R versión 2.17.3. Stenling, A., A.
Computación cal. Viena, Austria: R Foundation for Statistical Ivarsson, U. Johnson y M. Lindwall. 2015.
Computing. https://www.R-project.org/. “Modelado de ecuaciones estructurales bayesianas en el deporte y la
Razali, N., A. Mustapha, FA Yatim y R. Ab Aziz. 2017. “Pre- psicología del ejercicio”. Revista de psicología del deporte y el ejercicio
dictar los resultados de los partidos de fútbol utilizando las redes 37: 410–420. http://journals.humankinetics.com/doi/10.1123/
bayesianas para la Premier League inglesa (EPL) ". Serie de jsep.2014-0330.
conferencias IOP: Ciencia e ingeniería de materiales 226: 012099. Stephenson, AG y JA Tawn. 2013. “Determining the Best
http: // stacks.iop.org/1757-899X/226/i=1/a=012099?key=crossref. Realice un seguimiento de las actuaciones de todos los tiempos utilizando un modelo de

e4dede28b99ccb519dbad2dc125920ef. población conceptual para los récords de atletismo ”. Revista de análisis cuantitativo en el

Reich, BJ, JS Hodges, BP Carlin y AM Reich. 2006. “A deporte 9: 67–76.

Análisis espacial de los datos de la tabla de tiros de baloncesto ". El estadístico Stevenson, OG y BJ Brewer. 2017. “Análisis de supervivencia bayesiana
estadounidense 60: 3-12. de Batsmen en Test Cricket ". Revista de análisis cuantitativo en el
Revie, M., KJ Wilson, R. Holdsworth y S. Yule. 2017. "En modelo- deporte 13: 25–36.
mejorar la aptitud del jugador en el entrenamiento de deportes de equipo con Sturtz, S., U. Ligges y A. Gelman. 2005. "R2WinBUGS: un paquete
aplicación al rugby profesional ". Revista internacional de ciencia y entrenamiento para ejecutar WinBUGS desde R. " Revista de software estadístico
del deporte 12: 183-193. 12: 1-16. http://www.jstatsoft.org.
Robinson, D. 2017. Introducción a Empirical Bayes: ejemplos de Suzuki, AK, LEB Salasar, JG Leite y F. Louzada-Neto.
Estadísticas de béisbol. Gumroad. https://github.com/dgrtwo/ 2010. "Un enfoque bayesiano para predecir los resultados de los partidos:
empirical-bayes-book. la Copa Mundial de Fútbol (Asociación) de 2006". Revista de la Sociedad de
Robinson, N., P.-E. Sottas, P. Mangin y M. Saugy. 2007. Investigación Operativa 61: 1530-1539. https://doi.org/
“Detección bayesiana de valores hematológicos anormales para 10.1057 / jors.2009.127.
introducir una regla de no inicio para poblaciones heterogéneas de Swartz, TB 2018. "¿Dónde debería publicar mi artículo deportivo?" La
atletas”. Hematologica 92: 1143-1144. http: // Estadístico estadounidense 1-6. https://doi.org/10.1080/00031305.
www.haematologica.org/cgi/doi/10.3324/haematol.11182. Rue, H. y 2018.1459842.
O. Salvesen. 2000. “Prediction and Retrospec- Swartz, TB, PS Gill y S. Muthukumarana. 2009. “Mod-
Análisis dinámico de los partidos de fútbol en una liga ”. elling y simulación para críquet de un día ". Revista canadiense de
Revista de la Royal Statistical Society: Serie D (El estadístico) estadísticas 37: 143–160. http://doi.wiley.com/10.1002/cjs.
49: 399–418. 10017.
Ruiz, FJ y F. Perez-Cruz. 2015. “Un modelo generativo para predecir- Taddy, M. 2013. “Regresión inversa multinomial para texto
resultados en el baloncesto universitario ". Revista de análisis Análisis." Revista de la Asociación Estadounidense de Estadística
cuantitativo en el deporte 11: 39–52. 108 (503): 755–770.
Schulze, JJ, J. Lundmark, M. Garle, L. Ekström, P.-E. Sottas, Tamminen, KA, P. Gaudreau, CE McEwen y PR Crocker.
y A. Rane. 2009. "Ventaja sustancial de un enfoque combinado 2016. “Regulación de las emociones interpersonales entre los atletas
bayesiano y genotipado en las pruebas de dopaje de testosterona". adolescentes: un modelo bayesiano multinivel que predice el
Esteroides 74: 365–368. http://linkinghub.elsevier.com/ retrieve / pii / disfrute y el compromiso deportivos”. Revista de psicología del
S0039128X08002870. deporte y el ejercicio 38: 541–555. http://
Shahtahmassebi, G. y R. Moyeed. 2016. “Una aplicación journals.humankinetics.com/ doi / 10.1123 / jsep.2015-0189.
de la distribución de la diferencia de Poisson generalizada Thomas, AC 2006. “El impacto de la posesión y ubicación del disco
para el modelado bayesiano de resultados de fútbol ". sobre la estrategia del hockey sobre hielo ". Revista de análisis cuantitativo en el

Statistica Neerlandica 70: 260-273. http://doi.wiley.com/ deporte 2.

10.1111/ stan.12087. Thomas, A., B. O'Hara, U. Ligges y S. Sturtz. 2006. “Making


Shortridge, A., K. Goldsberry y M. Adams. 2014. “Creando espacio ERRORES abiertos ". R Noticias 6: 12-17. https://cran.r-project.org/doc/
to Shoot: cuantificación de la eficiencia espacial relativa de los goles de campo en el Rnews /.
baloncesto ". Revista de análisis cuantitativo en el deporte 10: 303– Thomas, C., G. Fellingham y P. Vehrs. 2009. “Development
313. https://www.degruyter.com/view/j/jqas.2014.10.issue- 3 / de un sistema de análisis de notación para determinadas habilidades
jqas-2013-0094 / jqas-2013-0094.xml. futbolísticas de un equipo universitario femenino ". Medición en
Silva, RM y TB Swartz. 2016. “Análisis de tiempos de sustitución Educación Física y Ciencias del Ejercicio 13: 108-121. http: //
en el fútbol ". Revista de análisis cuantitativo en el deporte 12: 113– www.tandfonline.com/doi/abs/10.1080/10913670902812770. Thomas,
122. https://www.degruyter.com/view/j/jqas.2016.12.issue-3/ AC, SL Ventura, ST Jensen y S. Ma. 2013. “Com-
jqas-2015-0114 / jqas-2015-0114.xml. Procesar modelos de funciones de peligrosidad para las calificaciones de los
Sottas, P.-E., N. Baume, C. Saudan, C. Schweizer, M. Kamber y jugadores en el hockey sobre hielo ". Los anales de las estadísticas aplicadas 7:
M. Saugy. 2006. “Detección bayesiana de valores anormales en 1497-1524. http://projecteuclid.org/euclid.aoas/1380804804.
312 | E. Santos-Fernandez et al .: la estadística bayesiana se encuentra con el deporte: una revisión completa

Usami, S. 2017. “Modelo de comparación pareada longitudinal bayesiana Wetzels, R., D. Tutschkow, C. Dolan, S. van der Sluis, G. Dutilh,
y su aplicación a datos deportivos mediante Bootstrap de y E.-J. Wagenmakers. 2016. "Una prueba bayesiana para el
probabilidad ponderada ". Comunicaciones en estadística: fenómeno de la mano caliente".Revista de psicología matemática
simulación y computación 46: 1974–1990. https:// 72: 200–209. http://linkinghub.elsevier.com/retrieve/pii/
www.tandfonline.com/ doi / full / 10.1080 / 03610918.2015.1026989. S0022249615000814.
Van Renterghem, P., P. Van Eenoo, P.-E. Sottas, M. Saugy y F. Del- Wimmer, V., N. Fenske, P. Pyrka y L. Fahrmeir. 2011. “Explorando
beke. 2011. "Un estudio piloto sobre el perfil completo de esteroides Rendimiento en competición en Decathlon utilizando modelos de variable
basado en sujetos: nuevos biomarcadores para detectar el uso latente semiparamétrica ". Revista de análisis cuantitativo en el deporte 7:
indebido de testosterona en los deportes".Endocrinología clínica 75: 1–21.
134-140. http: // doi.wiley.com/10.1111/j.1365-2265.2011.03992.x. Yang, TY 2004. “Procedimiento de segmentación binaria bayesiana
Vetter, RE, H. Yu y AK Foose. 2017. “Efectos de Modera- dureza para detectar la racha en los deportes ". Revista de la
tadores en programas de entrenamiento físico: un enfoque bayesiano ". Royal Statistical Society: Serie A (Estadísticas en la sociedad)
The Journal of Strength & Conditioning Research 31: 1868– 167: 627–637. http://doi.wiley.com/10.1111/j.1467-985X.2004.
1878. 00484.x.
Visser, I. y M. Speekenbrink. 2010. “depmixS4: un paquete R Yousefi, K. y TB Swartz. 2013. “Advanced Putting Met-
para modelos ocultos de Markov ". Revista de software estadístico rics en el golf ". Revista de análisis cuantitativo en el deporte 9:
36: 1-21. http://www.jstatsoft.org/v36/i07/. 239–248.

También podría gustarte