Está en la página 1de 15

Citación:

Weaving, D y Beggs, C y Dalton-Barron, N y Jones, B y Abt, G (2019) Visualización de la complejidad del ciclo
de seguimiento del atleta a través del análisis de componentes principales. Revista internacional de
fisiología y rendimiento del deporte, 14 (9). págs. 1304-1310. ISSN 1555-0273 DOI: https://doi.org/10.1123/
ijspp.2019-0045

Enlace al registro del repositorio de Leeds Beckett:


https://eprints.leedsbeckett.ac.uk/id/eprint/6147/

Versión del documento:


Artículo (versión aceptada)

La versión aceptada del manuscrito del autor se reimprimió, con autorización, de International Journal of
Sports Physiology and Performance, 2019, 14 (9): 1304pp-1310pp, https://doi.org/10.1123/ijspp.2019-0045.
©
c Human Kinetics, Inc.

El objetivo del repositorio de Leeds Beckett es proporcionar acceso abierto a nuestra investigación, según lo exigen las políticas de los
financiadores y lo permiten los editores y la ley de derechos de autor.

El repositorio de Leeds Beckett tiene un amplio control Gama de publicaciones, cada una de las cuales ha sido
de derechos de autor y el equipo de embargo periódica ha sido aplicada por los Servicios de Investigación
relevante.

Operamos con una política de desmontaje estándar. Si es el autor o editor de una salida
y le gustaría eliminarlo del repositorio, por favor Contáctenos e investigaremos caso por caso.

Cada tesis en el repositorio ha sido aprobada por el autor cuando es necesario por derechos de autor de
terceros. Si desea que se elimine una tesis del repositorio o cree que hay un problema con los derechos de
autor, comuníquese con nosotros enopenaccess@leedsbeckett.ac.uk e investigaremos caso por caso.
1

Visualización de la complejidad del ciclo de seguimiento del atleta a través del análisis de
componentes principales

Dan Weaving1,2, Clive Beggs1, Nicholas Dalton-Barron1,3,4, Ben Jones1,2,4,5 y Grant Abt6

1 Instituto de Deporte, Actividad Física y Ocio, Leeds Beckett University, Leeds,


West Yorkshire, Reino Unido.
2Leeds Rhinos Rugby League Club, Leeds, Reino Unido.
3Catapult Sports, Leeds, Reino Unido.

4The Rugby Football League, Leeds, Reino Unido.

5Yorkshire Carnegie Rugby Union Club, Leeds, Reino Unido.

Departamento de Ciencias del Deporte, la Salud y el Ejercicio, Universidad de Hull,


6

Hull, Reino Unido.

Abstracto

Propósito: El propósito de este comentario invitado es discutir el uso del análisis de componentes
principales (PCA) como una herramienta de visualización y reducción de dimensiones para ayudar en la
toma de decisiones y la comunicación al analizar conjuntos de datos multivariados complejos asociados
con el entrenamiento de los atletas.

Conclusiones: Usando PCA es posible transformar una matriz de datos en un conjunto de variables
compuestas ortogonales llamadas componentes principales (PC), siendo cada PC una combinación
lineal ponderada de las variables observadas y con todas las PC no correlacionadas entre sí. El
beneficio de transformar los datos usando PCA es que los primeros PC generalmente capturan la
mayor parte de la información (es decir, la varianza) contenida en los datos observados, con el
primer PC representando la mayor cantidad de varianza y cada PC subsiguiente capturando menos
de los datos observados. información total. En consecuencia, a través de PCA es posible visualizar
conjuntos de datos complejos, que contienen múltiples variables en diagramas de dispersión 2D
simples sin una gran pérdida de información, lo que facilita mucho la transmisión de información
compleja a los entrenadores. En el futuro, Las empresas de monitoreo de atletas deben integrar PCA
en sus paquetes de clientes para brindar un mejor apoyo a los profesionales que intentan superar
los desafíos asociados con el análisis e interpretación de datos multivariados. Mientras tanto,
presentamos aquí una descripción general de la PCA y el código R asociado para ayudar a los
profesionales que trabajan en el campo a integrar la PCA en su proceso de monitoreo de atletas.
2

Sobrecarga de datos: la complejidad del ciclo de seguimiento del deportista

Un papel importante del entrenador es prescribir una carga (o dosis) de entrenamiento óptima en
el momento adecuado para mejorar las respuestas importantes, tales como:1,2 y desempeño
técnico-táctico3 o disponibilidad de jugadores.4 El seguimiento de estas relaciones de "dosis-
respuesta" se considera una parte importante de la toma de decisiones en el rendimiento
deportivo.5-7 Para ayudar en este proceso, los científicos deportivos a menudo tienen la tarea de
recopilar, procesar, analizar y comunicar datos de aptitud física y rendimiento, con el objetivo de
proporcionar recomendaciones prácticas y basadas en la evidencia a los entrenadores.

En realidad, para los científicos del deporte, proporcionar una representación válida de la
"dosis" y la "respuesta" durante un período de entrenamiento es algo intrínsecamente difícil.
Esto se debe a que los programas de entrenamiento y competición afectan múltiples vías
psicológicas, fisiológicas y biomecánicas.8-10 Por lo tanto, la "dosis" aplicada y la "respuesta"
resultante a cada vía pueden variar considerablemente entre los jugadores y entre los
diferentes modos de entrenamiento que se prescriben en los programas simultáneos.10-11 Con
el continuo desarrollo de la tecnología y la facilidad con la que se pueden recopilar datos, el
científico deportivo se enfrenta ahora a una compleja matriz de datos multivariados, de
múltiples fuentes y en múltiples unidades de medida. Esto da lugar a una ambigüedad
considerable sobre cómo se deben evaluar y comunicar a los entrenadores la "dosis" y la
"respuesta". Sin embargo, en la era de la tecnología12, muchas organizaciones han invertido
importantes recursos para medir estos complejos constructos de "dosis" y "respuesta".

Muchos investigadores han discutido el desafío de comprender, interpretar y actuar sobre


estos datos dentro del entorno acelerado de la prescripción de entrenamiento diario.12-16 Estos
debates suelen centrarse en la necesidad de que los profesionales consideren: 1) cómo
gestionan grandes volúmenes de datos (es decir, recopilación y procesamiento)
2) cómo interpretan estas fuentes de datos colectivos (es decir, análisis) y 3) cómo traducen estas
interpretaciones para informar la prescripción de capacitación y ayudar a las partes interesadas en la
toma de decisiones (es decir, visualización y comunicación).
Para mitigar algunos de estos desafíos, se han propuesto matrices de decisión o
heurísticas (Figura 1).13,17 Por ejemplo, tales matrices pueden incluir graficar 'aptitud' en el
X-eje y 'fatiga' en el y-eje. Luego, los profesionales pueden crear límites de decisión para guiar la
toma de decisiones en relación con cuándo deben realizarse enmiendas (por ejemplo,
progresión o regresión) a la prescripción de capacitación, dependiendo de cómo la "dosis" y la
"respuesta cambian con el tiempo.

INSERTAR LA FIGURA UNO AQUÍ

Para analizar el cambio en la 'dosis' y 'respuesta' de entrenamiento a lo largo del tiempo, los
autores anteriores3,16 han propuesto enfoques como las puntuaciones z o la el cambio más
pequeño que vale la pena estadística para determinar si cada variable de "dosis" y "respuesta"
individual para cada atleta se está desviando de lo "normal".

Aunque este tipo de análisis puede ser una herramienta importante para los profesionales a la hora de
determinar la probabilidad de un cambio significativo a lo largo del tiempo, este enfoque adolece de la
principal limitación de que cada variable individual genera su propia estadística de cambio individual. Por
lo tanto, dada la complejidad del seguimiento de los atletas, si los practicantes
3

recopilar tres variables de 'dosis' (por ejemplo, distancia total, distancia de alta velocidad, frecuencia cardíaca) y
tres variables de 'respuesta' (por ejemplo, variabilidad de la frecuencia cardíaca, recuperación percibida, salto
con contramovimiento), se generan seis estadísticas de cambio para cada atleta o 180 cambiar las estadísticas
basadas en un equipo de 30 jugadores, por punto de tiempo de recopilación de datos. Como resultado, los
profesionales se enfrentan al gran desafío de encontrar una forma eficaz de comunicar estas estadísticas de
cambios múltiples a los entrenadores sin atenuar la verdadera "señal" de la "dosis" y la "respuesta" de cada
jugador.

La multicolinealidad en los datos recopilados también puede ser un problema importante, ya que
múltiples mediciones que representan la 'dosis' y la 'respuesta' a menudo están fuertemente
correlacionadas entre sí. Por ejemplo, con las señales del sistema de posicionamiento global, la velocidad
y la aceleración se registran como variables separadas, con el resultado de que los entrenadores a
menudo piensan que estas medidas son independientes entre sí. Sin embargo, este no es el caso, ya que
la velocidad (m ∙ s-1) y aceleración (m ∙ s-2) son simplemente el primer y segundo diferenciales de distancia.
En consecuencia, las dos señales están altamente correlacionadas y no son independientes. Del mismo
modo, a lo largo de un período de entrenamiento, a menudo ocurre que varias variables utilizadas para
cuantificar el mismo constructo latente (es decir, cuantificar la 'dosis' o la 'respuesta') pueden cambiar
positiva o negativamente en cantidades similares, exhibiendo así una covarianza considerable. Como tal,
estas variables correlacionadas miden en mayor o menor medida lo mismo, lo que resulta en una
redundancia considerable dentro de los datos. De hecho, muchas medidas de carga de entrenamiento
comúnmente utilizadas (por ejemplo, GPS, sesión-RPE, etc.) exhiben una multicolinealidad inherente
cuando se miden a través de períodos de entrenamiento.18-20 Sin embargo, dependiendo del jugador18 y
tipo de entrenamiento11,19-20, otras variables pueden cambiar de formas diferentes, demostrando cierto
grado de independencia. Por ejemplo, en la liga de rugby profesional, Lovell et al.

(2013)21 informaron que la relación entre la calificación de la sesión del esfuerzo percibido y la distancia
total fue r = 0,80 durante el entrenamiento de acondicionamiento, pero solo r = 0,37 durante el
entrenamiento de lucha libre.

Dado esto, los científicos del deporte deben poder filtrar simultáneamente la redundancia en los
datos que a menudo oscurecen la información importante, pero también identificar información
única, de modo que se puedan interpretar y, en última instancia, se puedan comunicar a los
entrenadores conocimientos prácticos. En este sentido, el uso de técnicas de reducción de
dimensiones como el análisis de componentes principales (PCA)11,19 y descomposición de valor único
(SVD)20 están ganando popularidad en la investigación del rendimiento deportivo. Por ejemplo, PCA y
SVD se han utilizado en estudios que examinan la identificación de talentos.22, para evaluar la
evolución del juego23, para desarrollar indicadores de desempeño24 y evaluar la técnica en
deportistas.25 Al ortogonalizar los datos, estas técnicas permiten representar sistemas complejos de
dimensiones superiores en diagramas de dispersión 2D o 3D con una pérdida mínima de
información.22 Desafortunadamente, estas técnicas no se usan comúnmente en entornos de
rendimiento deportivo aplicados, a menudo debido a la falta de integración con el software que
usan comúnmente los practicantes. Como tal, gran parte del análisis realizado todavía es de
naturaleza univariante, con poca consideración de la covarianza en los datos (es decir,
multicolinealidad). Dado esto, un método alternativo basado en PCA para capturar la información
contenida en múltiples variables podría ser ventajoso, mejorando así la eficacia de la visualización y
comunicación de datos en la práctica aplicada.

La medida en que el PCA se puede utilizar realmente para reducir la dimensionalidad en un


conjunto de datos dado dependerá, por supuesto, del grado de multicolinealidad o redundancia.
4

dentro de los datos. El PCA funciona mejor cuando hay una redundancia considerable en los datos,
mientras que se obtienen pocos beneficios si las variables están débilmente correlacionadas o no
correlacionadas entre sí. El grado en que está presente la redundancia se puede evaluar utilizando
la prueba de esfericidad de Bartlett, que prueba la hipótesis nula de que la matriz de correlación de
los datos es una matriz de identidad, lo que indica que las variables medidas no están
correlacionadas (ortogonales) y, por lo tanto, las hace inadecuadas para PCA. Con la prueba de
Bartletts, p <0,05 indica que los datos no son ortogonales y, por tanto, adecuados para la aplicación
de PCA.26 Una prueba relacionada, la medida de adecuación de muestreo de Kaiser-Meyer-Olkin
(KMO), también se puede aplicar al realizar PCA, aunque estrictamente hablando es una medida de
cuán adecuados son los datos para el análisis factorial (FA). El índice KMO varía de 0 a 1, y> 0,50 se
considera adecuado para AF.27 Si no se cumple este requisito, significa que no se pueden producir
factores distintos y confiables (variables latentes no observadas que explican las variables
observadas).28 Al realizar AF, el PCA se usa a menudo para determinar la cantidad de factores que
deben extraerse y retenerse en el análisis.29 En este contexto, PCA se desempeña bien cuando el
índice KMO es alto (> 0.50) y es más probable que identifique factores confiables que expliquen los
datos observados cuando se excede este umbral.

Uso de PCA para superar la sobrecarga de datos

Con PCA es posible transformar una matriz de datos (es decir, columnas de datos [variables] por filas de
datos [observaciones]; Figura 2) en un conjunto de variables compuestas ortogonales llamadas
componentes principales (PC) (consulte la información complementaria para obtener una explicación
completa de PCA), con los siguientes atributos:

• Cada PC es una combinación lineal ponderada de las variables observadas y se


deriva de los vectores propios producidos cuando se realiza la descomposición
propia en la matriz de covarianza de los datos.
• El número total de PC siempre es igual al número de variables observadas y los
propios PC no están correlacionados.
• El beneficio de transformar los datos usando PCA es que los primeros PC generalmente
capturan la mayor parte de la información (es decir, la varianza) contenida en los datos
observados, con el primer PC representando la mayor cantidad de varianza y cada PC
subsiguiente capturando menos de los datos observados. información total.

Por ejemplo, Weaving et al.19 informó el 1S t La PC capturó el 70% de la información total proporcionada
por cinco medidas de carga de entrenamiento durante el entrenamiento de partidos reducidos en
jugadores profesionales de la liga de rugby. Sin embargo, el 2Dakota del Norte PC explicó sólo el 12% de la
información total, con el 5th PC explicando solo el 2%. Esto sugiere que gran parte de la complejidad
contenida en las múltiples variables de carga de entrenamiento observadas se puede capturar en una o
dos PC sin perder mucha información. En consecuencia, a través de PCA es posible visualizar conjuntos
de datos complejos, que contienen múltiples variables, en diagramas de dispersión 2D simples (por
ejemplo, 'fitness'vs 'fatiga'; Figura 1), sin una gran pérdida de información, lo que facilita mucho la
transmisión de información compleja a los entrenadores.
5

Un ejemplo del uso de PCA para evaluar la información única y similar proporcionada
por múltiples variables de aptitud (carga crónica) y fatiga (carga aguda)

Aquí ilustramos cómo se puede aplicar la PCA a los datos de carga de entrenamiento recopilados de un
solo jugador profesional de la liga de rugby durante dos temporadas de la Superliga europea. En este
ejemplo, consideramos las siguientes variables de carga de entrenamiento externas:
• Distancia total ([TD]: m)
• Distancia de alta velocidad ([HSD]: m; 5 a 7 m · s-1)
• Distancia a velocidad muy alta ([VHSD]: m;> 7 m · s-1)
• PlayerLoad ™ ([PL]: AU)
• Distancia de alta potencia metabólica ([HMP]: m;> 20 W · kg-1)
• Número de colisiones ([COL]: n)

Para cada una de las variables anteriores, un movimiento de 7 y 28 días ponderado exponencialmente
promedio (EWMA)30 de su acumulación diaria se calculó:

EWMAhoy = Cargahoy dia × λa + ((1 - λa) × EWMAel dia de ayer) (1)


Donde λa es un valor entre 0 y 1 que representa el grado de deterioro, con valores más altos
descontando las observaciones más antiguas a un ritmo más rápido. El λa se calcula como:

λa = 2 / (N + 1) (2)
Donde norte es la constante de disminución de tiempo elegida de 7 o 28 días. En este ejemplo, esto
generó 12 variables de carga de entrenamiento EWMA en 169 sesiones de entrenamiento.

Para realizar el PCA, primero examinamos los datos para determinar su idoneidad, tanto con la prueba de
esfericidad de Bartlett como con la medida KMO de idoneidad muestral, como se describió anteriormente. El
resultado de la prueba de Bartlett fue significativo (P < 0,001) y todas las variables de carga de entrenamiento
tenían un valor de KMO superior a 0,5, lo que sugiere que los datos eran adecuados para PCA. Los datos
observados primero se centraron en la media cero y se estandarizaron a la varianza unitaria y luego se
almacenaron en unnorte por metro matriz, X, que contiene metro Variables de carga de entrenamiento EWMA
y norte observaciones de la sesión de entrenamiento (Figura 2). La estandarización se realizó principalmente
para tener en cuenta las diferentes escalas de las variables (por ejemplo, número de colisiones = 10 frente a
distancia total = 3000 m).

INSERTAR LA FIGURA DOS AQUÍ

Habiendo compilado la matriz de datos estandarizados, X, Luego se realizó la descomposición


propia de la matriz de covarianza de los datos (ver información complementaria) para calcular
los valores propios y los vectores propios asociados con los respectivos PC (Tabla 1). Los
respectivos valores propios son clave para determinar la cantidad de información capturada
(es decir, la varianza) por cada PC. En la Tabla 1, se puede ver que en este ejemplo, la primera
y la segunda PC capturaron el 81.4% de la varianza total en los datos. Los respectivos
autovectores asociados con los autovalores son importantes para determinar cómo las
variables observadas originales se 'relacionan' entre sí.

INSERTAR LA TABLA UNO AQUÍ

INSERTAR LA FIGURA TRES AQUÍ


6

El biplot de PCA (Figura 3) muestra las flechas de los autovectores escalados (derivadas de la Tabla
1) para cada variable observada. De esto se puede ver que las variables: Tackles
(COL_7, COL_28), PlayerLoad (PL_7, PL_28), Distancia total (TD_7, TD_28) y Alto
poder metabólico (HMP_7 y HMP_28) influyen fuertemente en el primer PC que
representa El 58,3% de la varianza total, mientras que las variables: distancia de
muy alta velocidad (VHSD_7, VHSD_28) y distancia de alta velocidad (HSD_7,
HSD_28) se relacionan más con el segundo PC (23,1% de la varianza). Como tal, la
primera PC para este reproductor puede describirse ampliamente como
representando la "carga total", mientras que la segunda PC representa la "carga
de alta velocidad". Además, se puede ver en el biplot y la Tabla 1, que muchas de
las variables observadas en realidad miden fenómenos muy similares (por
ejemplo, VHSD_7 y VHSD_28; y PL_7, TD_7 y HMP_28), lo que indica que estas
variables no son independientes.

Al usar PCA, los profesionales pueden explorar primero las interrelaciones entre múltiples
variables, que probablemente sean diferentes para cada jugador debido a sus características
únicas. En la práctica, esto podría usarse como un proceso sistemático para evaluar qué variables
proporcionan información similar o única (a través de los autovectores) y qué parte de la varianza
total es probable que capturen (a través de los autovalores) durante un período de entrenamiento.
10-11,19,22

Visualización de datos multivariados mediante PCA

Mediante el uso de las 'puntuaciones' de la PC, la PCA también puede ayudar con la visualización de múltiples
variables. El término "puntuación" se utiliza a menudo para denotar los elementos de cada PC que se
relacionan con las observaciones individuales. Por lo tanto, en el contexto de nuestro ejemplo, las
'puntuaciones' de PC representan la contribución lineal ponderada combinada de las variables de carga de
entrenamiento originales (es decir, los autovectores [Tabla 1]) de cada PC para cada una de las sesiones de
entrenamiento individuales.

Para calcular las 'puntuaciones' de la PC, la matriz de autovectores y la matriz de los datos de
carga de entrenamiento estandarizados se multiplican juntas. Esto aplica los coeficientes en los
respectivos autovectores a los datos estandarizados. En nuestro ejemplo, las puntuaciones del 1S t
Los PC se generan aplicando los coeficientes en el 1S t vector propio (correspondiente al valor
propio más grande en la Tabla 1) a los datos estandarizados de la siguiente manera:

PC1 = (-0,36 × TD_7) + (-0,34 × TD_28) + (-0,19 × HSD_7) + (-0,26 × HSD_28) +


(-0,36 × PL_7) + (-0,34 × PL_28) + (-0.01 × VHSD_7) + (0,00 × VHSD_28) +
(-0,33 × HMP_7) + (-0,35 × HMP_28) + (-0,29 × COL_7) + (-0,31 × COL_28)

(3)

PCA da como resultado la creación de un norte por metro matriz que contiene las 'puntuaciones' de PC, cada una de las
cuales se relaciona con los valores propios respectivos.
7

Al producir un diagrama de dispersión de la primera y la segunda PC, es posible representar visualmente


en 2D la mayor parte de la información (81,4% para nuestro ejemplo) contenida en los datos de carga de
entrenamiento EWMA de 7 y 28 días (ver Figuras 3 y 4). Para los profesionales, los PC se pueden visualizar
de varias maneras, como un diagrama de dispersión (Figura 4), o alternativamente a través de dos
gráficos de líneas de series de tiempo (Figura 5), este último con la ventaja de que permite el cambio en
el respectivos PC a lo largo del tiempo para ser visualizados.

En nuestro ejemplo, interpretamos la primera PC como la "carga total" y la


segunda PC como la "carga de alta velocidad". Sin embargo, debido a que estas
variables compuestas son en realidad construcciones matemáticas que surgen de
la descomposición propia de los datos, es importante reconocer que las PC
individuales solo pueden ser aproximaciones a cualquier atributo atribuido dado
(es decir, carga 'general' o 'de alta velocidad' ). Por ejemplo, mientras que 'HSD 7' y
'HSD 28' son más dominantes en PC2, también contribuyen a PC1, destacando la
necesidad de ser cautelosos al interpretar las puntuaciones de PC.
Independientemente de esto, se puede ver que los dos primeros PC capturan las
contribuciones de múltiples aspectos de la 'dosis' de entrenamiento (por ejemplo,
distancia total, distancia de alta velocidad, colisiones) y permiten que esto se
comunique de manera efectiva a entrenadores y jugadores. Como tal,

Además de permitir la comunicación efectiva de información compleja sobre múltiples eventos de


entrenamiento, se puede superponer otra información (por ejemplo, ocurrencia de lesiones, etc.) en cualquier
serie de tiempo o diagramas de dispersión producidos, con el fin de proporcionar una visualización más rica del
ciclo de monitoreo del atleta. . Por ejemplo, en la Figura 4, al resaltar la sesión de hoy (en verde), los
practicantes pueden maximizar el uso de datos históricos colocando la carga de entrenamiento de un atleta en
ese día dentro del contexto de cada otra sesión de entrenamiento individual que el atleta ha completado en un
recorrido longitudinal. periodo de entrenamiento. Por lo tanto, en este ejemplo, podemos inferir
descriptivamente que la carga de entrenamiento de este atleta es "mucho más alta de lo normal".

Aunque PCA es principalmente una técnica de reducción de dimensiones que se aplica


retrospectivamente a conjuntos de datos complejos de dimensiones superiores para ver 'la madera de los
árboles', a menudo se usa en un contexto de aprendizaje automático para construir modelos de
clasificación y regresión, que pueden ser se utiliza de forma prospectiva para diagnosticar problemas,
tomar decisiones estratégicas y predecir resultados de rendimiento. Por ejemplo, tanto PCA como SVD se
pueden utilizar en algoritmos relacionados con los umbrales de rendimiento.22,24
De manera similar, la regresión de componentes principales32, una técnica estrechamente relacionada con
la PCA, se puede utilizar para construir modelos de regresión predictiva cuando la multicolinealidad es un
problema importante. Como tal, las técnicas de reducción de dimensiones como PCA, SVD y escalamiento
multidimensional (MDS) tienen un potencial considerable en el análisis del rendimiento deportivo. De
hecho, MDS se ha utilizado recientemente para evaluar la evolución del juego en la Liga Australiana de
Fútbol.23 De estas técnicas, PCA es, con mucho, la más accesible, con muchos artículos relevantes y
tutoriales fácilmente accesibles en Internet, lo que la convierte en una opción obvia para aquellos que
deseen explorar la reducción de dimensiones al analizar los datos de rendimiento deportivo. Además, es
aplicable a la mayoría de las aplicaciones relacionadas con el deporte, siempre que los datos contengan
redundancia.
8

INSERTE LA FIGURA CUATRO AQUÍ INSERTE

LA FIGURA CINCO AQUÍ Conclusiones y

aplicaciones prácticas

Mejorar los métodos para visualizar información compleja de múltiples fuentes es


clave para mejorar la eficacia de la toma de decisiones basada en datos en la práctica
aplicada. En este comentario invitado se ha propuesto una solución práctica para
superar las dificultades en la visualización de conjuntos de datos de seguimiento de
atletas complejos mediante el uso de PCA. Aunque las matemáticas que sustentan la
PCA pueden ser complejas, el método se puede ejecutar fácilmente utilizando
paquetes de software de código abierto, como 'R' (consulte la información
complementaria, por ejemplo, el código genérico de PCA 'R'), haciéndolo accesible a
los profesionales. En el futuro, las empresas de monitoreo de atletas deberían
integrar PCA en sus paquetes de clientes para apoyar mejor a los profesionales que
intentan superar los desafíos asociados con el análisis e interpretación de datos
multivariados. En el intermedio,

Referencias

1. Akubat I, Patel E, Barrett S, Abt G. Métodos de seguimiento de la carga de entrenamiento y


partido y su relación con los cambios en la forma física en jugadores profesionales de fútbol
juvenil. J Sports Sci. 2012; 30 (14): 1473-1480.
2. Taylor RJ, Sanders D, Myers T, Abt G, Taylor CA, Akubat I. La relación dosis-respuesta
entre la carga de entrenamiento y la aptitud aeróbica en jugadores de rugby de
academia. Int J Sports Physiol Perform. 2018; 13: 1-7.
3. Graham SR, Cormack S, Parfitt G, Eston R. Relaciones entre el modelo predicho y el rendimiento
real en los partidos en futbolistas australianos profesionales durante un macrociclo de
entrenamiento durante la temporada. Int J Sports Physiol Perform. 2017; 17: 1-25

4. Williams S, Trewartha G, Kemp SP, Brooks JH, Fuller CW, Taylor AE, Cross MJ, Stokes KA. Las
lesiones por pérdida de tiempo comprometen el éxito del equipo en Elite Rugby Union: un
estudio prospectivo de 7 años. Br J Sports Med. 2016; 50 (11): 651-656.
5. Impellizzeri FM, Rampinini E, Marcora SM. Evaluación fisiológica del entrenamiento
aeróbico en fútbol. J Sports Sci. 2005; 23 (6): 583-592.
6. Gabbett TJ. La paradoja del entrenamiento y la prevención de lesiones: los atletas deberían entrenar de manera
más inteligente y más intensa. Br J Sports Med. 2016; 50 (5): 273-280.
7. Drew MK, Finch CF. La relación entre carga de entrenamiento y lesión, enfermedad y
dolor: una revisión sistemática y bibliográfica. Sports Med. 2016; 46 (6): 861-863.
8. Soligard T, Schwellnus M, Alonso JM, et al. ¿Cuánto es demasiado? (Parte 1) Declaración de
consenso del Comité Olímpico Internacional sobre la carga en el deporte y el riesgo de
lesiones. Br J Sports Med. 2016; 50 (17): 1030-1041.
9. Vanrenterghem J, Nedergaard NJ, Robinson MA, Drust B. Monitoreo de la carga de
entrenamiento en deportes de equipo: un marco novedoso que separa las vías de adaptación
de la carga fisiológica y biomecánica. Sports Med. 2017; 47 (11): 2135-2142.
9

10.Weaving D, Jones B, Till K, Abt G, Beggs C. El caso para adoptar un enfoque multivariante para
optimizar la cuantificación de la carga de entrenamiento en deportes de equipo. Frente Physiol.
2017; 8: 1024.
11.Weaving D, Jones B, Marshall P, Till K, Abt G. Se necesitan múltiples medidas para cuantificar
las cargas de entrenamiento en la liga de rugby profesional. Int J Sports Med. 2017; 38 (10):
735-740.
12. Coutts AJ. En la era de la tecnología, la navaja de Occam todavía se aplica. Int J Sports
Physiol Perform. 2014; 9 (5): 741.
13.Gabbett TJ, Nassis GP, Oetter E, Pretorius J, Johnston N, Medina D, Rodas G, Mylinski T,
Howells D, Beard A, Ryan A. El ciclo de seguimiento del atleta: una guía práctica para
interpretar y aplicar los datos del seguimiento del entrenamiento . Br J Sports Med. 2017;
51: 1451-1452.
14. Cardinale M, Varley MC. Tecnología de monitoreo de entrenamiento portátil: aplicaciones,
desafíos y oportunidades. Int J Sports Physiol Perform. 2017; 12: S255-S262.
15 Robertson S, Bartlett JD, Gastin PB. ¿Rojo, ámbar o verde? Seguimiento del deportista en el deporte de
equipo: la necesidad de sistemas de apoyo a la toma de decisiones. Int J Sports Physiol Perf. 2017; 12
(Suppl 404 2): S273-S279.
16. Ward P, Coutts AJ, Pruna R, McCall A. Poniendo la "I" de nuevo en el equipo. Int J
Sports Physiol Perform. 2018; 13 (8): 1107-1111.
17 Jovanovic M. (2017). Incertidumbre, heurística y predicción de lesiones. Revista
Aspetar 2017; 6.
18.Thornton HR, Delaney JA, Duthie GM y Dascombe BJ. Importancia de varias medidas de carga de
entrenamiento sobre la incidencia de lesiones de los atletas profesionales de la liga de rugby.
Int J Sports Physiol Perf. 2016; 5: 1-17.
19.Weaving D, Marshall P, Earle K, Nevill A, Abt G. Combinando medidas de carga de
entrenamiento internas y externas en la liga de rugby profesional. Int J Sports Physiol Perf.
2014; 9: 905–912.
20. McLaren SJ, Macpherson TW, Coutts AJ, Hurst C, Spears IR, Weston M. Las relaciones
entre las medidas internas y externas de la carga de entrenamiento y la intensidad en
los deportes de equipo: un metaanálisis. Sports Med. 2018; 48 (3): 641-658.
21. Lovell TW, Sirotic AC, Impellizzeri FM, Coutts AJ. Factores que afectan la percepción del esfuerzo
(calificación de la sesión del esfuerzo percibido) durante el entrenamiento de la liga de rugby. Int J
Sports Physiol Perform. 2013; 8 (1): 62-69.
22 Hasta K, Jones BL, Cobley S, Morley D, O'Hara J, Chapman C, Cooke C, Beggs CB.
Identificación del talento en el deporte juvenil: una metodología novedosa que utiliza
análisis de dimensiones superiores. Más uno. 2016; 11: e0155047.
23 Woods CT, Robertson S, Collier NF. Evolución del juego en la Liga
Australiana de Fútbol de 2001 a 2015. J Sports Sci. 2017; 35 (19): 1879-1887.
24 Parmar N, James N, Hearne G, Jones B. Uso del análisis de componentes principales para
desarrollar indicadores de rendimiento en la liga profesional de rugby. J Sports Sci. 2018; 6:
938-949.
25 Gløersen Ø, Myklebust H, Hallén J, Federolf P. Análisis de técnicas en atletas de élite
utilizando análisis de componentes principales. J Sports Sci. 2018; 36 (2): 229-
237.bar
26.Bartlett MS. Pruebas de significación en análisis factorial. Revista británica de psicología
estadística. Junio de 1950; 3 (2): 77-85.
27.Williams B, Onsman A, Brown T.Análisis factorial exploratorio: una guía de cinco pasos para
principiantes. Revista Australasia de Paramedicina. 2 de agosto de 2010; 8 (3).
10

28. Yong AG, Pearce S. Un principiante's guía para el análisis factorial: centrándose en el
análisis factorial exploratorio. Tutorías en métodos cuantitativos para psicología. Octubre
de 2013; 9 (2): 79-94.29. Costello AB, Osborne JW. Mejores prácticas en análisis factorial
exploratorio: cuatro recomendaciones para aprovechar al máximo su análisis. Pract Evaluar
Res Eval 2005; 10. URL http: // pareonline. net / getvn. áspid. 2005; 10 (7)
30. Williams S, West S, Cross MJ, Stokes KA. ¿Mejor forma de determinar la proporción
de carga de trabajo aguda: crónica? Br J Sports Med. 2017; 51: 209-210.
31. Williams S, Trewartha G, Cross MJ, Kemp SPT, Stokes KA. Monitoreo de lo que importa: un
proceso sistemático para seleccionar medidas de carga de entrenamiento. Int J Sports Physiol
Perfom. 2017; 12: S2101-S2016.
32. James G, Witten D, Hastie T y Tibshirani R. Una introducción al aprendizaje estadístico con
aplicaciones en textos de R. Springer en estadística. Springer, Nueva York; 2013.

Descripciones de figuras y tablas

Figura 1. Ejemplo de matriz de decisiones heurísticas de seguimiento de atletas.


11

Figura 2. Ejemplo de una matriz de carga de entrenamiento típica para un solo jugador, que muestra los promedios
móviles ponderados exponencialmente de 7 y 28 días de seis variables de carga de entrenamiento (metro) calculado
en diferentes días de entrenamiento durante un período de entrenamiento (norte).
12

Figura 3. Biplot de los autovectores escalados (flechas) y puntuaciones (puntos) para el primer (PC1) y
segundo (PC2) componentes principales. Más flechas horizontales se relacionan con el eje x (es decir,
PC1) mientras que más flechas verticales se relacionan con el eje y (es decir, PC2).
13

Figura 4. Diagrama de dispersión de las puntuaciones de los componentes principales primero (eje x) y
segundo (eje y) para las 169 sesiones de entrenamiento para un jugador individual. El punto de datos verde
destaca la sesión de hoy en el contexto de todas las demás sesiones de entrenamiento completadas.

Figura 5. Gráfico de series de tiempo de las puntuaciones de los componentes principales del primer (carga
general) y del segundo (carga de alta velocidad) (con signos invertidos) a lo largo de dos temporadas para un
solo jugador. El área gris representa los días dentro de 1 desviación estándar de la media, el área naranja
dentro de 2 desviaciones estándar y el área roja dentro de 3 desviaciones estándar de la media.
14

Tabla 1. Resultados del análisis de componentes principales, incluidos los valores propios (% de la
varianza explicada) y los vectores propios para cada componente principal de la matriz X.

Tabla 1. Resultados del análisis de componentes principales, incluidos los valores propios (% de varianza explicada) y
vectores propiospor cadapagcomponente principalent de matriz X
1S t 2Dakota del Norte 3rd 4th 5th 6th 7th 8th 9th 10th 11th 12th
ordenador personal
ordenador personal
ordenador personal
ordenador personal
ordenador personal
ordenador personal
ordenador personal
ordenador personal
ordenador personal
ordenador personal
ordenador personal
ordenador pers

Normalizado 6,99 2,77 1.04 0,56 0,27 0,22 0,05 0,05 0,03 0,01 0,00 0,00
valores propios

% del total 58,3 23,1 8,71 4,7 2 2 0,5 0.4 0,2 0,06 0,02 0,002
diferencia
explicado
Vectores propios
TD_7 - 0,36 - 0.01 0,22 0,05 - 0,36 0,16 - 0,42 - 0,14 - 0.07 0,61 - 0,15 0,27
TD_28 - 0,34 0,16 - 0,34 - 0.03 - 0.09 - 0,13 0,05 - 0,16 0,19 0,31 0,37 - 0,65
HSD_7 - 0,19 - 0,40 0,39 - 0,31 0,18 - 0,56 0,08 - 0,40 0,18 - 0.02 - 0,11 - 0.02
HSD_28 - 0,26 - 0,33 - 0,15 - 0,42 0,46 0,23 - 0,39 0,42 0,05 0,00 0,15 0,02
PL_7 - 0,36 0,01 0,22 0,10 - 0,30 0,22 - 0,32 - 0.07 0,16 - 0,66 - 0,15 - 0,29
PL_28 - 0,34 0,17 - 0,34 0,00 - 0.08 - 0,13 0,06 - 0,19 0,26 - 0,24 0,37 0,65
VHSD_7 - 0.01 - 0,51 - 0,22 0,59 - 0,16 - 0,40 - 0,14 0,37 0,13 0,02 - 0.01 0,00
VHSD_28 0,00 - 0,55 - 0,29 0,18 0,09 0,47 0,15 - 0,55 - 0,19 - 0.02 0,01 - 0.01
HMP_7 - 0,33 - 0,20 0,26 - 0,11 - 0,31 0,03 0,48 0,31 - 0,48 - 0.06 0,34 0,01
HMP_28 - 0,35 0,02 - 0,36 - 0,16 - 0.06 0,03 0,40 0,17 0,11 0,04 - 0,72 0,02
COL_7 - 0,29 0,11 0,40 0,48 0,47 0,25 0,29 0,09 0,34 0,13 0,05 0,02
COL_28 - 0,31 0,26 - 0,12 0,26 0,40 - 0,29 - 0,20 - 0,12 - 0,65 - 0,11 - 0,13 - 0.02
Abreviaturas: PC = componente principal; TD = distancia total; HSD = distancia de alta velocidad; PL = PlayerLoad ™; VHSD: distancia de
muy alta velocidad; HMP = distancia de alto poder metabólico; COL = colisiones. Los números representan una ventana promedio
ponderada exponencialmente (es decir, 7 o 28 días).

También podría gustarte