Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Premier League
Alumnos:
Docente:
La premier league es una de ligas más atractivas del mundo, no tanto solo por los equipos,
hinchadas e infraestructura, sino también, por los jugadores que componen esta liga. Actualmente la
Premier league está compuesta por 20 equipos dispersos por toda la nación de Inglaterra. El modelo
de negocios consiste en el mercado de equipo y el mercado de los jugadores
Como IICG contratado por un equipo de la Premier League nuestro objetivo es mejorar la plantilla
equipo y llevarlo a alcanzar su nivel más optimo con el fin de ganar la liga inglesa generando un
modelo para diferenciar a los jugadores según su posición (Delantero, Defensa, Medio campo y
portero) y luego seleccionar los que tienen el rendimiento más alto en esa posición para alcanzar las
metas propuestas.
Mercado de equipos
Las principales fuentes de ingreso de los equipos las podemos subdividir en 4 categorías
La imagen muestra los ingresos de los equipos por derecho de televisión de la temporada
2018/2019.
Base de datos.
Para realizar los análisis se buscaron diversas fuentes de datos para los jugadores, gran parte
fue extraído de WhooScored, el cual representa el 90 % de las variables utilizadas en la investigación.
https://es.whoscored.com/Regions/252/Tournaments/2/Seasons/7811/Stages/17590/PlayerStatisti
cs/Inglaterra-Premier-League-2019-2020
https://www.premierleague.com/stats
Variables para el modelo
Para el análisis se obtuvieron 22 variables, de las cuales 3 son cualitativas. Para las variables
MediaMinJug, ProbAsist y ProbGol, se utilizaron los datos de todos los jugadores (522), para la
variable dependiente se separaron las categorías en números binarios, para la elaboración de los
modelos de regresión logística y SVM. A continuación, se muestran las variables utilizadas.
Se realizaron 4 análisis multivariantes para tratar de explicar cuales son los factores que influyen en
el rendimiento de un jugador según su posición.
Árbol de decisión
El primer nodo (Despe) representa el número de despejes por partido, esta variable determina
cuales son las posiciones que la representan, los que puntúen por sobre >1,550, aquí podemos
encontrar las categorías de mediocampista y defensor. Luego los que están por debajo de la variable
los segrega la MediaMinJug por debajo de <1,550, se encuentran todas las categorías (defensor,
delantero, mediocampista y portero). Se puede observar que la posición del jugador esta
determinada por los despejes por partido que hace.
Validación
Costos
Red neuronal
Validación
Regresión logística
Tabla de regresión logística defensa
Donde podemos observar que el coeficiente Fjuego es el factor que más influye en la posición de un
jugador cuando es defensa.
Según el P-Valor las variables significativas del modelo son: Entrad, Interc, Falt, Despe, RgtsD, TpP,
PClave, Fjuego, Despe y la constante, estas son las variables que a la hora de clasificar a un jugador
como defensa son las que nos sirven.
Validación
A través de la validación cruzada se obtuvieron los siguientes valores, el modelo se clasifica en un
88,31%.
Donde podemos observar que el coeficiente ProbAsist es el factor que más influye en la posición de
un jugador cuando es delantero.
Según el P-Valor las variables significativas del modelo son: Entrad, PdasB, MediaMinJug y Fjuego,
estas son las variables que a la hora de clasificar a un jugador como delantero son las que nos sirven,
sin embargo, nuestro coeficiente esta sobre el 0,05.
Validación
A través de la validación cruzada se obtuvieron los siguientes valores, el modelo se clasifica en un
89,06%.
Donde podemos observar que el coeficiente RgtsD es el factor que más influye en la posición de un
jugador cuando es mediocampista.
Según el P-Valor las variables significativas del modelo son: Falt, Despe, RgtsD, TpP, Fjuego y
MediaMinJug, estas son las variables que a la hora de clasificar a un jugador como mediocampista
son las que nos sirven, sin embargo, nuestro coeficiente esta sobre el 0,05.
Validación
Donde podemos observar que el coeficiente MediaMinJug es el único factor que influye en la
posición de un jugador cuando es portero, sin embargo, nuestro coeficiente esta sobre el 0,05.
Validación
En este caso se separó la variable dependiente en cada categoría y se calificó cada una como una
variable binomial.
Principales vectores (Defensa)
Dado el resultado podemos definir que los vectores que mejor representan a la posición de defensa
son Despe y Entrad.
Validación
Validación
Validación
Validación
Validación y elección
Relación a los modelos propuestos, la siguiente tabla muestra la comparación de estos según su
porcentaje de calidad predictiva.
Se define como mejor modelo la maquina de vector soporte ya que tiene el valor mas alto en la
predicción con un 80,21%, donde clasifica a los jugadores en su posición.
Definir propuestas según la investigación
Para fichar jugadores para la plantilla nos basaremos según el modelo de la maquina del vector
soporte (SVM) ya que nos entrega información clave de la posición de los jugadores dentro de la
Premier League según su rendimiento.