Está en la página 1de 16

Modelo de negocios aplicado a los jugadores de la

Premier League

Alumnos:

Cristian Hormazabal Apablaza

Nicolas Marileo Almonacid

Docente:

Jorge Parada Morollón

Puerto Montt 2020


Modelo de negocio.

La premier league es una de ligas más atractivas del mundo, no tanto solo por los equipos,
hinchadas e infraestructura, sino también, por los jugadores que componen esta liga. Actualmente la
Premier league está compuesta por 20 equipos dispersos por toda la nación de Inglaterra. El modelo
de negocios consiste en el mercado de equipo y el mercado de los jugadores

Como IICG contratado por un equipo de la Premier League nuestro objetivo es mejorar la plantilla
equipo y llevarlo a alcanzar su nivel más optimo con el fin de ganar la liga inglesa generando un
modelo para diferenciar a los jugadores según su posición (Delantero, Defensa, Medio campo y
portero) y luego seleccionar los que tienen el rendimiento más alto en esa posición para alcanzar las
metas propuestas.

Mercado de equipos

Las principales fuentes de ingreso de los equipos las podemos subdividir en 4 categorías

1.- Derecho de televisión.

2.- Venta de jugadores.

3.- Entradas, publicidad y abonos.

4.- Auspiciadores (Marcas).

La imagen muestra los ingresos de los equipos por derecho de televisión de la temporada
2018/2019.

1 Datos sobre los ingresos Fuente: Marca


Modelo Teórico.

La investigación trata de separar/clasificar a un jugador en una variable cualitativa, en este


caso por posición en la cancha, ya sea, delantero, mediocampista, defensa, y portero, los
rectángulos representan algunas de las variables utilizadas en los análisis.

Base de datos.

Para realizar los análisis se buscaron diversas fuentes de datos para los jugadores, gran parte
fue extraído de WhooScored, el cual representa el 90 % de las variables utilizadas en la investigación.

Links de fuentes de información.

https://es.whoscored.com/Regions/252/Tournaments/2/Seasons/7811/Stages/17590/PlayerStatisti
cs/Inglaterra-Premier-League-2019-2020

https://www.premierleague.com/stats
Variables para el modelo

Para el análisis se obtuvieron 22 variables, de las cuales 3 son cualitativas. Para las variables
MediaMinJug, ProbAsist y ProbGol, se utilizaron los datos de todos los jugadores (522), para la
variable dependiente se separaron las categorías en números binarios, para la elaboración de los
modelos de regresión logística y SVM. A continuación, se muestran las variables utilizadas.

Variables Tipo de Variable Descripción


Jgdos Cuantitativa Partidos jugados en la Premier League
Mins Cuantitativa Minutos jugados
Entrad Cuantitativa Entradas por partido
Interec Cuantitativa Intercepciones por partido
Falt Cuantitativa Faltas por partido
Despe Cuantitativa Despejadas por partido
RgtsD Cuantitativa Regates por partido Defensivo
Goles Cuantitativa Goles totales
Asist Cuantitativa Asistencias totales
Individuos: TpP Cuantitativa Tiros por partido
PClave Cuantitativa Pases clave por partido
Los jugadores
RgtsO Cuantitativa Regaste por partido Ofensivo
de la Premier
FaltaF Cuantitativa Faltas a favor por partido
League
FJuego Cuantitativa Fuera de juego por partido
Despo Cuantitativa Desposeído por partido
PdasB Cuantitativa Controles malos por partido
Equipo Cualitativa Equipo de la Premier League
Posicion Cualitativa Posición del jugador
Jugador Cualitativa Nombre del jugador
MediaMinJug Cuantitativa Promedio minutos jugados por partido
ProbAsist Cuantitativa Probabilidad de asistencia
ProbGol Cuantitativa Probabilidad de gol
Modelos

Se realizaron 4 análisis multivariantes para tratar de explicar cuales son los factores que influyen en
el rendimiento de un jugador según su posición.

Árbol de decisión
El primer nodo (Despe) representa el número de despejes por partido, esta variable determina
cuales son las posiciones que la representan, los que puntúen por sobre >1,550, aquí podemos
encontrar las categorías de mediocampista y defensor. Luego los que están por debajo de la variable
los segrega la MediaMinJug por debajo de <1,550, se encuentran todas las categorías (defensor,
delantero, mediocampista y portero). Se puede observar que la posición del jugador esta
determinada por los despejes por partido que hace.

Validación

A través de la validación cruzada se obtuvieron los siguientes valores, el modelo se clasifica en un


69,74%.

Costos
Red neuronal

Validación

A través de la validación cruzada se obtuvieron los siguientes valores, el modelo se clasifica en un


78,36%. Donde acierta más en clasificar a un jugador según su posición como cuando no lo es.
Costos

Regresión logística
Tabla de regresión logística defensa

Donde podemos observar que el coeficiente Fjuego es el factor que más influye en la posición de un
jugador cuando es defensa.

Según el P-Valor las variables significativas del modelo son: Entrad, Interc, Falt, Despe, RgtsD, TpP,
PClave, Fjuego, Despe y la constante, estas son las variables que a la hora de clasificar a un jugador
como defensa son las que nos sirven.

Validación
A través de la validación cruzada se obtuvieron los siguientes valores, el modelo se clasifica en un
88,31%.

Tabla de regresión logística delantero

Donde podemos observar que el coeficiente ProbAsist es el factor que más influye en la posición de
un jugador cuando es delantero.

Según el P-Valor las variables significativas del modelo son: Entrad, PdasB, MediaMinJug y Fjuego,
estas son las variables que a la hora de clasificar a un jugador como delantero son las que nos sirven,
sin embargo, nuestro coeficiente esta sobre el 0,05.

Validación
A través de la validación cruzada se obtuvieron los siguientes valores, el modelo se clasifica en un
89,06%.

Tabla de regresión logística mediocampista

Donde podemos observar que el coeficiente RgtsD es el factor que más influye en la posición de un
jugador cuando es mediocampista.

Según el P-Valor las variables significativas del modelo son: Falt, Despe, RgtsD, TpP, Fjuego y
MediaMinJug, estas son las variables que a la hora de clasificar a un jugador como mediocampista
son las que nos sirven, sin embargo, nuestro coeficiente esta sobre el 0,05.

Validación

A través de la validación cruzada se obtuvieron los siguientes valores, el modelo se clasifica en un


76,81%.
Tabla de regresión logística portero

Donde podemos observar que el coeficiente MediaMinJug es el único factor que influye en la
posición de un jugador cuando es portero, sin embargo, nuestro coeficiente esta sobre el 0,05.

Validación

A través de la validación cruzada se obtuvieron los siguientes valores, el modelo se clasifica en un


97,51%.

Máquina vector soporte (SVM)

En este caso se separó la variable dependiente en cada categoría y se calificó cada una como una
variable binomial.
Principales vectores (Defensa)

Dado el resultado podemos definir que los vectores que mejor representan a la posición de defensa
son Despe y Entrad.

Validación

A través de la validación cruzada se obtuvieron los siguientes valores, el modelo se clasifica en un


87,53%.

Principales vectores (Delantero)


Dado el resultado podemos definir que los vectores que mejor representan a la posición de
delantero son FJuego y Jgdos.

Validación

A través de la validación cruzada se obtuvieron los siguientes valores, el modelo se clasifica en un


88,69%.

Principales vectores (Mediocampista)


Dado el resultado podemos definir que los vectores que mejor representan a la posición de
mediocampista son RgtsD y Jgdos.

Validación

A través de la validación cruzada se obtuvieron los siguientes valores, el modelo se clasifica en un


77,58%.

Principales vectores (Portero)


Dado el resultado podemos definir que los vectores que mejor representan a la posición de portero
son MediaMinJug y TpP.

Validación

A través de la validación cruzada se obtuvieron los siguientes valores, el modelo se clasifica en un


98,09%.

Validación y elección

Relación a los modelos propuestos, la siguiente tabla muestra la comparación de estos según su
porcentaje de calidad predictiva.

Regresión SVM (x̄) Red Neuronal(x̄) Árbol decisión(x̄)


Logistica (x̄)
Predicción True 76,93% 80,21% 80,77% 69,08%
Predicción False 90,49% 90,14%
Porcentaje total 87,93% 87,96% 78,35% 69,73%

Se define como mejor modelo la maquina de vector soporte ya que tiene el valor mas alto en la
predicción con un 80,21%, donde clasifica a los jugadores en su posición.
Definir propuestas según la investigación

Para fichar jugadores para la plantilla nos basaremos según el modelo de la maquina del vector
soporte (SVM) ya que nos entrega información clave de la posición de los jugadores dentro de la
Premier League según su rendimiento.

También podría gustarte