Pa1 Estructura

FACULTAD DE INGENIERIA, ARQUITECTURA Y URBANISMO.
ESCUELA PROFESIONAL DE INGENIERIA DE SISTEMAS.

TITULO:
AUTORES:
Arcos Garcia Mervi Ivan
Cancino Gonzales, Jeanpier Eduardo
Huancas Chuquipoma, Hilder Rody
Temoche Cumpa Mario Ismael
Torres Plasencia, Nicole Alexandra
CURSO:
Machine Learning
DOCENTE:
Percy Javier Celis Bravo
CICLO:
VI
2021
RESUMEN
Para la realización de este trabajo se usó una datase que encontramos lo cual nos
centraremos en analizar los resultados en los partidos de fútbol usando el aprendizaje
automático de clasificación, ya que resulta muy importante en mejorar la tecnología en
este deporte y no solo en este, sino también en muchos otros campos.
El aprendizaje automático tiene que ver con la inteligencia artificial, y como sabemos
mediante este son los sistemas quienes aprenden de si mismos identificando patrones y
hasta el punto de tomar decisiones por si solos.
Este informe reforzara el aprendizaje acerca de reconocimiento de patrones y objetos en
tiempo real, el trabajo a presentar está estructurado por una breve introducción donde se
presentara el caso de estudio y el contexto del proyecto a realizarse, el análisis de los
atributos y etiqueta que posee.
INTRODUCCIÓN
 CASO DE ESTUDIO
El caso de estudio que hemos seleccionado recopila información de partidos anteriores

para así poder realizar una predicción en base a estos marcadores. Ahora formando como
parte de este deporte está BIG DATA se, implementó en sus inicios donde aún se le
buscaba algún beneficio para el fútbol con el basto volumen de datos futbolísticos.
Para el desarrollo de este proyecto, se debe comprender que BIG DATA es indispensable
en el fútbol ya que almacena gran cantidad de información mediante un procesamiento y
análisis en tiempo real de jugadores de futbol.
BIG DATA permite el procesamiento y análisis de gran variedad de datos, estructurados o
no, contribuye al desarrollo de estrategias y habilidades como el fútbol.
El dataset que escogimos tiene un total de 37147 ejemplos que decidimos dividir en 37
lotes para un mejor rendimiento y optimizar recursos. Los lotes son útiles para predecir un
conjunto de observaciones a gran tamaño y estimarlo al tamaño del dataset aplicando la
ley de Pareto.
Transformamos cada atributo y etiqueta, ya que cada atributo contiene valores continuos
o discretos, estos se transformarán mediante ingeniería de datos para un mejor análisis.
Los ingenieros de datos de esta forma pueden desarrollar operaciones para extraer,
transformar y cargar datos para refinarlos y lograr un estado normalizado para un mejor
análisis.
Después de dividir el conjunto de datos en lotes, se llevará a cabo la fase de capacitación,
prueba y validación. Para ello se debe encontrar la pérdida mínima de efectividad,
encontrando los mejores parámetros para detectar cualquier error mínimo y por lo tanto el
algoritmo sea lo mayor eficiente.
El último paso de este caso de estudio, es hacer la codificación o scripting en el lenguaje
de programación planteado.
 CONTEXTO DEL PROYECTO
Actualmente, el fútbol proporciona un gran volumen de datos para el análisis y, a través
de la minería de datos mediante algoritmos de aprendizaje automático, participan en
todos los deportes conocidos y, por supuesto, el deporte rey el futbol. Se recopilan
muchos datos con el mapa de calor del jugador en el campo, datos históricos, el logro de
cada atleta usando tecnología, sensor de frecuencia cardíaca, sistema GPS para cada
partido, también influye en la compra y venta de jugadores. o prevenir futuras lesiones a
los deportistas.
El conjunto de datos (dataset) seleccionado contiene toda la información de cada jornada

de fútbol en la liga española con los datos de la primera y segunda división de su fútbol y
las coberturas de la temporada 1970-1971 a 2017-2018, con el objetivo de clasificar todos
los resultados obtenidos a través de su historia y predecir resultados futuros mediante el
aprendizaje automático.
Consta de 8 atributos, de las cuales 6 son continuas (ID del partido, Temporada, División,
Fecha del partido, Fecha y marca de tiempo) y 2 atributos discretos son el nombre del
equipo local y visitante.
La propuesta del proyecto es innovar en la tecnología del fútbol, ya que América Latina
tiene un retraso a comparación de Europa, donde países como España e Inglaterra
utilizan la ciencia de datos como estrategia futbolística. El grupo de trabajo está utilizando
este conjunto de datos para futuras predicciones con aprendizaje automático, ya que el
fútbol tiene algunas estadísticas impresionantes para analizarlo.
RESULTADOS
 IDENTIFICACIÓN DE ATRIBUTOS
Descripción del Descripción

Nombre del ¿Cómo contribuye a Posibles Tipo de
atributo. ¿Qué del posible
atributo identificar la etiqueta? valores variable
representa? valor
Permite a codificar cada
una de las jornadas del
Identificador único de
IdPartido partido para identificar 01 al 37147 Numéricos Continua
cada partido.
los resultados de los
equipos.
Cada temporada Existen 48
Numéricos:
Temporada en la que se representa la duración temporadas:
Temporada año en la que Continua
ha jugado cada partido. que tuvo el torneo para 1970 – 71 al
se juega
definir al campeón. 2017 – 18.
Existen 2
Identifica la categoría a la categorías,
División en la que se Numéricos por
División cual pertenece cada primera: “1” y Continua
jugaron los partidos. categoría
equipo. segunda: “2”
división.
Todos los partidos
Jornada en la que se pertenecen a una jornada
Jornada 01 al 44. Numéricos Continua
jugaron los partidos. en especifico en la que se
jugaron los partidos.
Existen 115
equipos de
Equipo que juega como Influye a identificar al futbol de la Nombre del
Equipo local local en su propio equipo que ha ganado o liga española equipo que Discreta
estadio de fútbol. perdido. según su participó
categoría y
temporada.
Existen 115
equipos de
Influye a identificar al futbol de la Nombre del
Equipo visitante Equipo rival. equipo que ha ganado o liga española equipo que Discreta
perdido. según su participó
categoría y
temporada.
Permite identificar la Existen 4589
fecha en la que se ha fechas: desde
Fecha en la que se Numéricos por
Fecha jugado cada jornada de el 12-09-1970 Continua
jugaron los partidos. fecha
los partidos con sus hasta 02-06-
resultados. 2018.
Numero de segundos
Timestamp de la fecha
transcurridos desde las 0
Timestamp en la que se jugaron los 4589 valores Numéricos Continua
horas del 1 de enero de
partidos.
1970 GMT.
 IDENTIFICANDO LAS ETIQUETAS DE CLASIFICACIÓN/REGRESIÓN/CLUSTERINS

Se concluye que
Figura 3: Tabla: Etiquetas y sus Valores
las etiqueta que
Fuente propia
muestra el
DATASET
pertenece a la clasificación de resultados de cada equipo con la cantidad de goles
que anota.
CONCLUSIONES
- Se eligió una datase sobre futbol ya que es un campo muy amplio brindando
datos sobre la historia, competencias, torneos, entre muchos otros.
- Se puede concluir que se usó el aprendizaje automático para que un programa
aprenda por si solo, lo cual en la actualidad resulta ser muy nuevo y mejora en
gran cantidad el análisis de datos.
REFERENCIAS
ANEXOS
COLOCAR EL LINK DE LA DATASET

Pa1 Estructura

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Pa1 Estructura

Cargado por

Copyright:

Formatos disponibles

FACULTAD DE INGENIERIA, ARQUITECTURA Y URBANISMO.

ESCUELA PROFESIONAL DE INGENIERIA DE SISTEMAS.

Cancino Gonzales, Jeanpier Eduardo

Huancas Chuquipoma, Hilder Rody

Temoche Cumpa Mario Ismael

Torres Plasencia, Nicole Alexandra

El caso de estudio que hemos seleccionado recopila información de partidos anteriores

El conjunto de datos (dataset) seleccionado contiene toda la información de cada jornada

Descripción del Descripción

 IDENTIFICANDO LAS ETIQUETAS DE CLASIFICACIÓN/REGRESIÓN/CLUSTERINS

COLOCAR EL LINK DE LA DATASET

También podría gustarte