Está en la página 1de 5

ANÁLISIS DISCRIMINANTE

PREDICCIÓN DE DEPORTE

CONTEXTO
Gill dirige una academia deportiva diseñada para ayudar a
los atletas de secundaria a alcanzar su máximo potencial
atlético. Por el lado de los niños de su academia, se
enfoca en cuatro deportes principales: Fútbol, Baloncesto,
Béisbol y Hockey. Descubrió que, si bien muchos atletas
de secundaria disfrutan participar en varios deportes en la
escuela secundaria, cuando comienzan a considerar
practicar un deporte a nivel universitario, prefieren
especializarse en un deporte. A medida que ha trabajado
con atletas a lo largo de los años, Gill ha desarrollado un
extenso conjunto de datos y ahora se pregunta si puede
usar el desempeño anterior de algunos de sus clientes
anteriores para predecir deportes principales para atletas
de secundaria prometedores. En última instancia, espera
poder hacer una recomendación a cada atleta sobre el
deporte en el que probablemente deberían elegir
especializarse. Al evaluar el desempeño de cada atleta a
través de una serie de pruebas, Gill espera que podamos
ayudarlo a determinar para qué deporte cada atleta tiene
la mayor aptitud.
DATOS:
Edad: Es la edad en años (una precisión decimal para la
parte del año desde el último cumpleaños del cliente) en
el momento en que se administró la prueba de rasgos
atléticos y de personalidad. Los participantes tenían entre
13 y 19 años en el momento de las pruebas.
Fuerza: Esta es la fuerza del participante medida a través
de una serie de ejercicios de levantamiento de pesas y
registrada en una escala de 0 a 10, siendo 0 fuerza
limitada y 10 fuerza suficiente para realizar todos los
levantamientos sin ninguna dificultad. Ningún participante
obtuvo una puntuación de 8, 9 o 10, pero algunos
participantes obtuvieron una puntuación de 0.
Rapidez: Este es el desempeño del participante en una
serie de pruebas de capacidad de respuesta. Se
cronometró a los participantes la rapidez con la que
podían presionar los botones cuando estaban iluminados
o saltar cuando sonaba un timbre. Sus tiempos de
respuesta se tabularon en una escala de 0 a 6, siendo 6
una respuesta extremadamente rápida y 0 muy lenta. Los
participantes puntuaron en todo el espectro de este
atributo.
Lesión: esta es una columna simple de sí (1) / no (0) que
indica si el joven atleta ya había sufrido o no una lesión
relacionada con el atletismo que fue lo suficientemente
grave como para requerir cirugía u otra intervención
médica importante. Las lesiones comunes tratadas con
hielo, descanso, estiramiento, etc. se ingresaron como 0.
Las lesiones que tardaron más de tres semanas en sanar,
que requirieron fisioterapia o cirugía se marcaron como 1.

Visión: los atletas no solo fueron evaluados en la escala


de visión habitual de 20/20 utilizando una tabla
optométrica, sino que también fueron evaluados utilizando
tecnología de seguimiento ocular para ver qué tan bien
podían recoger objetos visualmente. Esta prueba desafió
a los participantes a identificar elementos que se movían
rápidamente a través de su campo de visión y a estimar la
velocidad y la dirección de los objetos en movimiento. Sus
puntajes se registraron en una escala de 0 a 4, siendo 4
una visión perfecta e identificación de objetos en
movimiento. Ningún participante obtuvo un 4 perfecto,
pero las puntuaciones oscilaron entre 0 y 3.
Resistencia: Los participantes se sometieron a una serie
de pruebas de aptitud física, que incluyeron carrera,
calistenia, ejercicio aeróbico y cardiovascular, y natación a
distancia. Su desempeño se calificó en una escala de 0 a
10, donde 10 representa la capacidad de realizar todas
las tareas sin fatiga de ningún tipo. Las puntuaciones
oscilaron entre 0 y 6 en este atributo. Se ha observado
que ni siquiera los atletas profesionales mejor preparados
podrían obtener un 10 en esta parte de la prueba, ya que
está diseñada específicamente para probar los límites de
la resistencia humana.
Agilidad: esta es la puntuación del participante en una
serie de pruebas de su capacidad para moverse, girar,
girar, saltar, cambiar de dirección, etc. La prueba verificó
la capacidad del atleta para moverse con agilidad,
precisión y fuerza en una amplia gama de direcciones.
Esta métrica es de naturaleza integral y está influenciada
por algunas de las otras métricas, ya que la agilidad a
menudo está dictada por la fuerza, la rapidez, etc. han
encontrado un rendimiento entre 13 y 80.
Toma de decisiones: esta parte evalúa el proceso del
atleta para decidir qué hacer en situaciones deportivas.
Los atletas participaron en simulaciones que pusieron a
prueba sus elecciones de si batear o no batear, pasar una
pelota, moverse a una ubicación potencialmente
ventajosa de una superficie de juego, etc. Sus puntajes
debían haber sido registrados en una escala de 0 a 100.
Sin embargo, la academia ha indicado que nadie que
completó la prueba debería haber podido obtener una
puntuación inferior a 3, ya que se otorgan tres puntos
simplemente por ingresar y salir con éxito de la toma
de decisiones como parte de la evaluación.
Prime_Sport: este atributo es el deporte en el que cada
uno de los 453 atletas se especializó después de dejar la
academia deportiva. Este es el atributo que la academia
deportiva espera poder predecir para sus clientes
actuales. Para los niños de este estudio, este atributo será
uno de cuatro deportes: fútbol (americano, no fútbol; lo
siento, fanáticos del fútbol), baloncesto, béisbol o hockey.

ANÁLISIS DISCRIMINANTE
El análisis discriminante se parece mucho a la agrupación
de k-medias, en el sentido de que agrupa las
observaciones en tipos de valores similares, pero también
nos brinda algo más, y es la capacidad de predecir.

Tipos de modelos de minería/ciencia de datos


El análisis discriminante nos ayuda a cruzar esa
intersección que se ve en el diagrama de Venn.
Hace uso de conjunto de datos de entrenamiento y de
datos de prueba.

PREPARACIÓN DE DATOS
a) Chapter07DataSet_Scoring.csv
b)Chapter07DataSet_Training.csv.

También podría gustarte