Está en la página 1de 1

Caso de estudio: Reconocimiento de vinos

El conjunto de datos wine.data contiene resultados del análisis de químico de vinos


provenientes de tres diferentes productores de cultivos en la misma región de Italia. Contiene
trece diferentes medidas tomadas de los diferentes constituyentes encontrados en los tres
tipos de vinos.

Fuente de datos: scikit-learn.org/stable/datasets/index.html en el punto 7.2.6 Wine recognition


dataset

Para esta actividad se puede usar ya sea Weka, librerías de Scikit-learn o inclusive un software
estadístico como R y para generar gráficas ademas de las herramientas antes mencionadas se
puede usar Gnuplot.

Instrucciones:
a) Identificar qué propiedades describen o a qué se refiere cada una de los atributos que
definen el conjunto de datos.
b) Identificar el tipo de dato con el que se representa cada una de los atributos (boleano,
binario, entero, nominal, real, entre otros)
c) Obtener los estadísticos descriptivos básicos de cada uno de los atributos (Media,
desviación estándar, mediana, máximo, mínimo y cuartiles)
d) Obtener el gráfico de la distribución de datos de cada uno de los atributos.
e) Obtener el diagrama de dispersión de datos de acuerdo al tipo de vino para cada uno de
los artibutos.
f) Analizar la información obtenida con los inciso anteriores y concluir a priori (antes de
analizar con otras herramientas), cuales pueden ser los atributos que mejor poder
discriminante sobre la clase tipo de vino.

También podría gustarte