Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bare JRNL Compsoc
Bare JRNL Compsoc
de la
herramienta weka. Los resultados nos muestran que todos
los atributos son relevantes para la clasicacin.
Para el training y test hemos escogido el mtodo
crossvalidation y nos presenta los siguientes resultados.
3.3. Algoritmo PART
Basados en Reglas: PART No cambiamos ningn
parmetro en las conguraciones de este algoritmo.
Figura 1. Resultados algoritmo PART
En esta parte nos damos cuenta que este algoritmo tiene
una efectividad del 76.5854 % y que tiene un error del
0.0893. Dichos resultados nos permiten apreciar que este
algoritmo no es del todo bueno.
Figura 2. Clasicacin PART
Mtodos Probabilsticos: BayesNet
Figura 3. Resultados algoritmo BayesNet
La interpretacin de los resultados sera que este
algoritmo tiene una efectividad del 68.2927 % y que
tiene un error del 0.1122 que no parece ser la mejor por
su baja efectividad.
Figura 4. Clasicacin BayesNet
Comparacin entre los algoritmos.
3
Algoritmo Efectividad Error Tiempo
PART 76.5854 % 0.0893 0.19
BayesNet 68.2927 % 0.1122 0.05
Nos podemos dar cuenta que el mtodo ms efectivo
y ms rpido es el PART ya que obtenemos mejores
resultados. Tenemos mayor efectividad y menor error.
3.4. Prediccin
Para este problema necesitamos predecir la clase
precio de un vehculo dadas algunas caractersticas.
Para el training y test hemos escogido el mtodo
crossvalidation y nos presenta los siguientes resultados.
Redes Neuronales: MultiLayerPerceptron. Primero
utilizamos los valores por defecto en las conguraciones.
Figura 5. Resultados MultilayerPerceptron
Estos resultados nos muestran que el coeciente de
correlacin es 0.8418 es decir que la efectividad es del
84 % , adems que el error mximo es 2342.0942 en
el precio del vehculo. Los resultados son buenos sin
embargo el tiempo de aprendizaje es bastante superior
al de otros algoritmos.
Figura 6. Perdiccin MultilayerPerceptron
Al cambiar el nmero de capas ocultas del algoritmo
tenemos que el coeciente de correlacin es 0.8346 es
Figura 7. Resultados MultilayerPerceptron 10 capas
decir que la efectividad es del 83 % , adems que el
error mximo es 2679.8109 en el precio del vehculo,
por lo que nos quedamos con la primera conguracin
ya que tiene mejores resultados.
SVM: LinearRegresion: No cambiamos ningn
parmetro de conguracin de este algoritmo.
Figura 8. Resultados LinearRegresion
El coeciente de correlacin es de 0.8261 y el error
mximo es 2372.259 en el precio de un vehculo. Estos
resultados son bastante buenos ya que tiene una alta
efectividad y el error es menor
Figura 9. Prediccin LinearRegresion
4
Comparacin entre los algoritmos.
Algoritmo Correlacin Error Tiempo
MultilayerPerceptron1 0.8418 2342.0942 34.17
MultilayerPerceptron2 0.8346 2679.8109 10.25
LinearRegresion 0.8261 2372.259 0.33
Nos podemos dar cuenta que el mtodo ms efectivo
y ms rpido es el Linear regresin ya que obtenemos
mejores resultados. Adems el tiempo de aprendizaje es
mucho menor q los otros algoritmos.
3.5. Clusterizacin
El algoritmo utilizado es el k-means para 5 clsters.
Adems utilizamos el mtodo dela distancia euclideana.
Para este caso lo que hacemos es ignorar todos los
valores que son numricos y dejamos solo los atributos
nominales.
Figura 10. Centroides y atributos Kmeans
Vamos a interpretar estos resultados. La gura nos
muestra cada uno de los atributos y cual se repite ms
en cada clster, es decir nos muestran los centroides
en cada clster. Nos podemos dar cuenta que en todos
los grupos creados prevalece la gasolina como tipo de
combustible y que el tipo de motor es ohc en casi todos
excepto uno.
Figura 11. Clster Kmeans
4 CONCLUSIN
En este trabajo se ha podido demostrar la gran utilidad
que tiene la minera de datos al aplicarla a un caso real.
Hemos experimentado lo sencillo que es mediante
WEKA el anlisis y estudio estos datos, y su posterior
interpretacin.
Hemos decidido utilizar todas las posibilidades que
nos ofrece esta herramienta para hacer un estudio ms
completo.
REFERENCIAS
[1] Introduccin a la Minera de Datos.- Jos Hernndez Orallo,
Ramrez Quintana, M
a
Jos, Ferri Ramrez, Csar.- Madrid
Pearson (Prentice Hall), 2005 .- DL-TO: 0438-2005 .- ISBN:
8420540919
Minera de datos. Tcnicas y Herramientas.- Prez Lpez,
Csar, Santn Gonzlez, Daniel .- Madrid: Thomson, 2007.-
DL-M: 7886-2007
Explotacin de Datos del Web Mining.- Gimena
Moreno [Consultada: 20-02-2009]. Disponible en Internet
http://gamoreno.wordpress.com/2007/08/24/explotacion-de-
datos-del-web-mining