Está en la página 1de 7

WEKA: RESUMEN

Como convertir un archivo XLSX a ARFF para su lectura en WEKA


1 Convierto el archivo xlsx a csv (Abro Excel y le doy a guardar como .csv) 2 Ahora abro el archivo .csv con el Bloc de Notas 3 En el Bloc de Notas reemplazo , por . (si es que mi Excel me ha detectado los puntos (1.15) como comas (Excel: 1,5). Cmo se hace? En la barra de herramientas pulsamos Edicin/Reemplazar, completamos (Buscar: , / Reemplazar: . ) y le damos a Reemplazar Todo. Salimos dndole a la X de la ventana. 4 En el Bloc de Notas Reemplazo ; por , 5 En el Bloc de Notas guardo como TelefoniaMovil-2012.csv (NOTA: Weka puede abrir los archivos .csv 5 Abrimos Weka y le damos a open file, seleccionamos TelefoniaMovil-2012.csv y guardamos como TelefoniaMovil-2012.arff. Desde aqu podemos trabajar.
Como crear archivos ARFF a partir de una relacin de datos para su lectura en WEKA (no es comn en examen)
1 ABRIR BLOC DE NOTAS Y TRABAJAR EN ESTE: COPIAMOS LOS DATOS DADOS POR EL ENUNCIADO Y AADIMOS LO SIGUIENTE:
@relation (EN MINSCULAS) Y CREAMOS UNA RELACIN (SIEMPRE SEPARADA CON GUIN; EJEMPLO: VISTALENTES) @attribute (EN MINSCULAS) ANTES DEL ATRIBUTO PARA DIFERENCIAR LOS DATOS, LO PONEMOS ANTES DE CADA ATRIBUTO @data (EN MINSCULAS) ANTES DE TODOS LOS DATOS (CON PONERLO UNA VEZ SIRVE) VEASE LO QUE PONEMOS EN EL NUEVO DOCUMENTO DE BLOC DE NOTAS @relation vista-lentes @attribute edad {joven, pre-vistacansada, vistacansada} @attribute prescripcin {miopia, hipermetropa} @attribute astigmatismo {no, si} @attribute produccion-lagrimas {reducida, normal} @attribute lentes-contacto {suaves, hard, ningunos} @data joven,miopia,no,reducida,ningunos joven,miopia,no,normal,suaves joven,miopia,si,reducida,ningunos joven,miopia,si,normal,hard joven,hipermetropa,no,reducida,ningunos joven,hipermetropa,no,normal,suaves joven,hipermetropa,si,reducida,ningunos joven,hipermetropa,si,normal,hard pre-vistacansada,miopia,no,reducida,ningunos pre-vistacansada,miopia,no,normal,suaves pre-vistacansada,miopia,si,reducida,ningunos pre-vistacansada,miopia,si,normal,hard pre-vistacansada,hipermetropa,no,reducida,ningunos pre-vistacansada,hipermetropa,no,normal,suaves pre-vistacansada,hipermetropa,si,reducida,ningunos pre-vistacansada,hipermetropa,si,normal,ningunos vistacansada,miopia,no,reducida,ningunos vistacansada,miopia,no,normal,ningunos vistacansada,miopia,si,reducida,ningunos vistacansada,miopia,si,normal,hard vistacansada,hipermetropa,no,reducida,ningunos vistacansada,hipermetropa,no,normal,suaves vistacansada,hipermetropa,si,reducida,ningunos vistacansada,hipermetropa,si,normal,ningunos

CUANDO TENGAMOS TODO PUESTO EN EL DOCUMENTO DEL BLOC DE NOTAS (COLOR VERDE) LE DAMOS A GUARDAR COMO, ELEGIMOS TODOS LOS ARCHIVO, Y ASIGNAMOS UN NOMBRE DE DOCUMENTO CON LA EXTENSIN .ARFF (EJEMPLO: lentes.arff )

WEKA: RESUMEN

Como saber leer los datos que nos aparecen en la pestaa Preprocess:
Relation: Estudio de la relacin entre dos productos Instances: Es el tamao de la muestra, el nmero total de estudiados. Attribute: Es el nmero de atributos para comparar la muestra estudiada. POSIBLES PREGUNTAS: De las personas que intervinieron en el estudio, cuntas abandonaron y cuantas no abandonaron? Si nos preguntan que nmero de personas tienen un determinado atributo, seleccionamos el atributo abandon ltimos mes y vemos lo que pone en Count. (por ejemplo, no abandon: 538 personas). -

WEKA: RESUMEN

Como crear un rbol de decisin para generar reglas de asociacn:


1 Abrimos WEKA EXPLORER, 2 En la pestaa Preprocess seleccionamos Open File y buscamos el archivo ARFF con el cual queramos trabajar. 3 TRABAJANDO CON WEKA EXPLORER 4 Pestaa Classiffy 5 Pulsamos el botn choose y elegimos: weka/clasiffier/trees/j48 Asignamos el porcentaje dado (PERCENTAJE SPLIT) o bien el CROSS VALIDATION 6 Pulsamos Start y se crear el rbol de decisin 7 Para ver el rbol de decisin pulsamos con el botn derecho en tres.J48 que aparece en la izquierda de la ventana (visualizado en result list) y clickeamos en visualize tree POSIBLES PREGUNTAS: . Cuntas reglas de clasificacin se generan? Nmeros de hojas finales (los nmeros de RECTNGULOS) 19

Ahora vemos las REGLAS DE ASOCIACIN generadas que se reflejan con los datos expresados en RECTANGULOS (n de hojas finales). Tenemos que comentar estas reglas de asociacin en los ejercicios.

Cul es la precisin del modelo de clasificacin generado (Correctly classified instantes)? Correctly Classified Instances 563 89.7927 %

WEKA: RESUMEN
NOTA: - Precisin = Correctly Classified Instances - Error = Inorrectly Classified Instances

Cul es el perfil del las personas que NO abandonan los servicios de la empresa operadora de telecomunicaciones? Conjunto de reglas que indican no abandona y hay que describirlas de arriba abajo todas. Personas que NO estn suscritas al plan internacional: Que el nmero de llamadas al centro de atencin a clientes fue menor o igual a 3 y el total de minutos de maana facturados fue menor o igual a 226 NO ABANDONAN (420.0/12.0) 420-12= 378 pnas no abandonan de las 420 personas que si total de minutos de maana facturados fue menor o igual a 226. Que el nmero de llamadas al centro de atencin a clientes fue menor o igual a 3 y el total de minutos de maana facturados fue mayor a 226, que no estn suscritos a mensajes de voz y el total de minutos de maana facturados es menor o igual a 262.4 NO ABANDONAN (55.0/12.0) 55-12 = 43 pnas no abandonan de las 55 que su total de minutos de maana facturados es menor i igual a 262.4. seguira

NOTA: Qu explica esto? (420.0/12.0) en el rbol de decisin. 420.0 es el nmero total de personas estudiadas para esta regla de asociacin. 12 es el nmero total de personas estudiadas para este caso y no cumplen la regla de asociacin. 420-12=408 es el nmero total de personas estudiadas para este caso y que si cumplen la regla de asociacin.

WEKA: RESUMEN

Como Discretizar:
1 Para ello seleccionamos todos los atributos (pestaa Preprocess) y discretizamos: 2 Pulsamos en Choose (Filter). 3 Elegimos weka/filter/unsupervised/attibute/Discretize 4 Ponemos 5 bins (clickeamos sobre discretize en filter y nos aparecer una ventanita pequea, cambiamos 10 bins por 5 bins) Vease:

5 Pulsamos en el botn Apply Ahora tendremos los campos que son numerales en nominales, lo visualizaremos como intervalos [(inf-15821); (15821-26597)]

WEKA: RESUMEN

Como generar reglas de asociacin:


NOTA: Para poder aplicar reglas de asociacin a veces tendremos que discretizar los datos (pasarlos de nmeros a nominal), esto lo hacemos cuando el programa nos impida aplicar las reglas de asociacin) 1 Pulsamos en la pestaa Associate 2 Pinchamos sobre Choose y elegimos A priori (normalmente viene seleccionado) 3 Si nos dan la confianza mnima (70% por ejemplo) y que generemos un nmero determinado de reglas de asociacin (50 por ejemplo): Pulsamos encima de A priori y nos aparecer la siguiente ventana:

En minMetric nos aparecer la confianza, la modificamos: en vez de 0.9 ponemos 0.7 En numRules nos aparecer el nmero de reglas, lo modificamos: en vez de 10 reglas ponemos 50 reglas Pulsamos sobre OK para aceptar. 4 Le damos al botn Start 5 Nos aparecer Best rules found que son las reglas de funcionamiento del rbol de decisin.

WEKA: RESUMEN

Ejemplos de reglas: - Regla 30: El 89 % de los que pagaron un precio inferior a 28573.4 para un vehculo utilitario chico, tambin vivan en Mlaga - Regla 40: El 79 % de todoterrenos, tambin tenan un precio comprendido entre 28573.4 y 46326.8 - Regla 50: El 72 % de personas que tenan unos ingresos anuales inferiores a 15821 y vivan en Marbella, tambin eran hombres.

También podría gustarte