Está en la página 1de 1

Programa

FRH-Analytics UFCG/HP
Data Mining

20821003 Andr Farias Aranha Monteiro

Q1)
Utilizando uma fronteira de regress linear no foi possvel obter um resultado
satisfatrio, onde o R2 foi de 0.1599, e o grfico abaixo representa no eixo Y os
valores da classe, 0 ou 1, e no eixo X a idade do homem. Foi escolhido a idade do
homem, pois escolhendo a da mulher o R2 era pior, de apenas 0.01664. A
ferramento utilizada foi o R sem nenhuma biblioteca adicional.



Q2) Para essa segunda questo estou pensando em utilizar o R, j dei uma olhada
e vi a biblioteca tree, que d para criar alguns tipos de rvores, porm irei ver se
mais simples usando o Weka.
Q2.1) Utilizando o Weka tentarei encontrar alguma rvore com uma
configurao que acerte aproximadamente 80% dos dados.
Q2.2) Utilizando o Weka ou o R , provavelmente o R, pois para a rede
neural eu j possuo o algortmo, irei rodar uma rede neural varias vezes e pegar
o intervalo de confiana para estimar a taxa de acerto, depois no prprio R ou no
Weka sera rodado o algortmo de vizinhos mais prximos, que ainda irei
procurar como as duas ferramentas a implementam.

Q03) Essa questo irei responder assim que obter os resultados das questes
acima, irei ver qual situao melhor para cada caso: rvore de deciso, redes
neurais e vizinhos mais prximos.

También podría gustarte