Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FRH-Analytics
UFCG/HP
Data
Mining
20821003
Andr
Farias
Aranha
Monteiro
Q1)
Utilizando
uma
fronteira
de
regress
linear
no
foi
possvel
obter
um
resultado
satisfatrio,
onde
o
R2
foi
de
0.1599,
e
o
grfico
abaixo
representa
no
eixo
Y
os
valores
da
classe,
0
ou
1,
e
no
eixo
X
a
idade
do
homem.
Foi
escolhido
a
idade
do
homem,
pois
escolhendo
a
da
mulher
o
R2
era
pior,
de
apenas
0.01664.
A
ferramento
utilizada
foi
o
R
sem
nenhuma
biblioteca
adicional.
Q2)
Para
essa
segunda
questo
estou
pensando
em
utilizar
o
R,
j
dei
uma
olhada
e
vi
a
biblioteca
tree,
que
d
para
criar
alguns
tipos
de
rvores,
porm
irei
ver
se
mais
simples
usando
o
Weka.
Q2.1)
Utilizando
o
Weka
tentarei
encontrar
alguma
rvore
com
uma
configurao
que
acerte
aproximadamente
80%
dos
dados.
Q2.2)
Utilizando
o
Weka
ou
o
R
,
provavelmente
o
R,
pois
para
a
rede
neural
eu
j
possuo
o
algortmo,
irei
rodar
uma
rede
neural
varias
vezes
e
pegar
o
intervalo
de
confiana
para
estimar
a
taxa
de
acerto,
depois
no
prprio
R
ou
no
Weka
sera
rodado
o
algortmo
de
vizinhos
mais
prximos,
que
ainda
irei
procurar
como
as
duas
ferramentas
a
implementam.
Q03)
Essa
questo
irei
responder
assim
que
obter
os
resultados
das
questes
acima,
irei
ver
qual
situao
melhor
para
cada
caso:
rvore
de
deciso,
redes
neurais
e
vizinhos
mais
prximos.