Está en la página 1de 3

INTRO A CS: PROYECTO FINAL

1
INTEGRANTES

DATOS

CORREOS NÚMERO Integrante

🥼 FERNANDO MAQUERA PEÑA 999475476 FERNANDO

🥼 ALEXANDER ALIAGA CAMPOS 993116868 ALEXANDER

🥼 BENJAMIN AYRA FRANCISCO 917029087 BENJAMIN

🥼 KATO 953909915 KATO

🥼 GABRIEL SALAZAR MASSARO 998399900 GABRIEL

ACTIVIDAD 1: SMOGON

LA PARTE UNO CONSISTE EN


ENFOCARNOS EN LA COLUMNA MOVES

INTRO A CS: PROYECTO FINAL 1 1


DEL CSV DE SMOGON. SI HACEMOS
UN COUNT VECTORIZER DE TODAS
LAS PALABRAS SE AGRUPARAN LOS
POKEMON QUE TIENEN UN ATAQUE
COMPARTIDO. LOS ATAQUES DE UN
POKEMON DE UN TIPO SE PARECEN
A LOS ATAQUES DE OTROS POKEMON
DEL MISMO TIPO. SI EN EL
TRABAJO SOLO NOS IMPORTA SI SE QUIERE SOLO SE PUEDE
MOVES, NOS IMPORTARÁ, SIENDO TRABAJAR CON UNA SOLA COLUMNA.
LO MÁS IMPORTANTE, LOS MOVES PODEMOS SEPARAR MOVES CON
DE LOS POKEMON EN EL CSV. UN MOVES MAS ESPACIO Y PODEMOS
POKEMON APRENDE MUCHOS DARLE UNA IDENTACIÓN AL TEXTO
ATAQUES, PERO PRINCIPALMENTE DESPUÉS DE CADA PUNTO PARA
APRENDE ATAQUES DE SU TIPO. Y SEPARAR LOS
ESPECIFICAMENTE, LOS POKEMON MOVIMIENTOS(CTRL+F).LAS
DE UN TIPO APRENDEN ATAQUES PALABRAS QUE ESTÁN BIEN
QUE ÚNICAMENTE LE PERTENECEN PUESTAS SON MAYORES A LAS QUE
AL TIPO INDICADO. ALGUNAS ESTÁN PEGADAS A UN PUNTO.
PALABRAS SE REPETIRAN EN
POKEMON DEPENDIENDO DE SU
TIPO. LA COMPUTADORA SOLO
VERIFICARA LA REITERACIÓN DE
LAS PALABRAS, SOLO LE IMPORTAN
SI APARECEN O NO
APARECEN.DEBEMOS METER LA
COLUMNA MOVES AL CLUSTERIN,
METERLO A UN COUNT VECTORIZER
CON TODAS LAS PALABRAS Y
COMENZAMOS A AGRUPAR CON ESO.

-KMeans: Media o promedio

CountVectorizer nos cuenta la reiteración de una palabra. No


queremos eso

INTRO A CS: PROYECTO FINAL 1 2


La matriz TFIDF se muestra con x.toarray.

El token del trabajo es la cabecera de la columna.

Como en el trabajo piden el número total de tokens, debemos


printear el len(vec.vocabulary_)

n_grama: pareja de n tokens

INTRO A CS: PROYECTO FINAL 1 3

También podría gustarte