0 calificaciones0% encontró este documento útil (0 votos)
18 vistas3 páginas
Este documento presenta un proyecto final para una clase de introducción a la ciencia de la computación. Incluye una lista de los integrantes del proyecto con sus nombres, números y correos electrónicos. La primera actividad se enfoca en analizar la columna "Moves" de un CSV de Smogon para agrupar Pokémon que comparten ataques mediante count vectorization. Explica que los Pokémon de un tipo aprenden ataques similares y que algunas palabras se repetirán dependiendo del tipo.
Este documento presenta un proyecto final para una clase de introducción a la ciencia de la computación. Incluye una lista de los integrantes del proyecto con sus nombres, números y correos electrónicos. La primera actividad se enfoca en analizar la columna "Moves" de un CSV de Smogon para agrupar Pokémon que comparten ataques mediante count vectorization. Explica que los Pokémon de un tipo aprenden ataques similares y que algunas palabras se repetirán dependiendo del tipo.
Este documento presenta un proyecto final para una clase de introducción a la ciencia de la computación. Incluye una lista de los integrantes del proyecto con sus nombres, números y correos electrónicos. La primera actividad se enfoca en analizar la columna "Moves" de un CSV de Smogon para agrupar Pokémon que comparten ataques mediante count vectorization. Explica que los Pokémon de un tipo aprenden ataques similares y que algunas palabras se repetirán dependiendo del tipo.
DEL CSV DE SMOGON. SI HACEMOS UN COUNT VECTORIZER DE TODAS LAS PALABRAS SE AGRUPARAN LOS POKEMON QUE TIENEN UN ATAQUE COMPARTIDO. LOS ATAQUES DE UN POKEMON DE UN TIPO SE PARECEN A LOS ATAQUES DE OTROS POKEMON DEL MISMO TIPO. SI EN EL TRABAJO SOLO NOS IMPORTA SI SE QUIERE SOLO SE PUEDE MOVES, NOS IMPORTARÁ, SIENDO TRABAJAR CON UNA SOLA COLUMNA. LO MÁS IMPORTANTE, LOS MOVES PODEMOS SEPARAR MOVES CON DE LOS POKEMON EN EL CSV. UN MOVES MAS ESPACIO Y PODEMOS POKEMON APRENDE MUCHOS DARLE UNA IDENTACIÓN AL TEXTO ATAQUES, PERO PRINCIPALMENTE DESPUÉS DE CADA PUNTO PARA APRENDE ATAQUES DE SU TIPO. Y SEPARAR LOS ESPECIFICAMENTE, LOS POKEMON MOVIMIENTOS(CTRL+F).LAS DE UN TIPO APRENDEN ATAQUES PALABRAS QUE ESTÁN BIEN QUE ÚNICAMENTE LE PERTENECEN PUESTAS SON MAYORES A LAS QUE AL TIPO INDICADO. ALGUNAS ESTÁN PEGADAS A UN PUNTO. PALABRAS SE REPETIRAN EN POKEMON DEPENDIENDO DE SU TIPO. LA COMPUTADORA SOLO VERIFICARA LA REITERACIÓN DE LAS PALABRAS, SOLO LE IMPORTAN SI APARECEN O NO APARECEN.DEBEMOS METER LA COLUMNA MOVES AL CLUSTERIN, METERLO A UN COUNT VECTORIZER CON TODAS LAS PALABRAS Y COMENZAMOS A AGRUPAR CON ESO.
-KMeans: Media o promedio
CountVectorizer nos cuenta la reiteración de una palabra. No
queremos eso
INTRO A CS: PROYECTO FINAL 1 2
La matriz TFIDF se muestra con x.toarray.
El token del trabajo es la cabecera de la columna.
Como en el trabajo piden el número total de tokens, debemos