Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ingeniería de Software
Física Electromagnética
Taller 3-2: Ensayo sobre la semana de innovación
INTRODUCCIÓN
PySpark permite trabajar con un volumen muy grande de datos y por último
GitHub debido a que permite guardar el código de forma remota y a su vez
permite crear el versionamiento de los proyectos.
Para llevar a cabo la ciencia de datos es necesario llevar un proceso que incluye
las siguientes fases.
Planificación: Definir el proyecto y sus posibles resultados.
Construcción del modelo: Por lo general los científicos usan diferentes bibliotecas
y APIS de código abierto para construir sus modelos de aprendizaje que ayuden
con el consumo de datos, la visualización y creación de perfiles de datos.
Evaluar el modelo: Los científicos de datos deben garantizar la exactitud de sus
modelos de datos antes de implementarlos, es por eso que se debe evaluar a
profundidad los modelos que se pueden utilizar para lograr los objetivos.
Monitorear los modelos: Una vez implementado, se debe monitorear debido a que
con el paso del tiempo los datos con los que se entrenan los modelos suelen
convertirse en obsoletos, por lo tanto, en el futuro el modelo deberá actualizarse.