Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad 1 Saber Hacer
Unidad 1 Saber Hacer
Ingeniería
En
Elaborado por:
Josué Martínez Hernández
Maestro:
M.A. Patricia Guadalupe Mora González
Introducción 1
Fuentes de datos 2
Power BI 3
Conclusiones 5
Introducción
1
Fuentes de datos
La fuente de datos que uso para elaborar este reporte fue de un repositorio de
GitHub llamado vgsales-data-analysis el cual a su vez se basó de una página web
llamada VGChartz usando el web scraping. El archivo en formato CSV contiene
información sobre videojuegos con ventas por región mayores a 100,000 copias.
El diagrama explica el proceso que se llevó a cabo desde la recolección de los datos
desde VGChartz mediante el web scraping, luego paso por el proceso de
transformación en donde se le dio un formato CSV a los datos, para luego cargarlos
en el repositorio de GitHub. Y al final se descargan esos datos y se cargan en Power
BI para realizar la visualización de los datos.
2
Procesamiento paralelo de los datos
Power BI
3
4
Conclusiones
1. Con respecto al proceso que se llevó a cabo se concluyó que hay varias
fuentes de datos las cuales no todas son accesibles de manera sencilla ya
que en algunos casos se necesitará de un permiso por parte de la empresa
que aloja los datos, mientras que en el caso de otras los datos pueden estar
al alcance de cualquiera que desee utilizarlo, como sucede con GitHub
(exceptuando los que requieren de acceder a los datos por medio de otro
servicio).