Está en la página 1de 3

ASCT806 - Programación y Arquitectura de Sistemas

Evaluación Sumativa 3
DESAFÍO 1

Objetivo: Usar la librería pandas de Python para poder analizar uno más sets de datos de gran
tamaño.

Formato:
● Este trabajo debe realizarse en grupos de 2, 3 o 4 personas a inscribirse en
Canvas
● Se debe subir un informe de máximo 10 páginas (sin contar la portada, índice ni
anexos). Las secciones de Introducción, Desarrollo y Conclusión, además del
Resumen Ejecutivo, deben tener letra Arial tamaño 10 e interlineado 1.5,
además de estar justificadas.
● El informe debe incluir una portada, índice, resumen ejecutivo y numeración de
páginas.
● Puede incluir anexos de considerarlo necesario.
● Debe además incluir el código donde hizo los análisis (archivo .py), o el link al
replit, al subir el informe.

Descripción general: En este mini-proyecto, deberán analizar un set de datos según los
contenidos enseñados de la librería pandas de Python. Para esto, este enunciado describirá los
sets de datos, les pedirá algunos análisis específicos, y les dará indicaciones de cómo
estructurar su informe.

Descripción de los datos: Usted recibirá dos sets de datos: financial_transactions.csv y


card_info.csv. A continuación se describirá cada uno:
● financial_transactions.csv: Set de datos con las transferencias de una tienda de retail
que compra y vende productos. Cada transacción está asociada a un cliente (mediante
el customer_id). Contiene las siguientes columnas:
○ transaction_id: Un identificador único para cada transacción. Esto sería útil para
referenciar transacciones individuales.
○ transaction_date: Fecha en la que se realizó la transacción.
○ transaction_amount: Monto de cada transacción. El monto está en dólares
americanos.
○ customer_id: Un identificador único para cada cliente. Puede haber más de una
transacción asociado al mismo cliente.
○ customer_name: El nombre del cliente que realizó la transacción.
○ transaction_type: El tipo de transacción. Los posibles valores en este set de
datos son 'Compra', 'Venta', 'Devolución', 'Transferencia'.
ASCT806 - Programación y Arquitectura de Sistemas

● card_info.csv: Contiene la lista de todos los clientes de la tienda de retail y el tipo de


tarjetas que tienen (Visa o Mastercard). Contiene solo dos columnas:
○ customer_id: Un identificador único para cada cliente. En este set de datos, cada
cliente aparece solo una vez.
○ card: Puede ser Visa o Mastercard (solo estos valores).

Puede encontrar los datos en este link:


LINK

Análisis específicos:
1. Cargue el set de datos “financial_transactions.csv” a pandas como un DataFrame.
2. Imprima el Data Frame y los nombres de las columnas con sus tipos.
3. Muestre los estadísticos descriptivos para la columna “transaction_amount”.
4. Separe la columna “transaction_date” en 3 columnas “transaction_year”,
“transaction_month” y “transaction_day”.
5. Cree un archivo csv de nombre “2023_transactions.csv” con las transacciones solo del
año 2023.
6. Muestre el nombre del cliente con el monto más bajo en transacciones.
7. Muestre el nombre del cliente con el monto más alto en transacciones.
8. Muestre la media, mínimo y máximo del monto de los 4 tipos de transferencia (hint:
puede ocupar una pivot table).
9. Haga un merge con los datos de card_info.csv, agregando la columna “card_type” al
data frame.
10. Muestre la media, mínimo y máximo del monto de los 2 tipos de tarjeta de crédito, Visa y
Mastercard (hint: puede ocupar una pivot table). Debe agregar como dato secundario
(hint 2: columnas de la pivot table) el tipo de transacción.

Especificaciones:
● Se espera que el informe contenga las siguientes secciones y subsecciones (en este
orden):
○ Portada: Debe incluir nombre de los integrantes, logo de la universidad, título de
la evaluación y el número de desafío.
○ Índice
○ Resumen Ejecutivo: Debe incluir un pequeño resumen del informe, un resumen
del análisis realizado y resultados principales.
○ Introducción: Aquí debe describir cómo se estructura el informe, y describir
brevemente cada sección. No puede tener más de una plana de extensión.
○ Desarrollo:
■ Análisis: Aquí deberá indicar claramente qué tipo de análisis de datos
hizo usando pandas. Puede ir describiendo el código y explicar qué hizo
en cada parte. Se recomienda subir pantallazos del código y una
pequeña explicación.
■ Resultados: Aquí debe incluir todos los resultados de su análisis. Por
resultados se entiende lo que arrojará la consola después de ejecutar su
ASCT806 - Programación y Arquitectura de Sistemas

análisis. Además debe ir respondiendo uno a uno lo solicitado en


“Análisis específico”. Se recomienda incluir uno a uno los puntos de
“Análisis específico” y el resultado de la consola como pantallazo.
○ Conclusión: Aquí debe incluir los principales y más importantes resultados de
su análisis. No puede tener más de una plana de extensión.
● Se recomienda no comenzar por la Introducción. En general es lo último que deberían
hacer, junto al Resumen Ejecutivo.
● De hecho, se recomienda que comiencen con el código en Python que resuelva lo
solicitado en “Análisis específico”.
● Basta con que una persona de cada grupo suba su Evaluación Sumativa.
● NO OLVIDE SUBIR LOS CÓDIGOS EN PYTHON A CANVAS. De no hacerlo tendrá
puntaje 0 en la sección completa de Desarrollo.
● Se recomienda ocupar algún agente de inteligencia artificial como ChatGPT, Copilot (de
Replit) y otros.
● Si quiere hacer otro tipo de análisis en código fuera de lo solicitado, puede optar a
un Bonus de 15 puntos.

Rúbrica de Corrección:

Ítem Puntaje Puntaje


Ítem Obtenido

Aspectos formales Portada 5

Índice 5

Resumen Ejecutivo 5

Ortografía y Redacción 5

Formato del texto 5

Extensión informe 5

Introducción Estructura del informe 10

Desarrollo Análisis 25

Resultados 25

Conclusión Principales resultados y conclusiones 10

También podría gustarte