Está en la página 1de 1

UNIVERSIDAD DE MANIZALES

FACULTAD DE CIENCIAS E INGENIERÍA


DIPLOMADO EN ANÁLISIS Y VISUALIZACIÓN DE DATOS

PRACTICA #1: ESTRUCTURAS DE DATOS Y GRÁFICAS

1. Cargar la base de datos taxis2.csv en Google Colab


2. Muestre los primeros 10 registros en ventana. Muestre los últimos 10 registros en
ventana
3. Muestre el número de registros y variables de la base de datos
4. Muestre información de las variables, elementos no nulos y tipo de variable
5. Genere un DataFrame llamado df, que sea igual a taxis2 pero eliminando las
siguientes variables: recogida, entrega, Zona_Recogida y Zona_Entrega
6. Genere un DataFrame df2, que tome los primeros 1000 registros del df
7. Verifique que la base de datos df2 no tenga registros duplicados, en caso de existir
eliminelos
8. Construya una variable llamada dist y agréguela a df2 donde tome la variable
distancia y la convierta en categórica de la siguiente manera, si la distancia es menor
que 10 km la llama corta y las demás la llama larga.
9. Determine cuantas carreras de df2 fueron cortas y cuantas largas
10. Genere un gráfico de barra para los valores obtenidos en el punto anterior
11. Genere una tabla cruzada llamada tabla1 entre el color del taxi y el tipo de pago
12. Indique que porcentaje de las personas que pago con tarjeta de crédito uso taxí
amarillo y cuantos usaron taxi verde.
13. Genere un resumen descriptivo de las siguientes variables: distancia, tarifa y propina
14. Genere un gráfico de caja de las variables distancia, tarifa y propina. Se evidencian
valores extremos
15. Genere un gráfico de caja comparativo entre las variables pago y distancia, pago y
tarifa y pago y propina
16. Con la función groupby genere una tabla comparativa llamada tabla2 del pago con
distancia, tarifa y propina donde calcule la media o promedio, mediana, y los
cuartiles 1 y 3
17. Haga la misma tabla del punto anterior, pero con el color del taxi
18. Haga un gráfico de dispersión entre las variables distancia y propina. Ingrese un
titulo y etiquetas a los ejes
19. Haga un gráfico de dispersión entre las variables tarifa y propina. Ingrese un titulo y
etiquetas a los ejes
20. Exporte las siguientes tablas a Excel: df2, tabla1, tabla2

También podría gustarte