0 calificaciones0% encontró este documento útil (0 votos)
2 vistas1 página
Este documento presenta las instrucciones para una práctica sobre estructuras de datos y gráficas utilizando la base de datos de taxis. La práctica incluye cargar la base de datos, limpiarla, generar nuevas variables, tablas cruzadas y resúmenes descriptivos. También se piden diferentes gráficos como de barras, cajas y dispersión para visualizar las relaciones entre las variables como distancia, tarifa y propina. Finalmente se pide exportar tablas y resultados a Excel.
Este documento presenta las instrucciones para una práctica sobre estructuras de datos y gráficas utilizando la base de datos de taxis. La práctica incluye cargar la base de datos, limpiarla, generar nuevas variables, tablas cruzadas y resúmenes descriptivos. También se piden diferentes gráficos como de barras, cajas y dispersión para visualizar las relaciones entre las variables como distancia, tarifa y propina. Finalmente se pide exportar tablas y resultados a Excel.
Este documento presenta las instrucciones para una práctica sobre estructuras de datos y gráficas utilizando la base de datos de taxis. La práctica incluye cargar la base de datos, limpiarla, generar nuevas variables, tablas cruzadas y resúmenes descriptivos. También se piden diferentes gráficos como de barras, cajas y dispersión para visualizar las relaciones entre las variables como distancia, tarifa y propina. Finalmente se pide exportar tablas y resultados a Excel.
1. Cargar la base de datos taxis2.csv en Google Colab
2. Muestre los primeros 10 registros en ventana. Muestre los últimos 10 registros en ventana 3. Muestre el número de registros y variables de la base de datos 4. Muestre información de las variables, elementos no nulos y tipo de variable 5. Genere un DataFrame llamado df, que sea igual a taxis2 pero eliminando las siguientes variables: recogida, entrega, Zona_Recogida y Zona_Entrega 6. Genere un DataFrame df2, que tome los primeros 1000 registros del df 7. Verifique que la base de datos df2 no tenga registros duplicados, en caso de existir eliminelos 8. Construya una variable llamada dist y agréguela a df2 donde tome la variable distancia y la convierta en categórica de la siguiente manera, si la distancia es menor que 10 km la llama corta y las demás la llama larga. 9. Determine cuantas carreras de df2 fueron cortas y cuantas largas 10. Genere un gráfico de barra para los valores obtenidos en el punto anterior 11. Genere una tabla cruzada llamada tabla1 entre el color del taxi y el tipo de pago 12. Indique que porcentaje de las personas que pago con tarjeta de crédito uso taxí amarillo y cuantos usaron taxi verde. 13. Genere un resumen descriptivo de las siguientes variables: distancia, tarifa y propina 14. Genere un gráfico de caja de las variables distancia, tarifa y propina. Se evidencian valores extremos 15. Genere un gráfico de caja comparativo entre las variables pago y distancia, pago y tarifa y pago y propina 16. Con la función groupby genere una tabla comparativa llamada tabla2 del pago con distancia, tarifa y propina donde calcule la media o promedio, mediana, y los cuartiles 1 y 3 17. Haga la misma tabla del punto anterior, pero con el color del taxi 18. Haga un gráfico de dispersión entre las variables distancia y propina. Ingrese un titulo y etiquetas a los ejes 19. Haga un gráfico de dispersión entre las variables tarifa y propina. Ingrese un titulo y etiquetas a los ejes 20. Exporte las siguientes tablas a Excel: df2, tabla1, tabla2