Documentos de Académico
Documentos de Profesional
Documentos de Cultura
tipos de datos
Cómo leer archivos Excel
Tenemos un método especial llamado read_excel() para leer archivos de Excel. Es
parecido a read_csv() , con la diferencia de que read_excel() necesita dos argumentos:
la string con el nombre del archivo o la ruta del archivo y sheet_name (nombre de la
hoja). Si no hay un argumento sheet_name , el método lee la primera hoja por defecto.
import pandas as pd
df = pd.read_excel('file.xlsx', sheet_name='List1')
Para convertir los datos al tipo que buscamos utilizamos el método astype() . Un string
con el nombre del tipo se pasa como argumento.
Hay varias formas de representar fechas y horas, pero el formato unix time merece
una atención especial. Este formato nos da la cantidad de segundos que han pasado
desde las 00:00:00 del 1° de enero de 1970. Tiempo Unix corresponde al Tiempo
Universal Coordinado, o UTC por sus siglas en inglés.
A menudo tenemos que estudiar estadísticas por mes, día o año. Para hacerlo,
colocamos el tiempo en la clase DatetimeIndex y le aplicamos el atributo month,* day*,*
o year:
date['column'] = pd.DatetimeIndex(date['column']).month
A veces los datos cambian. Por ejemplo, una empresa podría empezar a trabajar
con un nuevo socio que envía datos defectuosos para la contabilidad, lo que hace
que el código falle.
try:
# código que podría tener un error
except:
# lo que sucede cuando se descubre el error mencionado
El método merge()
Los datos se almacenan en varias hojas en tablas de Excel. Antes de que puedas usar
todos los datos, debes unir las tablas.
right : el nombre del DataFrame o Serie que estamos uniendo con la tabla de
origen.
Tablas dinámicas
Las tablas dinámicas son tus mejores amigas cuando se trata de procesar datos
reorganizados o concentrados derivados de tablas enormes, enfocados en aspectos
particulares.
columns : la columna con los valores usados para agrupar los datos