Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El nombre «Pandas» es en realidad una contracción del término «Panel Data» para
series de datos que incluyen observaciones a lo largo de varios periodos de
tiempo. La biblioteca se creó como herramienta de alto nivel para el análisis en
Python.
Los datos son información o hechos que se recopilan o registran y que pueden
ser procesados, almacenados y analizados.
Los datos pueden tomar muchas formas, incluyendo números, texto, imágenes,
sonido, etc.
Las series son estructuras similares a los arrays, de una dimensión, sus
elementos tienen que ser del mismo tipo de dato.
Ejemplo:
Import pandas as pd
s = pd.Series([‘Programacion’, ‘Economia’, ‘Contabilidad’])
s
Ejemplo:
import pandas as pd
s = pd.Series({‘Programacion’: 9.8, ‘Economia’: 8.2, ‘Contabilidad’ : 7.9})
s
Ejemplo:
import pandas as pd
datos = {‘nombre’:[‘María’, ‘Luis’, ‘Carmen’, ‘Antonio’],
‘edad’:[18, 22, 20, 21],
‘grado’:[‘Economía’, ‘Medicina’, ‘Arquitectura’, ‘Economía’],
‘correo’:[‘maria@gmail.com’,‘luis@yahoo.es’,‘carmen@gmail.com’,‘antonio@gmail.
com’]
}
df = pd.DataFrame(datos)
df
Un objeto del tipo DataFrame define un conjunto de datos estructurado en forma
de tabla donde cada columna es un objeto de tipo Series, es decir, todos los datos
de una misma columna son del mismo tipo, y las filas son registros que pueden
contender datos de distintos tipos.
CREACIÓN DE SERIES
serie = pd.Series(<Origen>)
diccionario_python = {
‘A’:10,
‘B’:20,
‘C’:30,
‘D’:40,
‘E’:50
edades_diccionario = pd.Series(diccionario_python)
eedades_diccionario
edades_arreglo.index
Nuevos_indices = [‘a’,’b’,’c’,’d’,’e’]
edades_arreglo
DATAFRAME
CREACIÓN DE DATAFRAME
objeto_dataframe = pd.DataFrame(<Origen>)
Origen puede ser cualquier fuente que admita dos dimensiones: puede ser una
lista de listas, un arreglo de numpy o un diccionario.
Uno de los orígenes más comunes son los archivos CSV (Comma Separated
Values).
Para cargar datos de un archivo CSV a un DataFrame, se utiliza la siguiente
sintaxis:
A partir de ese momento, los datos del archivo CSV estarán disponibles a través
del objeto_contenedor para su procesamiento en Pandas.
Los tipos de datos que considera Pandas no son los mismos que considera
Python:
Para ver la estructura del DataFrame, o darnos una idea de su composición,
disponemos de los siguientes métodos y atributos.
import pandas as pd
data_frame = pd.read_csv(‘archivo_csv’)