Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Exposicion Panda 236
Exposicion Panda 236
Tema:
Manejo Avanzado de Panda
MANEJO AVANZADO DE PANDAS
PANDAS ES UNA HERRAMIENTA DE MANIPULACIÓN DE DATOS DE ALTO NIVEL DESARROLLADA POR WES MCKINNEY. ES
CONSTRUIDO SOBRE NUMPY Y PERMITE EL ANÁLISIS DE DATOS QUE CUENTA CON LAS ESTRUCTURAS DE DATOS QUE
NECESITAMOS PARA LIMPIAR LOS DATOS EN BRUTO Y QUE SEAN APTOS PARA EL ANÁLISIS (POR
EJEMPLO, TABLAS). COMO PANDAS PERMITE REALIZAR TAREAS IMPORTANTES, COMO ALINEAR DATOS PARA SU
COMPARACIÓN, FUSIONAR CONJUNTOS DE DATOS, GESTIÓN DE DATOS PERDIDOS, ETC., SE HA CONVERTIDO EN UNA
LIBRERÍA MUY IMPORTANTE PARA PROCESAR DATOS A ALTO NIVEL EN PYTHON (ES DECIR, ESTADÍSTICAS ). PANDAS FUE
DISEÑADA ORIGINALMENTE PARA GESTIONAR DATOS FINANCIEROS, Y COMO ALTERNATIVO AL USO DE HOJAS DE CÁLCULO
(ES DECIR, MICROSOFT EXCEL).
Las características de la biblioteca son
El tipo de datos son DataFrame para manipulación de datos con indexación integrada. Tiene herramientas para leer
y escribir datos entre estructuras de dato en memoria y formatos de archivos variados
Puedes realizar cadenas de operaciones, dividir, aplicar y combinar sobre conjuntos de datos, la mezcla y unión de
datos.
Permite realizar indexación jerárquica de ejes para trabajar con datos de altas dimensiones en estructuras de datos
de menor dimensión, la funcionalidad de series de tiempo: generación de rangos de fechas y conversión de
frecuencias, desplazamiento de ventanas estadísticas y de regresiones lineales, desplazamiento de fechas y retrasos.
PANDAS PROPORCIONA HERRAMIENTAS QUE
PERMITEN:
Leer y escribir datos en diferentes formatos: CSV, JSON, Excel, bases SQL y formato HDF5
seleccionar y filtrar de manera sencilla tablas de datos en función de posición, valor o etiquetas
• Una serie es el primer tipo de datos de pandas y es muy similar a una matriz NumPy (de
hecho está construida sobre el objeto de matriz NumPy). Lo que diferencia un arreglo
NumPy de una serie, es que una serie puede tener etiquetas en los ejes, lo que significa
que puede ser indexada por una etiqueta, en lugar de solo una ubicación numérica.
Tampoco necesita contener datos numéricos, puede contener cualquier Objeto de Python
arbitrario.
DATAFRAME