Está en la página 1de 7

UNIVERSIDAD DE GUAYAQUIL

FACULTAD DE INGENIERÍA INDUSTRIAL


Grupo: #5
Integrantes

Valencia orejuela Bladimir (expone)


Kaizala cueva Daniel ( investiga )
García Santana Jeremy (expone)
Erick ( investiga)
Gonzales cevallos Yolanda ( investiga )

Tema:
Manejo Avanzado de Panda
MANEJO AVANZADO DE PANDAS

PANDAS ES UNA HERRAMIENTA DE MANIPULACIÓN DE DATOS DE ALTO NIVEL DESARROLLADA POR WES MCKINNEY. ES
CONSTRUIDO SOBRE NUMPY Y PERMITE EL ANÁLISIS DE DATOS QUE CUENTA CON LAS ESTRUCTURAS DE DATOS QUE
NECESITAMOS PARA LIMPIAR LOS DATOS EN BRUTO Y QUE SEAN APTOS PARA EL ANÁLISIS (POR
EJEMPLO, TABLAS). COMO PANDAS PERMITE REALIZAR TAREAS IMPORTANTES, COMO ALINEAR DATOS PARA SU
COMPARACIÓN, FUSIONAR CONJUNTOS DE DATOS, GESTIÓN DE DATOS PERDIDOS, ETC., SE HA CONVERTIDO EN UNA
LIBRERÍA MUY IMPORTANTE PARA PROCESAR DATOS A ALTO NIVEL EN PYTHON (ES DECIR, ESTADÍSTICAS ). PANDAS FUE
DISEÑADA ORIGINALMENTE PARA GESTIONAR DATOS FINANCIEROS, Y COMO ALTERNATIVO AL USO DE HOJAS DE CÁLCULO
(ES DECIR, MICROSOFT EXCEL).
Las características de la biblioteca son

El tipo de datos son DataFrame para manipulación de datos con indexación integrada. Tiene herramientas para leer
y escribir datos entre estructuras de dato en memoria y formatos de archivos variados

Permite la alineación de dato y manejo integrado de datos fallantes, la reestructuración y segmentación de


conjuntos de datos, la segmentación vertical basada en etiquetas, indexación elegante, y segmentación horizontal de
grandes conjuntos de datos, la inserción y eliminación de columnas en estructuras de datos.

Puedes realizar cadenas de operaciones, dividir, aplicar y combinar sobre conjuntos de datos, la mezcla y unión de
datos.

Permite realizar indexación jerárquica de ejes para trabajar con datos de altas dimensiones en estructuras de datos
de menor dimensión, la funcionalidad de series de tiempo: generación de rangos de fechas y conversión de
frecuencias, desplazamiento de ventanas estadísticas y de regresiones lineales, desplazamiento de fechas y retrasos.
PANDAS PROPORCIONA HERRAMIENTAS QUE
PERMITEN:
Leer y escribir datos en diferentes formatos: CSV, JSON, Excel, bases SQL y formato HDF5

seleccionar y filtrar de manera sencilla tablas de datos en función de posición, valor o etiquetas

fusionar y unir datos

transformar datos aplicando funciones tanto en global como por ventanas

manipulación de series temporales


• hacer gráficas
En pandas existen tres tipos básicos de objetos todos ellos
basados a su vez en Numpy:

Series (listas, 1D)

DataFrame (tablas, 2D)


Por lo tanto, Pandas nos proporciona las estructuras de datos y funciones necesarias para el
análisis de datos
SERIES

• Una serie es el primer tipo de datos de pandas y es muy similar a una matriz NumPy (de
hecho está construida sobre el objeto de matriz NumPy). Lo que diferencia un arreglo
NumPy de una serie, es que una serie puede tener etiquetas en los ejes, lo que significa
que puede ser indexada por una etiqueta, en lugar de solo una ubicación numérica.
Tampoco necesita contener datos numéricos, puede contener cualquier Objeto de Python
arbitrario.
DATAFRAME

• Los DataFrames son la estructura mas importante en pandas y están directamente


inspirados en el lenguaje de programación R. Se puede pensar en un DataFrame como un
conjunto de Series reunidas que comparten el mismo índice. En los DataFrame tenemos
la opción de especificar tanto el index (el nombre de las filas) como columns (el nombre
de las columnas)

También podría gustarte