Está en la página 1de 1

import pandas as pd #permite el tratamiento de datos

import os #para uso de rutas / direcciones

Para cargar el archivo:

mainpath = 'C:/data/db/UPN'

filename = 'titanic.csv'

fullpath = os.path.join(mainpath, filename) //Para que luego lo podamos usar en el reporte

Mostrar el archivo:

data = pd.read_csv(fullpath)

data

Para ver si la variable contiene valores perdidos:

data.isnull().any() //retorna true o false

data.isnull().any().sum() //retorna la cantidad

data.isnull().any().sum()/1309*100 //retorna la cantidad en porcentaje

Para los graficos

pip install missingno

import missingno as msno //rayas

msno.bar(data) /barras como edificios

Para mostrar el tipo de las variables

data.dtypes

Para hacer una matriz de correlación de variables

msno.heatmap(data)

//Si es de 0.5 a 1 existe correlación (no importa el signo)

Para visualizar los datos de una variable

data[‘age’]

Metodos de imputación
data[‘age’].fillna(method=’fill’)

También podría gustarte