Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Formulario
Formulario
Seleccionar una columna: index=['B', 'D'],
df['col1'] columns=['col1', 'col3'])
#df3: nuevo dataframe
Seleccionar más de una columna: Unir solo filas completas (INNER JOIN):
Pandas proporciona herramientas para análisis de datos df[['col1', 'col2']] df.merge(df3)
en Python. Los siguientes ejemplos con código están
relacionados con el dataframe debajo. Mostrar primeras n filas: Columna de la izquierda completa (LEFT OUTER JOIN):
df.head(2) df.merge(df3, how='left')
axis 1 (eje 1)
col1 col2 Mostrar últimas n filas: Columna de la derecha completa (RIGHT OUTER JOIN):
df.tail(2) df.merge(df3, how='right')
A 1 4
Seleccionar filas por valores del índice (index): Preservar todos los valores (OUTER JOIN):
axis 0 (eje 0)
df = B 2 5 df.loc['A'] df.loc[['A', 'B']] df.merge(df3, how='outer')
Formulario
X_train,X_test,y_train,y_test = train_test_split(X,y,
random_state = 0)#divide data en train y test set
Formulario
y = [40, 50, 33] Flujo de Trabajo
plt.bar(x, y)
plt.show() import seaborn as sns
import matplotlib.pyplot as plt
Matplotlib es una libreria de gráficos 2D de Python Piechart import pandas as pd
plt.pie(y, labels=x, autopct='%.0f %%') Gráfico de Lineas
que produce figuras en una variedad de formatos. plt.figure(figsize=(10, 5))
plt.show()
Figura flights = sns.load_dataset("flights")
Y-axis Histograma may_flights=flights.query("month=='May'")
ages = [15, 16, 17, 30, 31, 32, 35] ax = sns.lineplot(data=may_flights,
bins = [15, 20, 25, 30, 35] x="year",
plt.hist(ages, bins, edgecolor='black') y="passengers")
plt.show() ax.set(xlabel='x', ylabel='y',
title='my_title, xticks=[1,2,3])
Gráfico de Caja (Boxplots) ax.legend(title='my_legend,
ages = [15, 16, 17, 30, 31, 32, 35] title_fontsize=13)
Matplotlib X-axis
plt.boxplot(ages) plt.show()
Flujo de Trabajo plt.show()
Gráfico de Barras (Barplot)
Los pasos básicos para crear una gráfica con matplotlib son Gráfico de Dispersión (Scatterplot) tips = sns.load_dataset("tips")
a = [1, 2, 3, 4, 5, 4, 3 ,2, 5, 6, 7] ax = sns.barplot(x="day",
Preparar Data, Graficar, Personalizar Gráfico, Guardar y="total_bill,
b = [7, 2, 3, 5, 5, 7, 3, 2, 6, 3, 2]
Gráfico y Mostrar Gráfico. plt.scatter(a, b) data=tips)
import matplotlib.pyplot as plt plt.show() Histograma
penguins = sns.load_dataset("penguins")
Ejemplo con Gráfico de linea sns.histplot(data=penguins,
Preparar data
x = [2017, 2018, 2019, 2020, 2021]
Subplots x="flipper_length_mm")
Gráfico de Cajas (Boxplot)
Agrega el código debajo para hacer multples gráficos tips = sns.load_dataset("tips")
y = [43, 45, 47, 48, 50] ax = sns.boxplot(x=tips["total_bill"])
con 'n' números de filas y columnas.
Graficar & Personalizar
fig, ax = plt.subplots(nrows=1, Gráfico de Dispersión (Scatterplot)
plt.plot(x,y,marker='o',linestyle='--', ncols=2, tips = sns.load_dataset("tips")
color='g', label='Colombia') sharey=True, sns.scatterplot(data=tips,
plt.xlabel('Años') figsize=(12, 4)) x="total_bill",
Graficar & Personalizar Cada Gráfico y="tip")
plt.ylabel('Poblacion (M)') ax[0].plot(x, y, color='g')
plt.title('Años vs Poblacion') ax[0].legend()
Estética de la figura
ax[1].plot(a, b, color='r') sns.set_style('darkgrid') #estilos
plt.legend(loc='lower right') sns.set_palette('husl', 3) #paletas
ax[1].legend()
plt.yticks([41, 45, 48, 51]) plt.show() sns.color_palette('husl') #colores
Guardar Gráfico
Tamaño de letra de titulo de ejes, x e y labels, tick labels
plt.savefig('ejemplo.png') Encuentra ejemplos prácticos en y leyendas:
Mostrar Gráfico estos videos/guías que hice: plt.rc('axes', titlesize=18)
plt.show() plt.rc('axes', labelsize=14)
- Guía de Matplotlib (link) plt.rc('xtick', labelsize=13)
Marcadores: '.', 'o', 'v', '<', '>' - Guía de Nube de Palabras (link) plt.rc('ytick', labelsize=13)
Estilos de linea: '-', '--', '-.', ':' - Ejemplo Visualización Datos(link) plt.rc('legend', fontsize=13)
Colores: 'b', 'g', 'r', 'y' #azul, verde, rojo, amarillo plt.rc('font', size=13)
Frank Andrade www.youtube.com/andradefrank
Web Scraping “Hermanos” son nodos con los mismos padres.
El hijo de un nodo y los hijos de sus hijos son
XPath
Formulario
llamados sus “descendientes”. Del mismo modo, el Necesitamos aprender XPath para hacer web
padre de un nodo y el padre de su padre son scraping con Selenium y Scrapy.
llamados “ancestros”.
Es recomendado buscar elementos en este orden
El web scraping nos permite extraer data de la web. Antes de a. ID XPath Sintaxis
aprender Beautiful Soup, Selenium o Scrapy, vamos a revisar b. Class name Un XPath usualmente contiene un tag, nombre de
c. Tag name
conceptos básicos de HTML. d. Xpath atributo y valor de atributo.