Está en la página 1de 13

FACULTAD DE INGENIERIA

ESCUELA PROFESIONAL DE INGENIERIA DE SISTEMAS

Web Scraping
Grupo:
2

AUTOR(ES):
FLORES MIRANDA PABLO RAFAEL
MAMANI FASABI DIEGO SEBASTIAN
ORDOÑEZ GUEVARA ANTHONY
ROMERO SANTIAGO JHONATHAN
KEVIN JHONATHAN ROMERO CHAVEZ

ASESOR(A)(ES):

ERICK GIOVANNY FLORES CHACÓN

ASIGNATURA:
Business Intelligence and Big Data

LIMA - PERÚ
Web Scraping

El método de web scraping es una técnica utilizada mediante programas de software

para extraer información de sitios web. “Usualmente, estos programas simulan la

navegación de un humano en la World Wide Web ya sea utilizando el protocolo

HTTP manualmente, o incrustando un navegador en una aplicación” [5].

Básicamente si se realiza la copia de datos de una página web y se almacenan en

una base de datos, se considera que es un proceso de extracción de datos. Si, en lugar

de hacerlo de forma manual, se utilizan robots o bots que automatizan todo el

procedimiento anteriormente comentado, se hablará de “web scraping”.

El web scraping está muy “relacionado con la indexación de la web, la cual

indexa la información de la web utilizando un robot y es una técnica universal

adoptada por la mayoría de los motores de búsqueda. Sin embargo, el web scraping

se enfoca más en la transformación de datos sin estructura en la web (como el

formato HTML) en datos estructurados que pueden ser almacenados y analizados en

una base de datos central”

Usando la herramienta:

Scrapestorm

Modo inteligente: basado en algoritmos de inteligencia artificial, esta herramienta

identifica de manera inteligente los datos de lista, datos tabulares y botones de

paginación sin tener que establecer reglas manualmente.


Instalación Scrapestorm

Link de descarga

Se descarga el archivo

Abrimos el archivo
Abrimos scrpton
Pagina scrapton

Verificación de licencia
Imágenes dedemostracion del Scrapestorm
Para arreglar esto tenemos que usar la herramienta solve captcha
Aceptamos lo términos y ponemos completar
Esta aplicación analiza los casos de homicidios en china

Usamos Scrape in para seleccionar la información


Seleccionamos la herramienta Field y jalamos que parte de la información queremos
Analizando los datos

Terminando de analizar los datos para crear el excel

Terminado de crear el Excel

También podría gustarte