Está en la página 1de 3

Instituto Tecnológico de Las Américas

Tema Central

Web Scraping

Estudiante

Elvin Somón Sánchez 2018-6795

Materia

Minería de Datos e Inteligencia de Negocios

Facilitador

Jorge Ramón Taveras González

Fecha

12/10/2020
El web scraping es una técnica que sirve para extraer información de páginas web de
forma automatizada. Si traducimos del inglés su significado vendría a significar algo así
como “escarbar una web”. Usualmente, estos programas de web scraping simulan la
navegación de un humano en la World Wide Web ya sea utilizando el protocolo HTTP
manualmente, o incrustando un navegador en una aplicación. Al software programado
para scrapear se le suele llamar bot, spider o crawler. Todo el mundo puede programar
un crawler, ya que existen herramientas para ponerlo a punto que no requieren
conocimientos de programación
Las aplicaciones del web scraping abarcan básicamente cualquier aspecto es la web
que se pueda consultar. Por ejemplo, con técnicas de web scraping podemos:
1. Construir agregadores de contenido: aplicaciones que aglutines noticias u
ofertas inmobiliarias. Como también recopilando, información empresarial,
eventos físicos, etc.

2. Medir la reputación online: el web scraping permite realizar análisis de


sentimientos que permitan a los desarrolladores conocer la opinión de los
usuarios sobre un producto o servicio en particular.

3. Caza de tendencias: además de medir la reputación, el web scraping permite


estimar cuales serán los temas que estarán en tendencia los próximos meses.
Esto resulta realmente útil para desarrollar campañas publicitarias.

4. Optimización de precios: El scraping continuo de diferentes competidores


permite generar históricos a lo largo del tiempo. Esto permite ofrecer un precio
óptimo de venta, tanto al cliente final como al canal de distribución.

5. Monitorización de la competencia: El precio no es la única variable competitiva


en el entorno digital. Podemos controlar, rastrear y generar alertas para saber
cuándo los competidores actualizan sus catálogos de producto o servicio,
renuevan su sitio web, escriben sobre un tema concreto, mencionan nuestros
productos, “toman prestadas” nuestras fotos.

6. Optimización e-commerce: El caso de las tiendas online es muy sensible al


scraping. Ya se ha mencionado la optimización de precios, pero del mismo modo
se pueden usar técnicas de scraping que nos ayuden a elegir qué imagen mostrar
como destacada, qué categorización de productos funciona mejor, qué nicho
está libre en un mercado concreto, etc.

7. Google Search Analysis: El scraping de las SERP (resultados de búsqueda) de


Google es crucial para conocer el rendimiento digital de un proyecto: saber
cómo se posiciona para las keywords adecuadas (como hacen algunas
herramientas SEO, aunque tienen sus limitaciones), conocer la cuota de mercado
digital en búsquedas, el tipo de contenidos, que deberían potenciarse, etc.
Bibliografía:

• Colaboradores de Wikipedia. (2020, 30 mayo). Web scraping. Wikipedia, la

enciclopedia libre. https://es.wikipedia.org/wiki/Web_scraping

• Qué es el Web scraping? Introducción y herramientas. (2018, 16 febrero).

Sitelabs. https://sitelabs.es/web-scraping-introduccion-y-herramientas/

• Lafuente, A. (2018, 15 marzo). Data science: qué es (y qué no es). Aukera.

https://aukera.es/blog/data-science-que-es-y-que-no-es/