Está en la página 1de 7

Big data el mejor aliado de Python

Nombre de estudiantes: Francheska Cisterna, Diego Mella, Ediño Espino y Bryan Chavez.
Nombre de Profesor: Trixy Constanza Fuentes Arancibia
Asignatura: Habilidades básicas de comunicación
Fecha de entrega:
Contenido

Introducción.........................................................................................................................................................
Big data................................................................................................................................................................
¿Qué es Big data?............................................................................................................................................
Big data aplicado en Python...............................................................................................................................
Web scraping....................................................................................................................................................
NumPy..............................................................................................................................................................
Pandas.............................................................................................................................................................
Conclusión...........................................................................................................................................................
Referencias bibliográficas..................................................................................................................................

2
Introducción

Debido a la expansión de plataformas de streaming y redes sociales en los últimos años, el mundo
informático también recibió un aumento exponencial en el manejo de datos masivos, lo esencial en el
Big Data o traducido al español grandes datos es el rendimiento y velocidad. En este contexto, Python es
el mejor aliado, ya que puede procesar y distinguir distintos tipos de datos, encajando con otras
herramientas para potenciar su alcance.

El motivo de este documento es proporcionar una descripción general sobre Big data, comprendiendo
su finalidad y por qué Python es una herramienta de procesos indispensable a la hora de utilizar esta
tecnología de grandes datos.

Para cumplir el objetivo hemos utilizado una metodología de trabajo en la cual realizamos la extracción
de información de diferentes libros obtenidos en la biblioteca Digital Duoc, para así dar referencias
fidedignas sobre el tema seleccionado.

El informe se estructura en primera instancia definiendo el concepto Big Data, en segundo lugar, se
explica cuáles son los motivos de que Python sea el mejor aliado de Big Data y a través de los siguientes
encabezados se especificará algunas de las metodologías utilizadas en dicho lenguaje de programación.
Finalizando se resumirá la información presentada

3
Big data

En el transcurso de los siguientes apartados, se mostrará en primer lugar la definición de Big data,
seguidamente por qué python es el lenguaje de programación que más se ajusta a sus necesidades y
para finalizar cuáles son algunas de las metodologías utilizadas.

¿Qué es Big data?

Big data o también llamado macrodatos, son un conjunto de datos que sobrepasan la capacidad del
software convencional logrando captar patrones y tendencias, debido a esta gran cantidad de
información almacenada, las grandes empresas lo utilizan para detectar cuáles son las necesidades del
mercado y conocer a sus clientes.

Las grandes plataformas tales como Spotify, Instagram, Netflix entre otros, utilizan Big data por ejemplo
por qué a los usuarios siempre les aparece lo que les gusta, todo tiene una explicación, los datos no solo
viajan, también se almacenan generando una estadística que indica los gustos del consumidor y cuáles
son los temas más demandados en la actualidad.

Se estima que para el año 2025 se habrán multiplicado 14 veces los datos que se produjeron en el 2015,
se generarán aproximadamente 2,5 cuatrillones de bits diarios. Instagram, por ejemplo, absorbe 80
millones de fotos y YouTube 80 millones de fotos, sin mencionar el crecimiento que ha tenido en los
últimos años estas plataformas. (Galup, 2019, p.39).

4
Big data aplicado en Python

En los últimos años la relación entre Big Data y Python ha aumentado debido a la versatilidad,
flexibilidad, facilidad y un sin fin de beneficios a la hora de crear almacenamiento y procesamiento de
datos que ofrece este lenguaje de programación, tales como sus bibliotecas, técnicas de extracción de
información e interfaces de programación.

Web scraping

Python incluye bibliotecas que ayudan a extraer información, es lo que se conoce propiamente como
web scraping, lo cual permite obtener grandes cantidades de datos de manera automática de cualquier
sitio web, ayudando así a estructurar datos e inclusive en la toma de decisiones debido a su compilación
de datos. Ante esto, Caballero, Martín y Riesco (2018) mencionan que “algunos de estos datos pueden
estar protegidos, por derechos de autor, patentes, etc., así que es nuestra responsabilidad ser
cuidadosos y consultar las posibilidades que ofrece la página.”(p.25)

NumPy

Numpy es una biblioteca Python que proporciona tipos de datos para almacenar de manera eficiente
secuencias de valores numéricos y operar sobre ellos.(Caballero, Martin y Riesco, 2018, p.115)

Pandas

Es una biblioteca de código abierto que define, modela y analiza los datos tales como Series, DataFrame
y panel construida a raíz de NumPy creando cierta dependencia al momento de su instalación.

5
Conclusión

Como resumen, el objetivo de este informe fue dar a conocer que es Big Data, de qué manera python ha
jugado un rol relevante a la hora de hablar de Macrodatos. Se debe destacar que el objetivo fue
cumplido a cabalidad, ya que mediante la lectura de diferentes libros y fuentes se capturaron sus
características y metodologías. Así se puede mencionar que Big data es un término que será cada vez
más utilizado debido al gran aumento de producción y acumulación de datos. En la actualidad según el
estudio “never sleeps” realizado desde hace 10 años por la Empresa Domo la cantidad total de datos
que se prevé que se creará, capturará, copiará y consumirá a nivel mundial en 2022 es de 97 zettabytes,
un número proyectado que aumentará a 181 zettabytes para 2025, una cifra muy elevada en
comparación a lo antes mencionado. Llegando a la conclusión de que tanto Big Data como Python

6
Referencias bibliográficas

Big Data y política / Luciando Galup

http://biblioteca.duoc.cl.webezproxy.duoc.cl/bdigital/elibros/a46033-Big%20Data/

Big data: Gestión y explotación de grandes volúmenes de datos / Monteserrat García-Alsina


http://biblioteca.duoc.cl.webezproxy.duoc.cl/bdigital/elibros/a41458-Big%20Data/

Big data con Python : recolección, almacenamiento y proceso / Rafael Caballero, Enrique
Martín y Adrián Riesco.

http://biblioteca.duoc.cl.webezproxy.duoc.cl/bdigital/elibros/a45866-Big%20data%20con
%20Python/

También podría gustarte