Está en la página 1de 10

CUADRO

COMPARATIVO
Herramientas Big Data para tu empresa

Nombre de la Materia: Analítica y minería de datos.

Nombre del Docente: Ana Marcela Cardoso Talamante.

Nombre del Alumno: Jorge Luis Villanueva Morales.

Matricula: 50173001.

Plantel: Universidad del Desarrollo Profesional (UNIDEP).

Fecha: 27 / 05 / 2021
INTRODUCCIÓN

¿Qué son los protocolos de seguridad de la información?


Los protocolos de seguridad de red son un tipo de protocolo de red que garantiza
la seguridad y la integridad de los datos en tránsito a través de una conexión de
red como Internet.

Están diseñados principalmente para evitar que usuarios, aplicaciones, servicios o


dispositivos no autorizados accedan a los datos de la red. Esto se aplica a
prácticamente todos los tipos de datos, independientemente del medio de red
utilizado.
Herramientas
Big Data para tu CARACTERISTICAS VENTAJAS DESVENTAJAS
empresa
Hadoop  Los desarrolladores no tienen En lo que respecta al HDFS:
Esta herramienta se considerael que enfrentar los problemas de  Latencia para el acceso a datos
framework estándar para el la programación en paralelo. debido a su orientación a
almacenamiento de grandes procesos batch y operaciones en
volúmenes de datos; se usa también  Permite distribuir la streaming.
para analizar y procesar, y es utilizado información en múltiples nodos
por empresas como Facebook y y ejecutar los procesos en  Cantidades grandes de ficheros
Yahoo!. paralelo. pequeños debido al límite en el
número de estos que existe en la
La biblioteca Hadoop utiliza modelos  Dispone de mecanismos para memoria del NameNode.
de programación simples para el la monitorización de los datos.
almacenamiento y procesamiento  Escribe una vez, lee varias
distribuido de grandes conjuntos de  Permite la realización de debido a que los ficheros solo se
datos en clusters, dando redundancia consultas de datos. pueden escribir una vez.
para no perder nada y, al mismo
tiempo, aprovechando muchos  Dispone de múltiples  No se puede acceder con los
procesos a la vez. funcionalidades para facilitar el comandos tradicionales de Linux
tratamiento, seguimiento y (ls, cat, vim...).
Dispone de un sistema de archivos control de la información que se
distribuido en cada nodo del cluster: el almacenada. En lo que respecta a

HDFS (Hadoop Distributed File MapReduce:

System), y se basa en el proceso de


 Escribe una vez, lee varias
MapReduce de dos fases.
debido a que los ficheros solo se
pueden escribir una vez.

 No todos los algoritmos se


pueden escribir con el paradigma
MapReduce.

 Latencia, es decir, que


cualquier job MapReduce suele
tardar por lo menos 10 segundos.

MongoDB
MongoDB es una base de datos  Es ideal para entornos con  No es una base de datos
orientada a documentos. Esto quiere pocos recursos de computación. adecuada para aplicaciones con
decir que, en lugar de guardar los transacciones complejas.
datos en registros, guarda los datos en
documentos. Estos documentos son  Es una herramienta con un  Es una tecnología joven.
almacenados en BSON, que es una coste bajo.
representación binaria de JSON.  No tiene un reemplazo para las
 Tiene una gran soluciones de herencia.
Otra característica a destacar de documentación.
MongoDB, sin duda esta sería la  No tiene Joins para consultas.
velocidad, que alcanza un balance  Es un complemento perfecto
perfecto entre rendimiento y para JavaScript.
funcionalidad gracias a su sistema de
consulta de contenidos.

 Elasticsearch se distribuye;
Es una potente herramienta para la  Sólo soporta como tipos de
No se requieren otros
búsqueda entre grandes cantidades de respuesta JSON, lo que lo limita al
componentes, y la distribución
datos, especialmente cuando los datos no soportar otros lenguajes, como
es en tiempo real, llamada
Elasticsearch son de tipo complejo. CSV ó XML.
"replicación Push".

Permite indexar y analizar en tiempo  Algunas situaciones pueden


 Esta herramienta es
real un gran volumen de datos y hacer generar casos de split-brain.
totalmente compatible con la
consultas sobre ellos.
búsqueda casi en tiempo real de  No es lo suficientemente
Con Elasticsearch podemos hacer Apache Lucene. automático (no es adecuado para
búsquedas de texto complicadas, la nueva API actual de Index
visualizar el estado de nuestros nodos  Para hacer frente a la Warmup).
y escalar sin demasiadas necesidades, tenencia múltiple no requiere
si se diera el caso de que una configuración especial, y
necesitáramos más potencia. Solr requiere configuraciones
más avanzadas.

 Adopta el concepto de
Gateway, facilitando las copias
de seguridad.

 Cada nodo forma una


estructura de red punto a punto,
y algunos nodos asignarán
automáticamente otros nodos
para que funcionen en caso de
falla.

Es un lenguaje interpretado, no  Simplificado y rápido: Este  Problemas con hosting:


compilado, usa tipado dinámico, lenguaje simplifica mucho la existen muchos servidores que no
fuertemente tipado. programación haciendo que te soportan Python y en caso de
adaptes a un modo de lenguaje hacerlo, su configuración suele
Es multiplataforma, lo cual es ventajoso de programación, con un patrón ser compleja.
Python para hacer ejecutable su código fuente sencillo.
entre varios sistemas operativos.  Librerías incorporadas: a
 Elegante y flexible: El pesar de incluir un compendio de
Es un lenguaje de programación lenguaje le da al usuario librerías populares (por ejemplo:
multiparadigma, el cual soporta varios muchas herramientas para crear kivy, requests, scapy, entre otras),
paradigmas de programación como código de manera flexible. algunas de esas no son
orientación a objetos, estructurada, necesarias o se usan muy poco.
programación imperativa y, en menor  Ordenado y limpio: este
medida, programación funcional. lenguaje es legible y entendible  Lentitud al ejecutar múltiples
para cualquier programador que hilos: a pesar de que no necesita
En Python, el formato del código es quiera trabajar sobre una compilarse, si quieres ejecutar
estructural. estructura ya establecida y ello múltiples hilos de programación
se debe a la organización de puede que no aproveches toda la
sus módulos. potencia de tu PC.

 Programación sana y  No dispone de buena


productiva: Programar en documentación: Python no
Python se convierte en un estilo cuenta con buena documentación,
muy sano de programar, pues por lo que puedes tener
es sencillo de aprender, esta problemas para comprender
direccionado a las reglas algunas librerías y ciertas
perfectas, Además, sumado a estructuras, sobre todo si no has
sus otros beneficios hace que programado antes.
sea un lenguaje productivo.
 Curva de aprendizaje: La
 Portable: Es un lenguaje curva de aprendizaje cuando ya
muy portable (ya sea en Mac, estás en la parte web no es tan
Linux o Windows) en sencilla, sobre todo si no se tiene
comparación con otros ninguna idea sobre programación
lenguajes. orientada a objetos.

 Cuenta con una comunidad  No tiene identificadores


activa: la misma comunidad de protegidos: a diferencia de otros
Python cuida el lenguaje y casi tipos de lenguajes como PHP,
todas las actualizaciones se Python no cuenta con
hacen de manera democrática. identificadores protegidos, por lo
que los métodos empleados son
públicos.
Bibliografía

7 Herramientas Big Data para tu empresa. (n. d.).


https://www.iic.uam.es/innovacion/herramientas-big-data-para-empresa/

Hadoop: qué es y para qué se utiliza. (n. d.).


https://www.unir.net/ingenieria/revista/que-es-hadoop/#:~:text=Ventajas%20de
%20utilizar%20Hadoop&text=%E2%80%93Los%20desarrolladores%20no
%20tienen%20que,realizaci%C3%B3n%20de%20consultas%20de%20datos.

Domínguez Romero, E. (2013). Introducción a Hadoop. En Hadoop On The Road.


http://hadoopontheroad.blogspot.com/2013/02/introduccion-hadoop.html

Domínguez Romero, E. (2013). Desventajas de Hadoop. En Hadoop On The


Road. http://hadoopontheroad.blogspot.com/2013/01/desventajas-de-hadoop.html

Robledano, A. (2019). Qué es MongoDB. En OpenWebinars.


https://openwebinars.net/blog/que-es-mongodb/

Martín Gómez, P. (2020). Ventajas y desventajas de MongoDB. En


OpenWebinars. https://openwebinars.net/blog/ventajas-y-desventajas-de-
mongodb/
Patricio Sebastian, M. (2019). Elasticsearch (Ventajas - Desventajas). En
GoConqr. https://www.goconqr.com/c/79891/course_modules/123038-ventajas----
desventajas?

ElasticSearch y la instalación de complementos. (n. d.).


https://programmerclick.com/article/3527672973/

Introducción al lenguaje Pythonn (Ventajas y desventajas). (n. d.).


https://entrenamiento-python-basico.readthedocs.io/es/latest/leccion1/
ventajas_desventajas.html

CEDEÑO, A. (20 de febrero de 2020). Ventajas y desventajas de usar Python en


la programación web [Blog Bloguero Pro]. https://blogueropro.com/blog/ventajas-y-
desventajas-de-usar-python-en-la-programacion-web

También podría gustarte