Está en la página 1de 4

INGENIERIA EN SISTEMAS COMPUTACIONALES

MATERIA
FUNDAMENTOS DE LA INVESTIGACION

UNIDAD 3

INVESTIGACION DOCUMENTAL
“HERRAMIENTAS BASICAS DEL INGENIERO EN TU
ESPECIALIDAD.”

ESTUDIANTE
Estrada Artezán Guillermo Manuel

Primer Semestre Grupo 1506 B

CATEDRATICA
M.ED. MARIA DEL CARMEN MARTINEZ DE LA ROSA

Cd. Madero, Tamp. 28 de Octubre del 2021.


HERRAMIENTAS BASICAS DEL INGENIERO EN TU
ESPECIALIDAD
Transformar los datos en conocimiento para que las organizaciones puedan tomar
mejores decisiones es un objetivo importante de la tecnología de big data. Para
ello, es necesario contar con herramientas que permitan almacenar y procesar los
datos anteriores. En UNIR, analizamos algunas de las herramientas de big data
más relevantes y ampliamente utilizadas en la actualidad por los profesionales de
la industria, tales como:

Hadoop
Es un marco capaz de almacenar grandes cantidades de
datos mediante la ejecución de código distribuido en
diferentes nodos. La principal ventaja de Hadoop es su
capacidad para realizar procesamiento de datos
distribuidos, lo que permite una escalabilidad
significativa.

Apache Spark
Es un marco para el procesamiento de datos. Su principal ventaja es la
arquitectura distribuida, es decir, el procesamiento de datos se delega a los
distintos hardware del sistema que lo implementa, lo que logra tiempos de
respuesta muy bajos
Se puede desarrollar código en Apache Spark en
múltiples lenguajes de programación, tales como Java,
R, Python, etc. En los últimos años ha desplazado a
Hadoop como la opción preferente para el
procesamiento del Big Data.

Apache Storm
Es un sistema distribuido para el procesamiento
en tiempo real de flujos de datos provenientes de
una fuente en particular (sensores de Internet de
las cosas, redes sociales, etc.) y convertirlos en
información que puede ser monitoreada. y
análisis al momento.
MongoDB
Es una base de datos NoSQL para almacenar
datos. Su uso es muy popular porque permite
almacenar datos de una manera que no se
basa en registros (tablas), sino en formato
BSON, que es un binario JSON (orientado a
documentos).
Las principales características de esta base de datos son la replicación de datos
en diferentes nodos y la división de estos datos en secciones más pequeñas de la
base de datos principal, y la distribución de información entre ellos. Ambas
características proporcionan a los sistemas que utilizan Mongo DB una alta
escalabilidad horizontal.

Lenguaje Python
Es un lenguaje de programación interpretado
de alto nivel con el que es fácil desarrollar
código, y es utilizado principalmente por
profesionales de cualquier campo (no
necesariamente conocedores de TI), que
necesitan desarrollar análisis de datos.
También tiene una gran colección de bibliotecas creadas por la comunidad que lo
apoya, lo que le permite crecer. El punto negativo más destacable es que su
tiempo de ejecución no es tan rápido como el de otros lenguajes utilizados para tal
fin. Estas herramientas, que se imparten en el Master of Volumes / Big Data
Visualization and Analysis de UNIR, ayudan a procesar, analizar y almacenar
datos que pueden ser útiles para las empresas, como aumentar sus ventas o
conocer mejor a sus clientes.

Lenguaje R
Es un lenguaje de programación muy parecido al
matemático y el entorno que lo soporta se emplea
para realizar principalmente cálculos estadísticos e
implementar visualizaciones de la información
obtenida al procesar los datos.
El lenguaje R y su entorno son de los más utilizados
para la minería de datos, procesar datos financieros…Dispone de una gran
colección de librerías creada por la comunidad que lo sustenta, lo que facilita el
desarrollo con él. Su principal desventaja es que al ser un lenguaje “matemático”
es más complicado de entender para desarrolladores no familiarizados con este
lenguaje.

BIBLIOGRAFIAS.
https://www.unir.net/ingenieria/revista/herramientas-big-data/

También podría gustarte