Está en la página 1de 7

Nombre:

Hironelis Lorenzo García

Matrícula
DN-2023-03764

Profesor:
Victor De León

Asignatura:
Informática II

Tema:
Big Data
Resumen:
El texto trata sobre el concepto de big data y su importancia en la gestión de grandes
volúmenes de información generada por la sociedad de la información y el uso de
nuevas tecnologías. Se menciona que el big data busca gestionar eficientemente esta
información para que las organizaciones puedan tomar mejores decisiones. Además,
se define el big data como un activo de alto volumen, velocidad y variedad que
requiere formas innovadoras de procesamiento para la toma de decisiones. Se
destaca que el big data ha tenido un crecimiento importante a partir de 2003, con el
desarrollo de tecnologías como Google File System y MapReduce. También se
menciona la situación actual y futura del big data, destacando su aplicación en la
mejora de la toma de decisiones en la logística y su potencial para optimizar
procesos, incrementar la rentabilidad y detectar nuevos modelos de negocio.
Además, se resalta el impulso que se está dando al big data en Colombia a través del
proyecto CAOBA, que busca fortalecer su uso en empresas y en el diseño de
políticas públicas.

Se menciona que el big data se refiere al manejo de datos masivos y utiliza


herramientas informáticas y estadísticas para su análisis. Además, se destaca que el
volumen, la velocidad y la variedad de los datos son características fundamentales
del big data. El texto también menciona el impacto del big data en el desarrollo
económico de las empresas y el Estado, así como su aplicación en el campo de la
logística. Por último, se señala que en el futuro el big data seguirá expandiéndose y
ofreciendo nuevas posibilidades en diferentes ámbitos.

También dice que en la actualidad se busca que la información que se gestione a


través de la web no discrimine la información en cuanto a raza, género, ingresos y/o
ubicación barrial, con el fin de estar acorde con las políticas internacionales que
apuntan a la inclusión, haciéndolo posible a través de un algoritmo que lo verifique.
En cambio, sí se busca fortalecer la innovación tecnológica que tenga un impacto
socioeconómico significativo y que vaya de la mano del tejido industrial tal y como
lo hace el Centro Tecnológico de Cataluña, Eurocat; que dirige su actividad a siete
ámbitos estratégicos relacionados con la alimentación, la energía y recursos, los
sistemas industriales, las industrias basadas en el diseño, las industrias relacionadas
con la movilidad sostenible, las industrias de la salud y las industrias culturales.
Luego de leer el documento sobre el big data, seleccionar 20 palabras clave y
definirlas. De igual forma colocar una breve conclusión sobre lo aprendido en
el documento.

Big data: Gestión de grandes volúmenes de datos, que son caracterizados por su alta
velocidad, variedad y volumen. La gestión de big data busca procesar y analizar
estos datos para obtener información relevante y tomar decisiones basadas en
evidencia.

Toma de decisiones: Proceso mediante el cual se elige una opción entre diversas
alternativas, con el objetivo de resolver un problema o alcanzar un objetivo. La toma
de decisiones implica evaluar diferentes variables y considerar los posibles
resultados y sus implicaciones.

Logística: Actividad que se encarga de planificar, implementar y controlar el flujo


de bienes, servicios e información desde el punto de origen hasta el punto de
consumo. La logística engloba el transporte, almacenamiento, manejo de inventarios
y todas las actividades relacionadas con el flujo de recursos.

Análisis de datos: Proceso de examinar, limpiar, transformar y modelar datos con


el objetivo de descubrir información relevante. El análisis de datos utiliza diferentes
técnicas y herramientas estadísticas para extraer conocimiento y patrones que
permitan tomar decisiones informadas.
Información: Conjunto de datos
organizados y significativos que brindan
conocimiento o una mejor comprensión
de una determinada situación o
fenómeno. La información se caracteriza
por ser útil, confiable y relevante para el
contexto en el que se utiliza.
Tecnologías: Conjunto de herramientas,
técnicas, conocimientos y recursos
utilizados para desarrollar, implementar y
utilizar productos tecnológicos. Las
tecnologías están en constante evolución
y abarcan diferentes áreas, como la
informática, la electrónica, la comunicación y la ingeniería.

Volumen: Magnitud o cantidad de algo. En el contexto del big data, se refiere a la


cantidad masiva de datos que son generados y almacenados constantemente.

Velocidad: Rapidez con la que ocurre algo. En el contexto del big data, se refiere a
la velocidad a la que se generan, se reciben y se procesan los datos.

Variedad: Diversidad o diferencia en la naturaleza o forma de algo. En el contexto


del big data, se refiere a la variedad de fuentes y tipos de datos disponibles, que
pueden incluir datos estructurados y no estructurados, como texto, imágenes, videos,
audio, redes sociales, entre otros.

Innovación: Proceso de desarrollar y aplicar nuevas ideas, productos o servicios que


generen un cambio positivo. La innovación implica la búsqueda de soluciones
creativas y novedosas para los desafíos existentes y puede involucrar mejoras en
procesos, tecnologías, modelos de negocio, entre otros aspectos.

Procesamiento: Acción de someter algo a un proceso o tratamiento. En el contexto


del big data, se refiere al procesamiento de grandes volúmenes de datos para obtener
información relevante. Esto implica realizar operaciones como la limpieza,
transformación, análisis y extracción de conocimiento de los datos.
Hadoop: Plataforma de software de código abierto diseñada para el almacenamiento
y procesamiento distribuido de grandes volúmenes de datos. Hadoop utiliza un
sistema de archivos distribuido y un modelo de programación diseñado para manejar
de manera eficiente los grandes volúmenes de datos.

Hive: Infraestructura de almacenamiento y análisis de datos desarrollada por


Facebook. Hive proporciona una interfaz de consulta basada en SQL para acceder y
analizar datos almacenados en un clúster de Hadoop.

HBase: Sistema de base de datos distribuida inspirado en BigTable de Google.


HBase es una base de datos NoSQL que proporciona una forma eficiente de
almacenar y gestionar grandes cantidades de datos estructurados y no estructurados.

Data science: Campo interdisciplinario que utiliza técnicas y herramientas de


estadística, programación y ciencias de la computación para extraer conocimiento y
generar insights a partir de grandes volúmenes de datos. La ciencia de datos combina
habilidades técnicas y conocimientos de dominio para resolver problemas complejos
y realizar predicciones basadas en datos.

Algoritmo: Conjunto de instrucciones lógicas y matemáticas utilizadas para


resolver un problema o realizar un cálculo. Los algoritmos son fundamentales en el
procesamiento y análisis de datos, ya que permiten realizar operaciones y tomar
decisiones de manera automatizada.

Estadísticas: Disciplina que se ocupa de recopilar, organizar, analizar e interpretar


datos numéricos para obtener información relevante. Las estadísticas utilizan
métodos y técnicas para resumir y describir datos, identificar patrones y tendencias,
realizar inferencias y realizar pronósticos basados en datos.

Predicción: Estimación o proyección de resultados futuros basada en datos y


análisis. La predicción utiliza técnicas estadísticas y modelos matemáticos para
identificar patrones y tendencias en los datos y utilizarlos para hacer inferencias y
estimaciones sobre eventos futuros.

Estrategias: Planes de acción diseñados para alcanzar metas u objetivos específicos.


Las estrategias involucran la identificación de recursos, la planificación de
actividades y la toma de decisiones para lograr resultados deseados.
Organizaciones: Grupos estructurados de personas o entidades que persiguen un
objetivo común. Las organizaciones pueden ser empresas, instituciones, ONG, entre
otros tipos, y suelen contar con una estructura jerárquica y funciones definidas para
lograr sus metas.

Conclusión de lo Aprendido:
En mi opinión, el big data es una herramienta poderosa que ha transformado la forma
en que organizamos, procesamos y utilizamos la información. Gracias al big data,
empresas y organizaciones pueden obtener conocimientos profundos y prácticos que
les permiten tomar decisiones más informadas y estratégicas. El big data ha
demostrado su valor en diversas industrias, desde la medicina y la tecnología hasta
el marketing y el comercio minorista. Permite el análisis de grandes volúmenes de
datos en tiempo real, lo que brinda insights detallados y precisos que antes eran
difíciles de obtener.

Sin embargo, el uso del big data también plantea preocupaciones sobre la privacidad
y la seguridad de los datos. Es crucial encontrar un equilibrio entre el
aprovechamiento de los beneficios del big data y la protección de la información
personal de los individuos.
Referencias Bibliográficas:

https://postgrado.ucsp.edu.pe/articulos/que-es-big-
data/#:~:text=El%20big%20data%20(datos%20masivos,o%20procesarlos%20de%
20manera%20eficiente.
https://www.zendesk.com.mx/blog/big-data-que-es/
https://es.wikipedia.org/wiki/Dato
https://aws.amazon.com/es/what-is/apache-hive/
https://www.getcompass.ai/es/glossary/data-processing
https://es.xfinity.com/hub/internet/internet-
speed#:~:text=Las%20velocidades%20de%20Internet%20son,Un%20megabit%20
tiene%201%2C024%20kilobits.

También podría gustarte