Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Presentado por:
Kely Jhojana Hincapie Zapata – ID 809379 – NRC 6041
Fecha de entrega:
07 de febrero del 2022
Profesor(a):
Doriela Noreyda Flórez Mena
Asignatura:
Informática empresarial
R/ es de suma importancia, en la información esta guardada con hechos y datos los procesos,
bases de datos de clientes, estadísticas, crecimiento etc.
Definición
Dato: Un dato es la representación de una variable que puede ser cuantitativa o cualitativa
que indica un valor que se le asigna a las cosas y permite analizarlo, se representa a través de
una secuencia de símbolos, números o letras. Los datos describen hechos empíricos.
Ciencia de los datos: La ciencia de datos combina múltiples campos, como las estadísticas,
los métodos científicos, la inteligencia artificial (IA) y el análisis de datos para extraer el
valor de estos. Los practicantes de la ciencia de datos se llaman científicos de datos y
combinan una variedad de conocimientos para analizar los datos recopilados de la web,
teléfonos inteligentes, clientes, sensores y otras fuentes para obtener información útil.
La ciencia de datos abarca la preparación de los datos para el análisis, incluida la limpieza,
la agregación y la manipulación de los datos para realizar análisis avanzados. Las
aplicaciones analíticas y los científicos de datos pueden revisar los resultados para descubrir
patrones y permitir que los líderes empresariales obtengan información fundamentada.
Glosario
1. Big data: se refiere a los datos que son tan grandes, rápidos o complejos que es difícil o
imposible procesarlos con los métodos tradicionales
2. Volumen: Las organizaciones recopilan datos de diversas fuentes, como transacciones
comerciales, dispositivos inteligentes (IO), equipo industrial, vídeos, medios sociales y
más. En el pasado, su almacenamiento habría sido un problema - pero el almacenamiento
más barato en plataformas como los data lakes y el Hadoop han aliviado la carga.
3. Algoritmo: En informática y matemáticas, un algoritmo es una especificación categórica
y efectiva de cómo resolver un problema complejo y cómo realizar un análisis de datos.
Consiste en múltiples pasos para aplicar operaciones sobre los datos con el fin de resolver
un problema particular.
4. Inteligencia artificial: El popular término Big Data, Inteligencia Artificial es la
inteligencia demostrada por las máquinas. La IA es el desarrollo de sistemas informáticos
para realizar tareas que normalmente tienen inteligencia humana como el reconocimiento
de voz, la percepción visual, la toma de decisiones y los traductores de idiomas
5. Identificación automática y captura de datos: La identificación automática y la captura
de datos (AIDC) es el gran término de datos que se refiere a un método de identificación
y recolección automática de objetos de datos a través de un algoritmo de computación y
su posterior almacenamiento en la computadora. Por ejemplo, la identificación por
radiofrecuencia, los códigos de barras, la biometría, el reconocimiento óptico de
caracteres y las bandas magnéticas incluyen algoritmos para la identificación de los
objetos de datos capturados.
6. Avro: Avro es un marco de serialización de datos y una llamada de procedimiento
remoto desarrollado para el proyecto de Hadoop. Utiliza JSON para definir protocolos y
tipos de datos y luego serializa los datos en forma binaria. Avro proporciona ambos:
Formato de serialización para datos persistentes.
Formato de cable para la comunicación entre los nodos Hadoop y de los
programas de clientes a los servicios Hadoop.
Glosario de la ciencia de los datos
los detalles exactos sobre cuándo, dónde y cómo se realizan las llamadas con fines de
facturación y presentación de informes. Los metadatos del CDR dan información sobre
25. Database administrator (DBA): DBA es el gran término de datos relacionado con una
función que incluye la planificación de la capacidad, la configuración, el diseño de la
base de datos, la supervisión del rendimiento, la migración, la solución de problemas, la
seguridad, las copias de seguridad y la recuperación de datos. DBA es responsable de
mantener y apoyar la rectitud del contenido y la estructura de una base de datos.
26. Database administrator (DBA): DBA es el gran término de datos relacionado con una
función que incluye la planificación de la capacidad, la configuración, el diseño de la
base de datos, la supervisión del rendimiento, la migración, la solución de problemas, la
seguridad, las copias de seguridad y la recuperación de datos. DBA es responsable de
mantener y apoyar la rectitud del contenido y la estructura de una base de datos.
27. Database Management System (DBMS): El Sistema de Gestión de Bases de Datos es
un programa informático que recoge datos y proporciona acceso a ellos de forma
organizada. Crea y administra la base de datos. El DBMS proporciona a los
programadores y usuarios un proceso bien organizado para crear, actualizar, recuperar y
gestionar los datos.
28. Data Model and Data Modelling: El modelo de datos es una fase inicial del diseño de
una base de datos y suele consistir en atributos, tipos de entidades, reglas de integridad,
relaciones y definiciones de objetos. El modelado de datos es el proceso de creación de
un modelo de datos para un sistema de información mediante el uso de ciertas técnicas
formales. El modelado de datos se utiliza para definir y analizar los requisitos de datos
para apoyar los procesos empresariales.
29. Data Warehouse: El almacén de datos es un sistema de almacenamiento de datos con
fines de análisis y presentación de informes. Se cree que es el principal componente de la
inteligencia comercial. Los datos almacenados en el almacén se cargan desde el sistema
operativo como ventas o marketing
30. Data Science (Ciencia de los datos): Bueno, aquí está lo principal que hizo tanto ruido.
Predicciones, insights, manipulaciones con datos, convertir datos desordenados y dispares
en material comprensible.
31. Drill: El drill es un motor de consulta SQL de código abierto, distribuido y de baja
latencia para Hadoop. Está construido para datos semi-estructurados o anidados y puede
Glosario de la ciencia de los datos
¿De qué forma estos términos se relacionan con los sistemas de información y cómo
contribuyen a la toma de decisiones en las empresas?
Lista de Referencias
https://topbigdata.es/todos-los-terminos-del-big-data/
https://www.datasource.ai/es/data-science-articles/el-glosario-definitivo-de-la-ciencia-de-los-
datos