Bases de Datos y Administración de La Información

UNIVERSIDAD NACIONAL“PEDRO RUIZ GALLO”
FACULTAD DE CIENCIAS ECONÓMICAS,
ADMINISTRATIVAS Y CONTABLES
ESCUELA DE COMERCIO Y NEGOCIOS
INTERNACIONALES
Sistema de Información Gerencial
Tema:
Fundamentos de inteligencia de negocios: Base de datos y

administración de la información
Autores:
● ALARCÓN HERRERA, Ana Jasmín
● FERRE PANTA, Diego Daniel
● SÁNCHEZ ALCALDE, Jesús Rodrigo
● YNGA RIVERA, Juan Fernando
Docente:
RONCAL DIAZ, Cesar wilbert
Chiclayo – Perú
2022
Introducción
Actualmente las empresas utilizan un análisis de datos existentes, los cuales generan
conocimiento para facilitar la toma de decisiones empresariales, involucrando el
funcionamiento actual y la anticipación de acontecimientos futuros. Daremos a conocer la
importancia de la base de datos y cómo estas facilitan el proceso y la mejora continua en las
empresas para poder tomar las mejores decisiones y así poder recortar el tiempo de espera de
una solicitud, pedido o consulta.
Además, las empresas u organizaciones buscan información para lograr constatar con la
información interna que ellos tienen y así tomar una mejor decisión en su empresa, por otro
lado, cada empresa busca de hacer eficiente el almacenamiento de la información, buscando
programas y app correctas.

Fundamentos de inteligencia de negocios: Base de datos y administración de la información.........1
1- La inteligencia de negocios...................................................................................................5
1.1 Definición....................................................................................................................... 5
1.2 Evolución de inteligencia de negocios..............................................................................5
1.3 La implementación de un esquema de BI permite:...........................................................7
1.4 Ventajas de la Inteligencia de Negocio.............................................................................7
1.5. Problemas que interfieren en el desarrollo de datos........................................................9
2- ¿Cuáles son las principales capacidades de los sistemas de administración de bases de datos
(DBMS) y porque son poderosos un DBMS relacional?..........................................................11
2.1. Base de datos............................................................................................................... 11
2.2 lenguaje de consulta estructurada.................................................................................11
2.3 Evolución de la base de datos........................................................................................11
2.4 Tipos de bases de datos.................................................................................................12
2.4.1 Bases de datos relacionales SQL:............................................................................12
2.4.2 Bases de datos orientadas a objetos:........................................................................12
2.4.3 Bases de datos distribuidas:....................................................................................12
2.4.4 Almacenes de datos................................................................................................12
2.4.5 Bases de datos NoSQL............................................................................................12
2.4.6 Bases de datos orientadas a grafos..........................................................................13
2.4.7 Bases de datos OLTP.................................................................................................13
2.4.8 Bases de datos de código abierto.............................................................................13
2.4.9 Bases de datos en la nube:......................................................................................13
2.4.10 Base de datos multimodelo:..................................................................................13
2.4.11 Bases de datos de documentos/JSON.....................................................................13
2.4.12 Bases de datos de autogestión................................................................................14
2.5 ¿Qué es un software de base de datos?..........................................................................14
2.6 DBMS.......................................................................................................................... 14
2.7 DBMS relacional..........................................................................................................15
2.8 Operaciones de un DBMS relacional.............................................................................15
2.9 Bases de datos no relacionales y bases de datos en la nube.............................................16
2.10 Tipos populares de DBMS..........................................................................................16
2.11 Ventajas de DBMS.....................................................................................................17
2.12 Capacidades de los sistemas de administración de bases de datos.................................18
3. Diseño de Base de Datos:....................................................................................................19
3.1 Etapas de diseño de bases de datos.......................................................................19
3.1.1 Etapa del diseño Conceptual:.................................................................................19
3.1.2 Orientada a objetivos:................................................................................................20
3.1.3 Relacional:................................................................................................................ 20
3.1.4 Etapa de diseño Lógico:.............................................................................................20
3.1.5 Etapa del diseño físico:..............................................................................................20
3.2 ¿Cuáles son las principales herramientas y tecnologías para acceder a la información de
las bases de datos y mejorar tanto el desempeño de negocios como la toma de decisiones?....22
3.3 El desafío del Big Data..................................................................................................22
3.4 Infraestructura de inteligencia de Negocios...................................................................24
3.5 Almacenes de datos y mercados de datos.......................................................................25
3.5.1 Hadoop..................................................................................................................27
3.5.2 Computación en memoria.......................................................................................28
4.Plataformas analíticas.........................................................................................................29
4.1 Procesamiento analítico en línea (OLAP)......................................................................30
4.2 Minería de datos...........................................................................................................30
4.3 Minería de texto y minería Web....................................................................................32
4.4 Las bases de datos y web...............................................................................................32
4.4.1 ¿Por qué la política de información, la administración de datos y el aseguramiento de
la calidad de los datos son esenciales para administrar los recursos de datos de la empresa?
...................................................................................................................................... 33
4.5 Aseguramiento de la calidad de los datos.......................................................................34
5. Conclusión:...................................................................................................................... 35
6. Referencias:....................................................................................................................... 35
1- La inteligencia de negocios.
1.1 Definición
La inteligencia de negocios o BI (business intelligence), se ha establecido como una solución
para el desarrollo de la gestión empresarial, mediante una serie de acciones planificadas y
herramientas para analizar los datos existentes de la organización y generar un conocimiento
de ello para facilitar la toma de decisiones empresariales, involucrando el funcionamiento
actual y la anticipación de acontecimientos futuros.
1.2 Evolución de inteligencia de negocios
Según Bustamante C.(pg.2) En 1958, Hans Peter Luhn (quien trabajó para IBM) y creó más
de 80 patentes. También conocido por ser el primero en aplicar la estadística en los análisis
textuales de recuperación de información e inventor del algoritmo de Luhn (algoritmo de
módulo 10, que permite detectar errores en la transcripción de dígitos). habla por primera vez
sobre inteligencia de negocios, entendida como la interrelación de hechos orientados al
desarrollo de una meta. Anteriormente las empresas generaban datos y con mucho esfuerzo
generaban conocimientos sobre estos, debido a que no contaban con recursos
computacionales, dificultando el análisis de los datos por la carencia de herramientas que
permitieran la toma de decisiones a largo plazo y corto plazo.
En 1962, el canadiense Kenneth Iverson, el cual fue un notable matemático, realiza un
importante estudio sobre inteligencia de negocios plasmando un lenguaje de programación
multidimensional (APL); el cual es el pilar fundamental para el procesamiento analítico en
línea, conocido como OLAP, el cual consiste en extraer y consultar datos de manera fácil y
selectiva para analizarlos desde diferentes puntos de vista.
En la década de los setenta, se crearon distintos sistemas de gestión de base de datos y las
primeras aplicaciones empresariales (SAP, JD, SIEBEL, entre otros). Los cuales, permitían
realizar datos mediante una computadora. Entre las más importantes se encuentra la
aplicación informática, pero aun así no llegó a cumplir con el objetivo que se esperaba, ya
que no fueron capaces de ofrecer un acceso rápido, debido a que su organización era de baja
calidad y difícil acceso a información específica.
En la década de los 80, se vio el concepto de almacén de datos, en el cual Ralph Kimball,
determinó una metodología llamada modelado dimensional que es un modelo de sistemas de
soporte de decisiones y expresa que un almacén de datos extrae, limpia, conforma y entrega
una fuente de datos dimensional para la consulta y el análisis” Con lo cual, este autor tiene un
punto de coincidencia con Dresner (2010) al determinar que el almacén de datos es la unión
de todos los “data-marts” de una entidad. Asimismo, en 1985 lanzan al mercado la hoja de
cálculo más utilizada actualmente y conocida como Excel.
la década de los noventa, empezaron a surgir y fueron populares las herramientas de BI; las
cuales ofrecían acceso a un sinnúmero de bases de datos y a la información estructurada
generada por las empresas
Según Bustamante C.(pg.9) En 1989, un ilustre desconocido llamado Howard Dresner
comenzó a acuñar el término de BI, para describir los conceptos y métodos con el objetivo de
mejorar la toma de decisiones empresariales mediante el uso de sistemas basados en hechos
de apoyo- y con el pasar del tiempo hasta finalizar la década del 90 se comenzó a popularizar
estas herramientas. Es por ello que se crearon múltiples aplicaciones de BI que ofrecían
acceso a las diferentes bases de datos y a la información estructurada generada por las
empresas.
Actualmente, las herramientas de tecnología de negocios se transformaron, ya que no solo
eran consideradas la información de la base de datos, sino que imágenes, videos, audios,
correos electrónicos en su nueva versión. Puesto que ahora existen grandes cantidades de
información que se almacenan y es importante la creación de estas herramientas para poder
analizar y categorizar la información de una manera más eficaz, dando resultados inmediatos
para la toma de decisiones y así tengan una ventaja competitiva con respecto a su empresa.
1.3 La implementación de un esquema de BI permite:
● Generar información global o por secciones, que permita ser almacenada en un único
lugar y que esté disponible en tiempo real.
● Evalúa los distintos escenarios que permitan analizar los distintos problemas que
podrían afectar la empresa.
● Compartir información con pronósticos de ventas, incluyendo indicadores que
permitan medir el desempeño del negocio
● Permite agrupar información de diferentes áreas para establecer, modificar y ajustar
políticas, procesos y procedimientos
● Gran capacidad de reacción ante amenaza y vulnerabilidades del negocio, actuando o
anticipándose a éstos
● Capacidad de retroalimentación con respecto a hechos sucedidos para evaluar
políticas y objetivos del negocio
1.4 Ventajas de la Inteligencia de Negocio
● Control de los costos: Mediante la inteligencia de negocios, las empresas manejaran
fácilmente los distintos programas que se encuentren en las distintas áreas de la
organización, por lo tanto, va a mejorar la calidad de decisiones y facilitara el acceso
a la información en todos los niveles de la organización con la finalidad de obtener
mejores resultados.
● Reduce tiempos: Orienta las soluciones tecnológicas hacia el usuario, ya que reduce
los tiempos de aprendizaje mediante el uso de herramientas

● Visión de negocio: Proporciona una profunda visión del negocio a través de un
sistema integrado de usos: Scorecards, Tableros de instrumentos, Informes, Minería
de Datos, y Almacenamiento Analítico.
● Proceso de negocio: Asiste a los ejecutivos para planear y pronosticar el trabajo,
presentando una descripción común de los procesos del negocio de una compañía.
The Globe and Mail
The Globe and Mail, ubicado en Toronto, Canadá Es el periódico más grande de Canadá,
con una base de lectores acumulada de seis días de casi 3.3 millones. El periódico contaba
con un programa de marketing bastante ambicioso, en el que veía como prospecto a cada uno
de los hogares canadienses que no estaban ya inscritos.
Esta empresa había tenido problemas con sus usuarios debido a que volvían a enviar ofertas
de suscripción hacia su periódico cuando los usuarios ya se habían suscrito y esto causó
mucha molestia y aparte de ello incrementará los costos de marketing
Para operar un periódico importante se requiere administrar enormes cantidades de datos,
incluyendo los datos de circulación, los de ingresos por publicidad, los datos de prospectos
de marketing y los que “no deben contactarse”, además de los datos de logística y entregas.
Asimismo, datos requeridos para operar una empresa, como los datos financieros y de
recursos humanos
Durante mucho tiempo la empresa the globe en mail, guardó gran parte de sus datos en un
sistema mainframe, los cuales son capaces de controlar cientos de usuarios simultáneamente,
así como cientos de dispositivos de entrada y salida. Aun así este sistema no era muy eficaz
debido a que no se podían obtener datos actualizados y eso llevaba a que nos aparezcan
usuarios que recién se habían suscrito. Por otro lado, también está la parte de seguridad de
usuario, ya que the globe and mail recolecta y almacena la información de pago de los
clientes; alojar estos datos confidenciales en varios lugares hace aún más difícil el poder
asegurar que se implementen los controles de seguridad de datos correctos. Los primeros
datos que ocuparon el almacén de datos fueron los de ventas por publicidad, que son una de
las principales fuentes de ingresos.
En 2002 la empresa implementó el sistema empresarial SAP, el cual contendría todos los
datos de la empresa provenientes de sus diversos orígenes de datos en una sola ubicación
donde los usuarios de negocios pudieran acceder a ellos y analizarlos de una manera fácil.
Debido a eso pudieron tener todos los datos en un solo lugar, ya que el periódico podía
relacionarse fácilmente con los datos de los prospectos y de los clientes para no dirigirse a los
clientes existentes y los datos sobre el área de entregas para determinar si es posible entregar
o no un periódico, o si hay que dirigirse a un cliente con una promoción de suscripción
digital. Además, tuvieron que capacitar a sus trabajadores, finalmente lograron obtener
resultados del nuevo sistema que implementaron, produciendo menos costos, obteniendo más
tiempo para poder almacenar sus datos y lo más importante satisfaciendo a sus clientes.
1.5. Problemas que interfieren en el desarrollo de datos
En la mayoría de las organizaciones los sistemas tendían a crecer de manera independiente
sin un plan a nivel de toda la compañía. Contabilidad, finanzas, manufactura, recursos
humanos, ventas y marketing desarrollaban sus propios sistemas y archivos de datos.
● Redundancia e inconsistencia de los datos
La redundancia de datos es un conjunto de datos duplicados en varios archivos y a la
vez se almacenan en más de un lugar o ubicación. Además, desperdicia recursos de
almacenamiento y también conduce a la inconsistencia de los datos, donde el mismo

atributo puede tener distintos valores. Esto aumenta los costos de almacenamiento y
acceso a los datos, además de que puede originar la inconsistencia de los datos - es
decir diversas copias de un mismo dato no concuerdan entre sí -, por ejemplo: que se
actualiza la dirección de un cliente en un archivo y que en otros archivos permanezca
la anterior
● Dependencia programa datos
La dependencia programa datos se refiere a la unión de los datos almacenados en
archivos y los programas específicos requeridos para actualizar y dar mantenimiento a
esos archivos, de tal forma que los cambios en los programas requieran cambios en
los datos.
● Falta de flexibilidad
Un sistema de archivos logra entregar informes de rutina después de largas horas de
programación, pero no llega a entregar a tiempo estos informes debido a que no
responde a los requerimientos de la información no anticipados y es muy costoso
recuperar los datos.
● Seguridad defectuosa
Al tener poco control y administración de datos, se hace muy difícil tener acceso a la
información, puesto que la gerencia tal vez no tenga forma de saber quién está
accediendo a los datos de la organización, o incluso modificándose.
● Falta de compartición y disponibilidad de los datos
Mayormente la información de datos anda dispersa en distintos archivos y diferentes
partes de la organización, lo cual hace que no puedan funcionar muy bien en las
distintas áreas de organización y que debido a ello los usuarios no puedan confiar en
la precisión de sus datos.
2- ¿Cuáles son las principales capacidades de los sistemas de administración de bases de

datos (DBMS) y porque son poderosos un DBMS relacional?
2.1. Base de datos
La base de datos es una recopilación organizada de información o datos estructurados, que
normalmente se almacena de forma electrónica en un sistema informático. Normalmente, una
base de datos está controlada por un sistema de gestión de bases de datos (DBMS).La
mayoría de las bases de datos utilizan un lenguaje de consulta estructurada (SQL) para
escribir y consultar datos.
2.2 lenguaje de consulta estructurada
El SQL es un lenguaje de programación que utilizan casi todas las bases de datos relacionales
para consultar, manipular y definir los datos, además de para proporcionar control de acceso.
El SQL se desarrolló por primera vez en IBM en la década de 1970
2.3 Evolución de la base de datos
Las bases de datos han evolucionado desde su inicio a principios de la década de 1960. Las
bases de datos de navegación, como la base de datos jerárquica (que se basaba en un modelo
de árbol y permitía una relación de uno a muchos) y la base de datos de red (un modelo más
flexible que permitía relaciones múltiples), eran los sistemas originales que se utilizaban para
almacenar y manipular datos. En la década de 1980, se hicieron populares las bases de datos
relacionales, seguidas de las bases de datos orientadas a objetos en la década de 1990. Más
recientemente, las bases de datos NoSQL surgieron como respuesta al crecimiento de Internet
y la necesidad de acelerar la velocidad y el procesamiento de los datos no estructurados. Hoy
en día es una necesidad de contar una base de datos
2.4 Tipos de bases de datos
La mejor base de datos para una organización específica depende de cómo pretenda la
organización utilizar los datos.
2.4.1 Bases de datos relacionales SQL:
Se hicieron predominantes en la década de 1980. Los elementos de una base de datos
relacional se organizan como un conjunto de tablas con columnas y filas.
2.4.2 Bases de datos orientadas a objetos:
La información de una base de datos orientada a objetos se representa en forma de objetos.
2.4.3 Bases de datos distribuidas:
Una base de datos distribuida consta de dos o más archivos que se encuentran en sitios
diferentes. La base de datos puede almacenarse en varios ordenadores, ubicarse en la misma
ubicación física o repartirse en diferentes redes.
2.4.4 Almacenes de datos.

Un repositorio central de datos, un data warehouse es un tipo de base de datos diseñado
específicamente para consultas y análisis rápidos.
2.4.5 Bases de datos NoSQL.

Conocida de base de datos no relacional, permite almacenar y manipular datos no
estructurados y semiestructurados
2.4.6 Bases de datos orientadas a grafos.
Una base de datos orientada a grafos almacena datos relacionados con entidades y las
relaciones entre entidades.
2.4.7 Bases de datos OLTP.

Es una base de datos rápida y analítica diseñada para que muchos usuarios realicen un gran
número de transacciones.
Otras bases de datos menos comunes se adaptan a funciones científicas, financieras o de otro
tipo muy específicas.
2.4.8 Bases de datos de código abierto.

Es aquel cuyo código fuente es de código abierto; tales bases de datos pueden ser bases de
datos SQL o NoSQL.
2.4.9 Bases de datos en la nube:

Es una recopilación de datos, estructurados o no estructurados, que reside en una plataforma
de cloud computing privada, pública o híbrida. Existen dos tipos de modelos de bases de
datos en la nube: tradicional y base de datos como servicio (DBaaS). Con DBaaS, un
proveedor de servicios realiza las tareas administrativas y el mantenimiento.
2.4.10 Base de datos multimodelo:

Las bases de datos multimodelo combinan distintos tipos de modelos de bases de datos en un
único servidor integrado.
2.4.11 Bases de datos de documentos/JSON.

Diseñadas para almacenar, recuperar y gestionar información orientada a los documentos en
formato JSON en lugar de en filas y columnas.

2.4.12 Bases de datos de autogestión.
El tipo de base de datos más nuevo e innovador, las bases de datos de autogestión (bases de
datos autónomas) están basadas en la nube y utilizan el machine learning para automatizar el
ajuste de la base de datos, la seguridad, las copias de seguridad, las actualizaciones y otras
tareas de gestión rutinarias que tradicionalmente realizan los administradores de bases de
datos.
2.5 ¿Qué es un software de base de datos?
El software de base de datos se utiliza para crear, editar y mantener archivos y registros de
bases de datos, lo que facilita la creación de archivos y registros, la entrada de datos, la
edición de datos, la actualización y la creación de informes. El software también maneja el
almacenamiento de datos, las copias de seguridad y la creación de informes, así como el
control de acceso múltiple y la seguridad. La seguridad sólida de las bases de datos
2.6 DBMS
Un sistema de administración de bases de datos (DBMS) es un software de sistema para crear
y administrar bases de datos. El DBMS proporciona a los usuarios y programadores una
forma sistemática de crear, recuperar, actualizar y administrar datos. Un DBMS también
permite a los usuarios finales crear, leer, actualizar y eliminar datos en una base de datos El
DBMS gestiona tres cosas importantes: los datos, el motor de la base de datos que permite
acceder a los datos, bloquearlos y modificarlos, y el esquema de la base de datos, que define
la estructura lógica de la base de datos.
La vista lógica presenta los datos según los perciben los usuarios finales o los especialistas
de negocios, en tanto que la vista física muestra la verdadera forma en que están organizados
y estructurados los datos en los medios de almacenamiento físicos

Cómo resuelve un DBMS los problemas del entorno de archivos tradicional
Un DBMS reduce la redundancia e inconsistencia de los datos al minimizar los archivos
aislados en los que se repiten los mismos datos. Tal vez el DBMS no logre que la
organización elimine del todo la redundancia de datos, pero puede ayudar a controlarla. El
DBMS desacopla los programas y los datos, con lo cual los datos se pueden independizar. El
DBMS permite que la organización administre de manera central los datos, su uso y su
seguridad.
2.7 DBMS relacional
Los DBMS contemporáneos utilizan distintos modelos de bases de datos para llevar el
registro de las entidades, atributos y relaciones. Es el tipo más popular de sistemas DBMS, a
los cuales se puede hacer referencia como si fueran archivos. Las bases de datos relacionales
representan los datos como tablas bidimensionales, a las cuales se puede hacer referencia
como si fueran archivos . La base de datos tiene una tabla y cada tabla consiste en una
cuadrícula de columnas y filas de datos.
2.8 Operaciones de un DBMS relacional
En una base de datos relacional se utilizan tres operaciones básicas, como seleccionar, unir y
proyectar. En otras palabras, la selección crea un subconjunto de filas que cumplen con
ciertos criterios. La operación unir combina tablas relacionales para proveer al usuario con
más información de la que está disponible en las tablas individuales mientras La operación
proyectar crea un subconjunto que consiste en columnas en una tabla, con lo cual el usuario
puede crear nuevas tablas que contengan solamente la información requerida.

2.9 Bases de datos no relacionales y bases de datos en la nube
La computación en la nube, los volúmenes de datos sin precedentes, las enormes cargas de
trabajo para los servicios Web y la necesidad de almacenar nuevos tipos de datos requieren
alternativas de bases de datos con respecto al modelo relacional tradicional de los sistemas de
administración de bases de datos no relacionales usan un modelo de datos más flexible y
están diseñados para manejar grandes conjuntos de datos entre varios elementos, además de
que pueden escalar fácilmente para aumentar o reducir su tamaño. Son útiles para acelerar las
consultas simples contra grandes volúmenes de datos estructurados y no estructurados, ya sea
en Web, social media, gráficos y demás formas de datos difíciles de analizar con
herramientas tradicionales basadas en SQL.
2.10 Tipos populares de DBMS
Los modelos de bases de datos populares y sus sistemas de gestión incluyen:
- Sistema de gestión de bases de datos relacionales (RDMS): adaptable a la
mayoría de los casos de uso.
- NoSQL DBMS: adecuado para estructuras de datos poco definidas que pueden
evolucionar con el tiempo.
- Sistema de gestión de bases de datos en memoria (IMDBMS): proporciona
tiempos de respuesta más rápidos y un mejor rendimiento.
- Sistema de gestión de bases de datos en columnas (CDBMS): Adecuado para
almacenes de datos que tienen una gran cantidad de elementos de datos similares.
- Sistema de gestión de datos basado en la nube: El proveedor de servicios en la
nube es responsable de proporcionar y mantener el DBMS

2.11 Ventajas de DBMS
Una de las mayores ventajas de usar un DBMS es que permite que los usuarios finales y los
programadores de aplicaciones accedan y usen los mismos datos mientras administran la
integridad de los datos. Los datos se protegen y mantienen mejor cuando se pueden compartir
utilizando un DBMS en lugar de crear nuevas iteraciones de los mismos datos almacenados
en nuevos archivos para cada nueva aplicación. El DBMS proporciona un almacén central de
datos al que pueden acceder múltiples usuarios de manera controlada.
- Extracción de datos e independencia
- Seguridad de datos
- Un mecanismo de bloqueo para acceso concurrente
- Un controlador eficiente para equilibrar las necesidades de múltiples aplicaciones
que utilizan los mismos datos
- La capacidad de recuperarse rápidamente de accidentes y errores, incluyendo la
capacidad de reinicio y la capacidad de recuperación
- Robustas capacidades de integridad de datos
- Registro y auditoría de la actividad
- Acceso simple usando una interfaz de programación de aplicaciones (API)
estándar
- Procedimientos uniformes de administración de datos

2.12 Capacidades de los sistemas de administración de bases de datos
Un DBMS incluye capacidades y herramientas para organizar, administrar y acceder a los
datos en la base de datos. Las más importantes son: su lenguaje de definición de datos, el
diccionario de datos y el lenguaje de manipulación de datos. Los DBMS tienen una capacidad
de definición de datos para especificar la estructura del contenido de la base de datos. Podría
usarse para crear tablas de bases de datos y definir las características de los campos en cada
tabla. Esta información sobre la base de datos se puede documentar en un diccionario de
datos, el cual es un archivo automatizado o manual que almacena las definiciones de los
elementos de datos y sus características.
Consultas e informes
. La mayoría de los DBMS tienen un lenguaje especializado llamado lenguaje de
manipulación de datos el cual se utiliza para agregar, modificar, eliminar y recuperar los
datos en la base de datos. Este lenguaje contiene comandos que permiten a los usuarios
finales y a los especialistas validar cualquier información.
Los usuarios de DBMS para computadoras grandes y de rango medio, como DB2, Oracle o
SQL Server, pueden emplear SQL para recuperar la información que necesitan de la base de
datos. Microsoft Access también utiliza SQL, sólo que provee su propio conjunto de
herramientas amigables para que el usuario realice consultas en las bases de datos y para
organizar la información de las bases de datos en reportes con una mejor presentación.
Plataformas analíticas
Permite analizar y combinar datos maestros con otras fuentes de datos para lograr un
conocimiento más profundo de las operaciones de negocios. Los distribuidores de bases de
datos comerciales han desarrollado plataformas analíticas especializadas de alta velocidad

que utilizan tecnología tanto relacional como no relacional y están optimizadas para analizar
conjuntos de datos de gran tamaño. IBM Netezza y Oracle Exadata son plataformas analíticas
que cuentan con sistemas de hardware-software preconfigurados que están diseñados de
manera específica para el procesamiento de consulta y los análisis. Por ejemplo, IBM
Netezza tiene componentes de base de datos, servidor y almacenamiento estrechamente
integrados que manejan consultas analíticas complejas 10 a 100 veces más rápido que los
sistemas tradicionales.
3. Diseño de Base de Datos:
De acuerdo a Mendoza & López el Diseño de la base de datos debe hacerse de manera
correcta ya que esto facilitará el acceso a la información de manera correcta y actualizada. De
esta forma se lograrán los objetivos trazados para la base de datos. Para diseñar una base de
datos es importante tener en cuenta una serie de principios bien definidos, partiendo
esencialmente de un dominio del que se obtendrá un modelo conceptual. Seguido este de un
modelo lógico, a este se le aplicará normalización y finalmente obtendremos un modelo físico
y poder implementarlo. Como podemos ver hacer el diseño de una base de datos no sencillo;
para poder diseñar un base de datos es importante conocer estas etapas:
3.1 Etapas de diseño de bases de datos
3.1.1 Etapa del diseño Conceptual:
En esta etapa se obtiene una estructura de la futura información que tendrá nuestra base de
datos, sin tomar en cuenta la tecnología que está usará ni el Sistema de gestión de datos, la
cual puede ser relacional, orientada a objetivos o jerárquica, obteniendo así el modelo de flujo
de información.
3.1.2 Orientada a objetivos:
Este sistema es usado mucha organización, ya que muestra datos complejos de las nuevas
tecnologías, la misma que ido aumentado su uso, sobre todo la tecnología web.
3.1.3 Relacional:
El modelo relacional significa que las estructuras lógicas de datos (las tablas de datos, las
vistas y los índices) están separadas de las estructuras físicas de almacenamiento.
3.1.4 Etapa de diseño Lógico:
Esta etapa parte del diseño conceptual, el mismo que se transforma en el tipo de base de datos
que vamos a utilizar, es preciso de la misma manera se ajuste al sistema de gestión de datos
con el que se va a implementar la base de datos. El proceso de normalización que se aplica en
esta etapa consiste en una serie de reglas que deben cumplir las tablas y relaciones obtenidas
tras el paso del modelo entidad relación al modelo relacional, para entonces ser un modelo
lógico. Las bases de datos relacionales se normalizan básicamente para: evitar la redundancia
de los datos, evitar problemas de actualización de los datos en las tablas, proteger la
integridad de los datos
3.1.5 Etapa del diseño físico:
En esta etapa se va transformar la estructura obtenida en la etapa de diseño lógico, con el
objeto de conseguir más eficiencia; además, se completa con aspectos de implementación
física que dependen del Sistema de gestión de datos.
3.1.6 Diagramas de normalización y de entidad-relación
En el diseño de la base de datos se describe la forma en la que se agruparán los elementos de
datos en la base. El proceso de diseño identifica las relaciones entre los elementos de datos y
la forma más eficiente para agruparlos en conjunto para cubrir los requerimientos de
información de la empresa. Dicho proceso también identifica a los elementos de datos
relevantes y las agrupaciones de elementos de datos requeridas para ciertos programas de
aplicaciones específicas. Los datos se organizan, refinan y optimizan hasta que surja una vista
lógica general de las relaciones entre todos los datos en la base de datos.
Para usar un modelo de base de datos relacional de manera eficaz, hay que optimizar los
agrupamientos complejos de datos con el fin de disminuir el número de elementos de datos
redundantes y las incómodas relaciones de varios a varios. Por lo que la normalización es el
proceso de crear estructuras de datos pequeñas y estables, pero a la vez flexibles y adaptivas a
partir de grupos complejos de datos.
Es importante que la creación de las páginas web dinámicas tenga un correcto diseño de la
base de datos.
Entidad de Relación
Entidad: es un objeto, un persona o un lugar que va ser gestionado, como cuando compramos
en Amazon, aquí la entidad puede ser un cliente un pedido o un producto; con; respecto al
cliente este tiene atributos tales como nombre apellido, calle ciudad, Código postal, teléfono,
etc., en tanto en los pedidos podemos encontrar Número de pedidos, cliente ID, nombre de
cliente, calle, ciudad, estado, código postal, fecha de envió, en el producto encontramos los
Productos ID, cantidad, Tipo de producto, y esta a las vez se relacionan tenido una lógica
entre entidades, es por ello que las bases de datos deben estar debidamente estructuradas
3.2 ¿Cuáles son las principales herramientas y tecnologías para acceder a la
información de las bases de datos y mejorar tanto el desempeño de negocios como la
toma de decisiones?
Las empresas usan sus bases de datos para llevar un correcto registro de las transacciones
básicas por ejemplo pagar a los proveedores, procesar pedidos, llevar el registro de los
clientes, control de sus almacenes, pagar a los empleados. Además de que es necesario bases
de datos para proveer información que ayude a la compañía a operar sus negocios con
eficiencia, así mismo ayudar a los gerentes y empleados a tomar mejores decisiones. Si una
compañía desea saber cuál producto es más vendido o quién es su cliente más rentable, la
respuesta radica en los datos.
Con el mundo globalizado y digitalizado las base datos han cobrado mucha relevancia. Que
una empresa sepa usar y administrar de manera correcta la base de datos le da una ventaja
competitiva cuando inician sus actividades, los datos están digitalizados y almacenados en
discos que permiten acceder a ellos desde cualquier lugar del mundo. Para coronel et all
(2011) las bases de datos, “son estructuras especializadas que permiten a sistemas
computarizados guardar, manejar y recuperar datos con gran rapidez”. Para ellos la
importancia de conocer sobre las bases de datos y su funcionamiento radica en que
“prácticamente todos los sistemas modernos se apoyan en ellas (las bases de datos)”, por lo
que recomiendan “una buena comprensión de cómo se crean estas estructuras y cómo se
usan”
3.3 El desafío del Big Data
La mayoría de los datos que se recolectaban por las organizaciones eran datos que se
transferían fácilmente en filas y columnas de sistemas de administración de bases de datos
relacionales. Ahora, podemos ver de una explosión de datos provenientes del tráfico Web,
mensajes de correo electrónico y contenido de medios sociales (tweets, mensajes de estado),
al igual que los datos generados por máquinas de los sensores (utilizados en medidores
inteligentes, sensores de fabricación y medidores eléctricos) o de sistemas de e-commerce.
Dichos datos pueden estar estructurados o no y, por ello, tal vez no sean adecuados para
productos de bases de datos relacionales que organicen los datos en forma de columnas y
filas. El término bigdata describe al conjunto de datos con volúmenes tan grandes que están
más allá de la capacidad de un DBMS (Database management system) estándar para capturar,
almacenar y analizar. Big Data no tiene cantidad específica, sino por lo general a los datos en
el rango de los petabytes, Hard zone (2018)Si nos vamos al inicio de todo, la cantidad más
chica de memoria es el bit, ocho bits hacen un byte. Para llegar a un Petabyte (PB)
necesitamos 1125899906842618 bytes, unos mil billones de bytes, una cantidad bastante
llamativa de entrada, pero que son 1024 TB y exabytes, es una unidad de medida que es igual
a 1024 PB, que es actualmente el límite de almacenamiento de muchos sistemas de archivos.;
es decir, de miles de millones a billones de registros todos de orígenes distintos. Los Big Data
son producto de una cantidad mucho mayores y con mucha más rapidez que los datos
tradicionales. Por ejemplo, un solo motor de jet es capaz de generar 10 terabytes de datos en
sólo 30 minutos, y hay más de 25,000 vuelos de aerolíneas a diario. Aun cuando los “tweets”
se limitan a 140 caracteres cada uno, Twitter genera más de 8 terabytes de datos por día. De
acuerdo con la empresa de investigación de tecnología International Data Center (IDC), los
datos se duplican con creces cada dos años, por lo que la cantidad de datos disponibles para
las organizaciones está aumentando en forma indiscriminada.
A las empresas les interesan los Big Data ya que les permite revelar más patrones y
anomalías interesantes que los conjuntos de datos más pequeños, con el potencial de proveer
nuevas perspectivas en cuanto al comportamiento de los clientes, los patrones de clima, la
actividad del mercado financiero u otros fenómenos. Sin embargo, para derivar un valor de
negocios de estos datos, las organizaciones necesitan nuevas tecnologías y herramientas
capaces de administrar y analizar datos no tradicionales junto con sus datos empresariales
tradicionales.
3.4 Infraestructura de inteligencia de Negocios
Es importante saber dónde conseguir información concisa y confiable sobre las operaciones,
tendencias y cambios actuales en toda la empresa. Si trabajara en una empresa de gran
tamaño, tendría que reunir los datos necesarios de sistemas separados, como ventas,
manufactura y contabilidad, e incluso desde fuentes externas, como los datos demográficos o
de las competencias. Probablemente la Big Data tomará más importancia con el pasar del
tiempo. Una infraestructura contemporánea para la inteligencia de negocios cuenta con
variedad de herramientas para obtener información útil de todos los tipos diferentes de datos
que usan las empresas en la actualidad, incluyendo Big Data semiestructurados y no
estructurados en grandes cantidades. Dicha capacidades incluyen almacenes de datos y
mercados de datos, Hadoop(Permite a las aplicaciones trabajar con miles de nodos en
red y petabytes de datos), computación en memoria y plataformas analíticas. Algunas de
estas capacidades están disponibles como servicios en la nube.
De acuerdo a Promperú la inteligencia comercial combina el análisis de negocios,
visualización, herramientas e infraestructura de datos. La realización del estudio de
inteligencia de mercado es el paso uno que las empresas tienen que realizar antes de
embarcarse en un negocio o para mejorar su participación en el comercio internacional. El
procedimiento incluye la recopilación y procesamiento adecuado de toda la información que
la empresa necesita para tomar decisiones.

La inteligencia de comercial combina es la combinación de negocios, visualización,
herramientas e infraestructura de datos, y las prácticas recomendadas para ayudar a las
empresas a tomar decisiones basadas en los datos. En la práctica, implementar la inteligencia
comercial moderna implica contar con una vista integral de todos los datos de la
organización. También, consiste en usar estos datos para impulsar el cambio, eliminar las
ineficiencias y adaptarse rápidamente a los cambios del mercado o la demanda. La
inteligencia comercial ayuda a las organizaciones tomar decisiones más correctas, ya que
ofrece datos actuales e históricos dentro de su contexto empresarial. Los analistas pueden
aprovechar la inteligencia comercial para establecer valores de referencia de rendimiento y de
la competencia. De esta manera, la organización podrá operar de forma ágil y eficiente.
Para la elaboración de un estudio de mercado para la inteligencia comercial existen varias
herramientas, para esta exposición veremos las que nos brindan datos, de las cuales pueden
ser nacionales e internacionales, las nacionales podemos encontrar las elaboradas por las
instituciones del estado como Promperú, SIICEX, SUNAT; entre otros, y las que se elaboran
de manera privada, para lo cual se debe paga para conseguir una cuenta de acceso, entre los
cuales tenemos Veritrade, Azatrade, CCITrade, en el caso de las internacionales una de las
herramientas más importantes es Trade Map
3.5 Almacenes de datos y mercados de datos
La herramienta tradicional para analizar datos corporativos durante las últimas dos décadas
ha sido el almacén de datos. Un almacén de datos es una base de datos que almacena la
información actual e histórica de interés potencial para realizar una correcta toma de
decisiones a quien le corresponda. Los datos se originan en muchos sistemas básicos de
transacciones operacionales, como los sistemas de ventas, las cuentas de clientes, la
manufactura, los datos de importación y exportación y pueden incluir datos de transacciones

de sitios Web. El almacén de datos extrae los datos actuales e históricos de varios sistemas
operacionales dentro de cada organización. Dichos datos se combinan con los datos de
fuentes externas y se transforman al corregir los datos imprecisos e incompletos y
reestructurar los datos para generar informes gerenciales y realizar análisis antes de cargarlos
en el almacén de datos.
El almacén de datos pone los datos a disposición de todos dependiendo de la necesidad, pero
no se puede alterar. Un sistema de almacén de datos también provee un rango de
herramientas analíticas y facilidades de informes gráficos.
En el comercio exterior hay herramientas que muestran sus datos en forma gráfica tal es el
caso de Promperu, que muestra algunos datos atreves de Power BI este programa se esta
usando bastante en las compañías para poder ordenar y hacer interactiva la información
interna y externa de su empresa, además de entidades nacionales tales como el ministerio de
Salud.
Las herramientas que se mencionaran en el punto la infraestructura de inteligencia de
Negocios, también almacenan datos de exportación e imporatacion pero también existe
sistemas donde los agentes de aduanas, como es el caso de Sintad.
A menudo las empresas crean almacenes de datos a nivel empresarial, donde un almacén de
datos central da servicio a toda la organización, o crean almacenes de datos más pequeños y
descentralizados conocidos como mercados de datos. Un mercado de datos es un
subconjunto de un almacén de datos, en el cual se coloca una porción sintetizada o con alto
grado de enfoque en los datos de la organización en una base de datos separada para una
población específica de usuarios. Por ejemplo, una compañía podría desarrollar mercados de
datos sobre marketing y ventas para lidiar con la información de los clientes. El vendedor de
libros Barnes & Noble solía mantener una serie de mercados de datos: uno para los datos
sobre los puntos de venta en las tiendas minoristas, otro para las ventas de las librerías
universitarias y un tercero para las ventas en línea.
3.5.1 Hadoop
Los productos de DBMS relacionales y almacenes de datos no se adaptan bien para organizar
y analizar Big Data o datos que no caben fácilmente en las columnas y filas utilizadas en sus
modelos de datos. Para manejar datos no estructurados y semiestructurados en grandes
cantidades, así como datos estructurados, las organizaciones usan Hadoop, que es un marco
de trabajo de software de código abierto, administrado por la Fundación de Software Apache,
lo que ayuda al procesamiento paralelo distribuido de enormes cantidades de datos a través de
computadoras económicas. Segmenta un problema de Big Data en varios subproblemas, los
distribuye entre miles de nodos de procesamiento de computadoras económicas, para después
combinar el resultado en un conjunto de datos de menor tamaño que es más fácil de analizar.
Hadoop nos ayuda a encontrar la mejor tarifa aérea en Internet, obtener indicaciones para
llegar a un restaurante, realizar una búsqueda en Google o conectarse con un amigo en
Facebook.
Hadoop consta de varios servicios clave: el sistema de archivos distribuidos Hadoop (HDFS)
que sirve para el almacenamiento de datos y MapReduce para el proceso de datos en paralelo
de alto rendimiento. HDFS enlaza entre sí los sistemas de archivos en los numerosos nodos
en un clúster Hadoop para convertirlos en un gran sistema de archivos. MapReduce de
Hadoop se basa en el sistema MapReduce de Google para desglosar el procesamiento de un
gran conjunto de datos y asignar trabajo a los diversos nodos en un clúster (son grupos de
servidores que se gestionan juntos y participan en la gestión de la carga de trabajo). HBase, la
base de datos no relacional de Hadoop ofrece un acceso rápido a los datos almacenados en
HDFS y una plataforma transaccional para ejecutar aplicaciones en tiempo real de alta escala.
Hadoop procesa enormes cantidades de cualquier tipo de datos, incluyendo datos
transaccionales estructurados, datos poco estructurados tales como las fuentes de Facebook y
Twitter, datos complejos como los archivos de registro de servidor Web y datos de audio y
video no estructurados. Hadoop se ejecuta en un clúster de servidores económicos y pueden
agregarse o eliminarse procesadores según sea necesario. Las empresas usan Hadoop para
analizar grandes volúmenes de datos, así como el área que concentran datos no estructurados
y semiestructurados antes de cargarlos en un almacén de datos. Facebook por ejemplo
almacena gran parte de sus datos en un enorme clúster Hadoop, que contiene cerca de 100
petabytes, alrededor de 10,000 veces más información que la Biblioteca del Congreso
estadounidense. Yahoo usa Hadoop para rastrear cómo se comportan los usuarios de modo
que pueda modificar su página de inicio y adaptarla a sus intereses. La empresa de
investigación de ciencias de la vida NextBio usa Hadoop y HBase para procesar datos para
empresas farmacéuticas que realizan investigación genómica. Los principales distribuidores
de bases de datos como IBM, Hewlett-Packard, Oracle y Microsoft tienen sus propias
distribuciones de software de Hadoop. Otros distribuidores ofrecen herramientas para meter y
sacar datos de Hadoop, o para analizarlos dentro de Hadoop.
3.5.2 Computación en memoria
Otra manera de hacer fácil el análisis de Big Data es utilizar la computación en memoria, que
depende principalmente de la memoria principal (RAM) de la computadora para el
almacenamiento de datos (los DBMS convencionales usan sistemas de almacenamiento de
datos). Los usuarios acceden a los datos almacenados en la memoria principal del sistema,
con lo cual se eliminan los cuellos de botella por los procesos de recuperación y lectura de
datos en una base de datos tradicional basada en discos, y se reducen de manera drástica los
tiempos de respuesta de las consultas. El procesamiento en memoria hace posible que
conjuntos muy grandes de datos, del tamaño de un mercado de datos o de un almacén
pequeño de datos, residan totalmente en la memoria. Los cálculos de negocios complejos que
solían tardar horas o días pueden completarse en cuestión de segundos, y esto puede lograrse
incluso en dispositivos portátiles (vea la Sesión interactiva: tecnología).
La tecnología de hardware de computadora contemporánea que hacen posible el
procesamiento en memoria, como los poderosos procesadores de alta velocidad, el
procesamiento multinúcleo y los precios cada vez menores de la memoria de computadora.
Estas tecnologías ayudan a las empresas a optimizar el uso de la memoria y aceleran el
rendimiento del procesamiento, a la vez que reducen los costos.
4.Plataformas analíticas
La base de datos analítica está diseñada especialmente para aplicaciones de análisis y
administración de empresas, generalmente aquellas relacionadas con un almacén de datos o
data mart. Este sistema es de solo lectura y almacena datos comerciales históricos, como el
rendimiento de ventas o los niveles de inventario. Presenta ventajas de adaptabilidad,
rendimiento, rentabilidad y facilidad de operación. Los usuarios podrán ver información
analizada diferente, como las ventas totales en un período determinado, y podrán compararla
con cualquier otro período deseado, así como obtener señales visuales como gráficos para
permitir a los ejecutivos ver fácilmente las tendencias y reaccionar en consecuencia ante el
cambio del mercado. Las plataformas de análisis hacen uso de construcciones de
contenedores en la memoria para asegurar y sincronizar muchos procesos que se ejecutan en
paralelo con aún más procesadores. Aparte de eso, estas plataformas usan hardware
económico que ya está disponible. Esto se debe a que es una solución de software que se
puede implementar en cualquier organización como un servicio pago, a medida que aumenta
la cantidad de datos, la complejidad analítica y el número de usuarios finales, las plataformas
analíticas ofrecen una variedad de opciones que pueden ayudar a reducir costos y más ayuda
para lograr una decisión informada adecuada. Un claro ejemplo de plataformas analíticas son
IBM Netezza y Oracle Exadata que cuentan con sistemas de hardware-software
preconfigurados que están diseñados de manera específica para el procesamiento de consulta
y los análisis.
4.1 Procesamiento analítico en línea (OLAP)
El procesamiento analítico en línea (OLAP) es una tecnología que organiza grandes bases de
datos empresariales y proporciona análisis complejos, se puede utilizar para realizar consultas
analíticas complejas sin afectar negativamente a algunos otros sistemas. Soporta el análisis de
datos multidimensional, el cual permite a los usuarios ver los mismos datos de distintas
formas mediante el uso de varias dimensiones. Cada aspecto de información, producto,
precios, costo, región o periodo de tiempo representa una dimensión distinta. OLAP permite a
los usuarios obtener respuestas en línea a preguntas en un tiempo muy corto, incluso cuando
los datos se almacenan en bases de datos muy grandes, como las cifras de ventas de varios
años.
4.2 Minería de datos
La minería de datos está más orientada al descubrimiento, ya que provee perspectivas hacia
los datos corporativos que no se pueden obtener mediante OLAP, al encontrar patrones y
relaciones ocultas en las bases de datos grandes e inferir reglas a partir de estos patrones y
relaciones, para predecir el comportamiento a futuro. Los tipos de información que se pueden
obtener de la minería de datos son: asociaciones, secuencias, clasificaciones, agrupamientos y
pronósticos.
-Las asociaciones: son ocurrencias vinculadas a un solo evento. Por ejemplo, un estudio de
los patrones de compra en supermercados podría revelar que cuando se compran frituras de
maíz, el 65% de veces se compra un refresco de cola, pero cuando hay una promoción, es el
85% de veces.
-En las secuencias: los eventos se vinculan en el transcurso del tiempo. Por ejemplo,
podríamos descubrir que, si se compra una casa, el 65% de veces se compra un refrigerador
nuevo dentro de las siguientes dos semanas, y el 45% se compra un horno dentro del mes
posterior a la compra de la casa.
La clasificación: ayuda a descubrir las características de los clientes con probabilidades de
dejar de serlo y puede proveer un modelo para ayudar a los gerentes a predecir quiénes son
esos clientes, de modo que puedan idear campañas especiales para retenerlos.
El agrupamiento: funciona de una manera similar a la clasificación
El pronóstico: utiliza las predicciones de una manera distinta. Se basa en una serie de valores
existentes para pronosticar cuáles serán los otros valores. Por ejemplo, el pronóstico podría
encontrar patrones en los datos para ayudar a los gerentes a estimar el futuro valor de
variables continuas, como las cifras de ventas.
La minería de datos puede contribuir significativamente en las aplicaciones de administración
empresarial basadas en la relación con el cliente. En lugar de contactar con el cliente de
forma indiscriminada a través de un centro de llamadas o enviando e-mails, solo se contactará
con aquellos que se perciba que tienen una mayor probabilidad de responder positivamente a
una determinada oferta o promoción. Las empresas que emplean minería de datos ven
habitualmente el retorno de la inversión, pero también reconocen que el número de modelos
predictivos desarrollados puede crecer muy rápidamente. En lugar de crear modelos para
predecir qué clientes pueden cambiar, la empresa podría construir modelos separados para
cada región y/o para cada tipo de cliente. También puede querer determinar qué clientes van a
ser rentables durante una ventana de tiempo (una quincena, un mes, ...) y solo enviar las
ofertas a las personas que es probable que sean rentables. Para mantener esta cantidad de
modelos, es necesario gestionar las versiones de cada modelo y pasar a una minería de datos
lo más automatizada posible.
4.3 Minería de texto y minería Web
En la actualidad hay herramientas de minería de texto disponibles para ayudar a las empresas
a analizar datos. Estas herramientas pueden extraer elementos clave de los conjuntos de datos
extensos no estructurados, descubrir patrones y relaciones, así como sintetizar la información.
Por ejemplo, el corredor de saldos Charles Schwab usa el software Attensity Analyze para
analizar cientos de miles de interacciones de sus clientes cada mes. El software analiza las
notas de servicio de los clientes de Schwab, los correos electrónicos, las respuestas de las
encuestas y las discusiones en línea para descubrir señales de descontento que puedan
provocar que un cliente deje de usar los servicios de la empresa. Attensity puede identificar
automáticamente las diversas voces que usan los clientes para expresar su retroalimentación
(como una voz positiva, negativa o condicional) para señalar la intención de una persona de
comprar, su intención de abandonar, o la reacción a un producto o mensaje de marketing
específico.
Las empresas pueden recurrir a la minería Web para que les ayude a comprender el
comportamiento de los clientes, evaluar la efectividad de un sitio Web específico o
cuantificar el éxito de una campaña de marketing. Por ejemplo, los comerciantes utilizan los
servicios Google Trends y Google Insights for Search, que rastrean la popularidad de varias
palabras y frases utilizadas en las consultas de búsqueda de Google para saber en qué están
interesadas las personas y qué les interesa comprar.
4.4 Las bases de datos y web
Alguna vez hemos tratado de usar la Web para realizar un pedido o ver un catálogo de
productos pues es probable que hayamos usado un sitio Web vinculado a una base de datos
corporativa interna. Por ejemplo, que un cliente con un navegador Web desee buscar
información de precios en la base de datos en línea de un vendedor minorista. El usuario
accede al sitio Web del vendedor a través de Internet mediante el software de navegador Web
en su PC cliente. El software de navegador Web del usuario solicita información a la base de
datos de la organización, mediante comandos de HTML para comunicarse con el servidor
Web. Otras compañías han creado empresas totalmente nuevas con base en el acceso a bases
de datos extensas a través de la Web. Un ejemplo de esto es el sitio de redes
sociales Facebook, que ayuda a los usuarios a permanecer conectados entre sí o conocer
nuevas personas. Facebook incluye “perfiles” con información suministrada por 1,300
millones de usuarios activos sobre sí mismos, incluyendo intereses, amigos, fotos y grupos a
los que están afiliados. Mantiene una base de datos masiva para alojar y administrar todo su
contenido. También hay muchas bases de datos habilitadas para Web en el sector público que
ayudan a los consumidores y ciudadanos a acceder a información útil
4.4.1 ¿Por qué la política de información, la administración de datos y el aseguramiento
de la calidad de los datos son esenciales para administrar los recursos de datos de la
empresa?
Para poder asegurar que los datos de una empresa sigan siendo precisos, confiables y estén
disponibles de inmediato para quienes los necesiten, necesitará políticas y procedimientos
especiales para la administración de datos. Toda empresa, ya sea grande o pequeña, necesita
una política de información. Los datos de su empresa son un recurso importante, por lo que
no es conveniente que las personas hagan lo que quieran con ellos. Necesita tener reglas
sobre la forma en que se van a organizar y mantener los datos, y quién tiene permitido verlos
o modificarlos. Por ejemplo, una política de información típica especificará que solamente
miembros seleccionados del departamento de nómina y recursos humanos tendrían el derecho
de modificar y ver los datos confidenciales de los empleados, como el salario o número de
seguro social de un empleado, y que estos departamentos son responsables de asegurar
que los datos de cada empleado sean precisos.
La administración de datos es responsable de las políticas y procedimientos específicos a
través de los cuales se pueden gestionar los datos como un recurso organizacional. Estas
responsabilidades abarcan el desarrollo de la política de información, la planificación de los
datos, la supervisión del diseño lógico de la base de datos, y el desarrollo del diccionario de
datos, así como el proceso de monitorear la forma en que los especialistas de sistemas de
información y los grupos de usuarios finales utilizan los datos.
4.5 Aseguramiento de la calidad de los datos
Una base de datos y una política de información bien diseñadas son un gran avance en cuanto
a asegurar que la empresa tenga la información que necesita. Sin embargo, hay que llevar a
cabo ciertas acciones adicionales para asegurar que los datos en las bases de datos
organizacionales sean precisos y permanezcan confiables. Los datos imprecisos, inoportunos
o inconsistentes con otras fuentes de información conducen a decisiones incorrectas, llamadas
a revisión de los productos y pérdidas financieras. Un estudio de Sirius Decisions sobre “El
impacto de datos erróneos en la creación de demanda” descubrió que del 10 al 25% de los
registros de clientes y prospectos contienen errores críticos de datos. Al corregir estos errores
en su origen y seguir las prácticas recomendadas para promover la calidad de los datos,

aumentó la productividad del proceso de ventas y se generó un incremento del 66% en los
ingresos. Si una base de datos está diseñada adecuadamente y hay estándares de datos
establecidos a nivel empresarial, los elementos de datos duplicados o inconsistentes deben
reducirse al mínimo. Sin embargo, la mayoría de los problemas de calidad de los datos, como
los nombres mal escritos, los números traspuestos y los códigos incorrectos o faltantes, se
derivan de los errores durante la captura de los datos. Los problemas de calidad de los datos
no son sólo problemas de negocios, también representan serios problemas para los
individuos, en cuanto a que afectan su condición financiera e incluso sus empleos. Por
ejemplo, la información imprecisa u obsoleta sobre los historiales crediticios de los
consumidores que mantienen los burós de crédito pueden evitar que individuos solventes
obtengan préstamos o se reduzca su probabilidad de encontrar o conservar un empleo.
5. Conclusión:
La inteligencia de negocios, es una parte fundamental en una organización, ya que permite
conocer el estado de sus procesos mediante la información que almacenan en los sistemas
garantizando un rendimiento ideal. De esta forma permite generar una solución dinámica y
flexible para la gestión de sus procesos de negocios de una manera eficaz. Del mismo modo
la base de datos benefició a las empresas y como estas ayudaron a mejorar sus procesos en la
gestión por lo cual es muy importante contar con una base de datos bien establecida.
Por ello es recomendable que las empresas busquen un buen sistema de manejo de
información que les permita recolectar sus datos diarios, mensuales y anual y que le permita
contrastar con los externos y así tomar una mejor decisión. asimismo, es recomendable que
las empresas tengan un área especializada en el manejo de información, como en la
inteligencia de mercado.
6. Referencias:
Barrera (2022). Bases de datos: conoce 10 herramientas útiles para administrarlas
https://www.nextu.com/blog/bases-de-datos-herramientas/
Bustamante. (2017). Fundamentos de la inteligencia de negocios y su aplicación en la

administración de empresas
https://libros.ecotec.edu.ec/index.php/editorial/catalog/download/57/51/784-1?inline=1
Fundamentos de gestión de servicios de TI. (2016). Fundamentos de inteligencia de negocios
https://sites.google.com/site/fundamendegestionserviciosti/2-3-fundamentos-de-inteligencia-
de-negocios
ComputerWeekly.es, Margaret Rouse (2019)
https://www.computerweekly.com/es/definicion/Sistema-de-gestion-de-bases-de-datos-o-
DBMS#:~:text=Un%20sistema%20de%20administraci%C3%B3n%20de,recuperar%2C
%20actualizar%20y%20administrar%20datos.
Lucid Chart (2018). Tutorial - Diagrama Entidad-Relación (ER) [Video]. YouTube.

https://www.youtube.com/watch?v=TKuxYHb-Hvc
Promperú (2021) ¿Qué es la inteligencia comercial?

https://repositorio.promperu.gob.pe/bitstream/handle/123456789/5127/I.
%20Comercial_Subt1_text.pdf?sequence=1&isAllowed=y
Oracle Mexico/ Base de datos
https://www.oracle.com/mx/database/what-is-database/

Bases de Datos y Administración de La Información

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Bases de Datos y Administración de La Información

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD NACIONAL“PEDRO RUIZ GALLO”

FACULTAD DE CIENCIAS ECONÓMICAS,

ESCUELA DE COMERCIO Y NEGOCIOS

Sistema de Información Gerencial

Fundamentos de inteligencia de negocios: Base de datos y

● ALARCÓN HERRERA, Ana Jasmín

● FERRE PANTA, Diego Daniel

● SÁNCHEZ ALCALDE, Jesús Rodrigo

● YNGA RIVERA, Juan Fernando

RONCAL DIAZ, Cesar wilbert

conocimiento para facilitar la toma de decisiones empresariales, involucrando el

funcionamiento actual y la anticipación de acontecimientos futuros. Daremos a conocer la

una solicitud, pedido o consulta.

lado, cada empresa busca de hacer eficiente el almacenamiento de la información, buscando

programas y app correctas.

La inteligencia de negocios o BI (business intelligence), se ha establecido como una solución

para el desarrollo de la gestión empresarial, mediante una serie de acciones planificadas y

herramientas para analizar los datos existentes de la organización y generar un conocimiento

de ello para facilitar la toma de decisiones empresariales, involucrando el funcionamiento

actual y la anticipación de acontecimientos futuros.

1.2 Evolución de inteligencia de negocios

textuales de recuperación de información e inventor del algoritmo de Luhn (algoritmo de

sobre inteligencia de negocios, entendida como la interrelación de hechos orientados al

generaban conocimientos sobre estos, debido a que no contaban con recursos

computacionales, dificultando el análisis de los datos por la carencia de herramientas que

permitieran la toma de decisiones a largo plazo y corto plazo.

En 1962, el canadiense Kenneth Iverson, el cual fue un notable matemático, realiza un

importante estudio sobre inteligencia de negocios plasmando un lenguaje de programación

multidimensional (APL); el cual es el pilar fundamental para el procesamiento analítico en

selectiva para analizarlos desde diferentes puntos de vista.

calidad y difícil acceso a información específica.

determinó una metodología llamada modelado dimensional que es un modelo de sistemas de

cálculo más utilizada actualmente y conocida como Excel.

cuales ofrecían acceso a un sinnúmero de bases de datos y a la información estructurada

generada por las empresas

Según Bustamante C.(pg.9) En 1989, un ilustre desconocido llamado Howard Dresner

mejorar la toma de decisiones empresariales mediante el uso de sistemas basados en hechos

Actualmente, las herramientas de tecnología de negocios se transformaron, ya que no solo

1.3 La implementación de un esquema de BI permite:

lugar y que esté disponible en tiempo real.

podrían afectar la empresa.

● Compartir información con pronósticos de ventas, incluyendo indicadores que

permitan medir el desempeño del negocio

● Permite agrupar información de diferentes áreas para establecer, modificar y ajustar

políticas, procesos y procedimientos

● Gran capacidad de reacción ante amenaza y vulnerabilidades del negocio, actuando o

● Capacidad de retroalimentación con respecto a hechos sucedidos para evaluar

políticas y objetivos del negocio

1.4 Ventajas de la Inteligencia de Negocio

● Control de los costos: Mediante la inteligencia de negocios, las empresas manejaran

fácilmente los distintos programas que se encuentren en las distintas áreas de la

organización, por lo tanto, va a mejorar la calidad de decisiones y facilitara el acceso

a la información en todos los niveles de la organización con la finalidad de obtener

los tiempos de aprendizaje mediante el uso de herramientas

sistema integrado de usos: Scorecards, Tableros de instrumentos, Informes, Minería

de Datos, y Almacenamiento Analítico.

● Proceso de negocio: Asiste a los ejecutivos para planear y pronosticar el trabajo,

The Globe and Mail

de los hogares canadienses que no estaban ya inscritos.

mucha molestia y aparte de ello incrementará los costos de marketing

Para operar un periódico importante se requiere administrar enormes cantidades de datos,

las principales fuentes de ingresos.

o no un periódico, o si hay que dirigirse a un cliente con una promoción de suscripción