Está en la página 1de 36

UNIVERSIDAD NACIONAL“PEDRO RUIZ GALLO”

FACULTAD DE CIENCIAS ECONÓMICAS,

ADMINISTRATIVAS Y CONTABLES

ESCUELA DE COMERCIO Y NEGOCIOS

INTERNACIONALES

Sistema de Información Gerencial

Tema:

Fundamentos de inteligencia de negocios: Base de datos y


administración de la información
Autores:

● ALARCÓN HERRERA, Ana Jasmín

● FERRE PANTA, Diego Daniel

● SÁNCHEZ ALCALDE, Jesús Rodrigo

● YNGA RIVERA, Juan Fernando

Docente:

RONCAL DIAZ, Cesar wilbert

Chiclayo – Perú

2022
Introducción

Actualmente las empresas utilizan un análisis de datos existentes, los cuales generan

conocimiento para facilitar la toma de decisiones empresariales, involucrando el

funcionamiento actual y la anticipación de acontecimientos futuros. Daremos a conocer la

importancia de la base de datos y cómo estas facilitan el proceso y la mejora continua en las

empresas para poder tomar las mejores decisiones y así poder recortar el tiempo de espera de

una solicitud, pedido o consulta.

Además, las empresas u organizaciones buscan información para lograr constatar con la

información interna que ellos tienen y así tomar una mejor decisión en su empresa, por otro

lado, cada empresa busca de hacer eficiente el almacenamiento de la información, buscando

programas y app correctas.


Fundamentos de inteligencia de negocios: Base de datos y administración de la información.........1
1- La inteligencia de negocios...................................................................................................5
1.1 Definición....................................................................................................................... 5
1.2 Evolución de inteligencia de negocios..............................................................................5
1.3 La implementación de un esquema de BI permite:...........................................................7
1.4 Ventajas de la Inteligencia de Negocio.............................................................................7
1.5. Problemas que interfieren en el desarrollo de datos........................................................9
2- ¿Cuáles son las principales capacidades de los sistemas de administración de bases de datos
(DBMS) y porque son poderosos un DBMS relacional?..........................................................11
2.1. Base de datos............................................................................................................... 11
2.2 lenguaje de consulta estructurada.................................................................................11
2.3 Evolución de la base de datos........................................................................................11
2.4 Tipos de bases de datos.................................................................................................12
2.4.1 Bases de datos relacionales SQL:............................................................................12
2.4.2 Bases de datos orientadas a objetos:........................................................................12
2.4.3 Bases de datos distribuidas:....................................................................................12
2.4.4 Almacenes de datos................................................................................................12
2.4.5 Bases de datos NoSQL............................................................................................12
2.4.6 Bases de datos orientadas a grafos..........................................................................13
2.4.7 Bases de datos OLTP.................................................................................................13
2.4.8 Bases de datos de código abierto.............................................................................13
2.4.9 Bases de datos en la nube:......................................................................................13
2.4.10 Base de datos multimodelo:..................................................................................13
2.4.11 Bases de datos de documentos/JSON.....................................................................13
2.4.12 Bases de datos de autogestión................................................................................14
2.5 ¿Qué es un software de base de datos?..........................................................................14
2.6 DBMS.......................................................................................................................... 14
2.7 DBMS relacional..........................................................................................................15
2.8 Operaciones de un DBMS relacional.............................................................................15
2.9 Bases de datos no relacionales y bases de datos en la nube.............................................16
2.10 Tipos populares de DBMS..........................................................................................16
2.11 Ventajas de DBMS.....................................................................................................17
2.12 Capacidades de los sistemas de administración de bases de datos.................................18
3. Diseño de Base de Datos:....................................................................................................19
3.1 Etapas de diseño de bases de datos.......................................................................19
3.1.1 Etapa del diseño Conceptual:.................................................................................19
3.1.2 Orientada a objetivos:................................................................................................20
3.1.3 Relacional:................................................................................................................ 20
3.1.4 Etapa de diseño Lógico:.............................................................................................20
3.1.5 Etapa del diseño físico:..............................................................................................20
3.2 ¿Cuáles son las principales herramientas y tecnologías para acceder a la información de
las bases de datos y mejorar tanto el desempeño de negocios como la toma de decisiones?....22
3.3 El desafío del Big Data..................................................................................................22
3.4 Infraestructura de inteligencia de Negocios...................................................................24
3.5 Almacenes de datos y mercados de datos.......................................................................25
3.5.1 Hadoop..................................................................................................................27
3.5.2 Computación en memoria.......................................................................................28
4.Plataformas analíticas.........................................................................................................29
4.1 Procesamiento analítico en línea (OLAP)......................................................................30
4.2 Minería de datos...........................................................................................................30
4.3 Minería de texto y minería Web....................................................................................32
4.4 Las bases de datos y web...............................................................................................32
4.4.1 ¿Por qué la política de información, la administración de datos y el aseguramiento de
la calidad de los datos son esenciales para administrar los recursos de datos de la empresa?
...................................................................................................................................... 33
4.5 Aseguramiento de la calidad de los datos.......................................................................34
5. Conclusión:...................................................................................................................... 35
6. Referencias:....................................................................................................................... 35
1- La inteligencia de negocios.

1.1 Definición

La inteligencia de negocios o BI (business intelligence), se ha establecido como una solución

para el desarrollo de la gestión empresarial, mediante una serie de acciones planificadas y

herramientas para analizar los datos existentes de la organización y generar un conocimiento

de ello para facilitar la toma de decisiones empresariales, involucrando el funcionamiento

actual y la anticipación de acontecimientos futuros.

1.2 Evolución de inteligencia de negocios

Según Bustamante C.(pg.2) En 1958, Hans Peter Luhn (quien trabajó para IBM) y creó más

de 80 patentes. También conocido por ser el primero en aplicar la estadística en los análisis

textuales de recuperación de información e inventor del algoritmo de Luhn (algoritmo de

módulo 10, que permite detectar errores en la transcripción de dígitos). habla por primera vez

sobre inteligencia de negocios, entendida como la interrelación de hechos orientados al

desarrollo de una meta. Anteriormente las empresas generaban datos y con mucho esfuerzo

generaban conocimientos sobre estos, debido a que no contaban con recursos

computacionales, dificultando el análisis de los datos por la carencia de herramientas que

permitieran la toma de decisiones a largo plazo y corto plazo.

En 1962, el canadiense Kenneth Iverson, el cual fue un notable matemático, realiza un

importante estudio sobre inteligencia de negocios plasmando un lenguaje de programación

multidimensional (APL); el cual es el pilar fundamental para el procesamiento analítico en

línea, conocido como OLAP, el cual consiste en extraer y consultar datos de manera fácil y

selectiva para analizarlos desde diferentes puntos de vista.

En la década de los setenta, se crearon distintos sistemas de gestión de base de datos y las

primeras aplicaciones empresariales (SAP, JD, SIEBEL, entre otros). Los cuales, permitían
realizar datos mediante una computadora. Entre las más importantes se encuentra la

aplicación informática, pero aun así no llegó a cumplir con el objetivo que se esperaba, ya

que no fueron capaces de ofrecer un acceso rápido, debido a que su organización era de baja

calidad y difícil acceso a información específica.

En la década de los 80, se vio el concepto de almacén de datos, en el cual Ralph Kimball,

determinó una metodología llamada modelado dimensional que es un modelo de sistemas de

soporte de decisiones y expresa que un almacén de datos extrae, limpia, conforma y entrega

una fuente de datos dimensional para la consulta y el análisis” Con lo cual, este autor tiene un

punto de coincidencia con Dresner (2010) al determinar que el almacén de datos es la unión

de todos los “data-marts” de una entidad. Asimismo, en 1985 lanzan al mercado la hoja de

cálculo más utilizada actualmente y conocida como Excel.

la década de los noventa, empezaron a surgir y fueron populares las herramientas de BI; las

cuales ofrecían acceso a un sinnúmero de bases de datos y a la información estructurada

generada por las empresas

Según Bustamante C.(pg.9) En 1989, un ilustre desconocido llamado Howard Dresner

comenzó a acuñar el término de BI, para describir los conceptos y métodos con el objetivo de

mejorar la toma de decisiones empresariales mediante el uso de sistemas basados en hechos

de apoyo- y con el pasar del tiempo hasta finalizar la década del 90 se comenzó a popularizar

estas herramientas. Es por ello que se crearon múltiples aplicaciones de BI que ofrecían

acceso a las diferentes bases de datos y a la información estructurada generada por las

empresas.

Actualmente, las herramientas de tecnología de negocios se transformaron, ya que no solo

eran consideradas la información de la base de datos, sino que imágenes, videos, audios,

correos electrónicos en su nueva versión. Puesto que ahora existen grandes cantidades de
información que se almacenan y es importante la creación de estas herramientas para poder

analizar y categorizar la información de una manera más eficaz, dando resultados inmediatos

para la toma de decisiones y así tengan una ventaja competitiva con respecto a su empresa.

1.3 La implementación de un esquema de BI permite:

● Generar información global o por secciones, que permita ser almacenada en un único

lugar y que esté disponible en tiempo real.

● Evalúa los distintos escenarios que permitan analizar los distintos problemas que

podrían afectar la empresa.

● Compartir información con pronósticos de ventas, incluyendo indicadores que

permitan medir el desempeño del negocio

● Permite agrupar información de diferentes áreas para establecer, modificar y ajustar

políticas, procesos y procedimientos

● Gran capacidad de reacción ante amenaza y vulnerabilidades del negocio, actuando o

anticipándose a éstos

● Capacidad de retroalimentación con respecto a hechos sucedidos para evaluar

políticas y objetivos del negocio

1.4 Ventajas de la Inteligencia de Negocio

● Control de los costos: Mediante la inteligencia de negocios, las empresas manejaran

fácilmente los distintos programas que se encuentren en las distintas áreas de la

organización, por lo tanto, va a mejorar la calidad de decisiones y facilitara el acceso

a la información en todos los niveles de la organización con la finalidad de obtener

mejores resultados.

● Reduce tiempos: Orienta las soluciones tecnológicas hacia el usuario, ya que reduce

los tiempos de aprendizaje mediante el uso de herramientas


● Visión de negocio: Proporciona una profunda visión del negocio a través de un

sistema integrado de usos: Scorecards, Tableros de instrumentos, Informes, Minería

de Datos, y Almacenamiento Analítico.

● Proceso de negocio: Asiste a los ejecutivos para planear y pronosticar el trabajo,

presentando una descripción común de los procesos del negocio de una compañía.

The Globe and Mail

The Globe and Mail, ubicado en Toronto, Canadá Es el periódico más grande de Canadá,

con una base de lectores acumulada de seis días de casi 3.3 millones. El periódico contaba

con un programa de marketing bastante ambicioso, en el que veía como prospecto a cada uno

de los hogares canadienses que no estaban ya inscritos.

Esta empresa había tenido problemas con sus usuarios debido a que volvían a enviar ofertas

de suscripción hacia su periódico cuando los usuarios ya se habían suscrito y esto causó

mucha molestia y aparte de ello incrementará los costos de marketing

Para operar un periódico importante se requiere administrar enormes cantidades de datos,

incluyendo los datos de circulación, los de ingresos por publicidad, los datos de prospectos

de marketing y los que “no deben contactarse”, además de los datos de logística y entregas.

Asimismo, datos requeridos para operar una empresa, como los datos financieros y de

recursos humanos

Durante mucho tiempo la empresa the globe en mail, guardó gran parte de sus datos en un

sistema mainframe, los cuales son capaces de controlar cientos de usuarios simultáneamente,

así como cientos de dispositivos de entrada y salida. Aun así este sistema no era muy eficaz

debido a que no se podían obtener datos actualizados y eso llevaba a que nos aparezcan

usuarios que recién se habían suscrito. Por otro lado, también está la parte de seguridad de
usuario, ya que the globe and mail recolecta y almacena la información de pago de los

clientes; alojar estos datos confidenciales en varios lugares hace aún más difícil el poder

asegurar que se implementen los controles de seguridad de datos correctos. Los primeros

datos que ocuparon el almacén de datos fueron los de ventas por publicidad, que son una de

las principales fuentes de ingresos.

En 2002 la empresa implementó el sistema empresarial SAP, el cual contendría todos los

datos de la empresa provenientes de sus diversos orígenes de datos en una sola ubicación

donde los usuarios de negocios pudieran acceder a ellos y analizarlos de una manera fácil.

Debido a eso pudieron tener todos los datos en un solo lugar, ya que el periódico podía

relacionarse fácilmente con los datos de los prospectos y de los clientes para no dirigirse a los

clientes existentes y los datos sobre el área de entregas para determinar si es posible entregar

o no un periódico, o si hay que dirigirse a un cliente con una promoción de suscripción

digital. Además, tuvieron que capacitar a sus trabajadores, finalmente lograron obtener

resultados del nuevo sistema que implementaron, produciendo menos costos, obteniendo más

tiempo para poder almacenar sus datos y lo más importante satisfaciendo a sus clientes.

1.5. Problemas que interfieren en el desarrollo de datos

En la mayoría de las organizaciones los sistemas tendían a crecer de manera independiente

sin un plan a nivel de toda la compañía. Contabilidad, finanzas, manufactura, recursos

humanos, ventas y marketing desarrollaban sus propios sistemas y archivos de datos.

● Redundancia e inconsistencia de los datos

La redundancia de datos es un conjunto de datos duplicados en varios archivos y a la

vez se almacenan en más de un lugar o ubicación. Además, desperdicia recursos de

almacenamiento y también conduce a la inconsistencia de los datos, donde el mismo


atributo puede tener distintos valores. Esto aumenta los costos de almacenamiento y

acceso a los datos, además de que puede originar la inconsistencia de los datos - es

decir diversas copias de un mismo dato no concuerdan entre sí -, por ejemplo: que se

actualiza la dirección de un cliente en un archivo y que en otros archivos permanezca

la anterior

● Dependencia programa datos

La dependencia programa datos se refiere a la unión de los datos almacenados en

archivos y los programas específicos requeridos para actualizar y dar mantenimiento a

esos archivos, de tal forma que los cambios en los programas requieran cambios en

los datos.

● Falta de flexibilidad

Un sistema de archivos logra entregar informes de rutina después de largas horas de

programación, pero no llega a entregar a tiempo estos informes debido a que no

responde a los requerimientos de la información no anticipados y es muy costoso

recuperar los datos.

● Seguridad defectuosa

Al tener poco control y administración de datos, se hace muy difícil tener acceso a la

información, puesto que la gerencia tal vez no tenga forma de saber quién está

accediendo a los datos de la organización, o incluso modificándose.

● Falta de compartición y disponibilidad de los datos

Mayormente la información de datos anda dispersa en distintos archivos y diferentes

partes de la organización, lo cual hace que no puedan funcionar muy bien en las
distintas áreas de organización y que debido a ello los usuarios no puedan confiar en

la precisión de sus datos.

2- ¿Cuáles son las principales capacidades de los sistemas de administración de bases de


datos (DBMS) y porque son poderosos un DBMS relacional?

2.1. Base de datos

La base de datos es una recopilación organizada de información o datos estructurados, que

normalmente se almacena de forma electrónica en un sistema informático. Normalmente, una

base de datos está controlada por un sistema de gestión de bases de datos (DBMS).La

mayoría de las bases de datos utilizan un lenguaje de consulta estructurada (SQL) para

escribir y consultar datos.

2.2 lenguaje de consulta estructurada

El SQL es un lenguaje de programación que utilizan casi todas las bases de datos relacionales

para consultar, manipular y definir los datos, además de para proporcionar control de acceso.

El SQL se desarrolló por primera vez en IBM en la década de 1970

2.3 Evolución de la base de datos

Las bases de datos han evolucionado desde su inicio a principios de la década de 1960. Las

bases de datos de navegación, como la base de datos jerárquica (que se basaba en un modelo

de árbol y permitía una relación de uno a muchos) y la base de datos de red (un modelo más

flexible que permitía relaciones múltiples), eran los sistemas originales que se utilizaban para

almacenar y manipular datos. En la década de 1980, se hicieron populares las bases de datos

relacionales, seguidas de las bases de datos orientadas a objetos en la década de 1990. Más

recientemente, las bases de datos NoSQL surgieron como respuesta al crecimiento de Internet
y la necesidad de acelerar la velocidad y el procesamiento de los datos no estructurados. Hoy

en día es una necesidad de contar una base de datos

2.4 Tipos de bases de datos

La mejor base de datos para una organización específica depende de cómo pretenda la

organización utilizar los datos.

2.4.1 Bases de datos relacionales SQL:

Se hicieron predominantes en la década de 1980. Los elementos de una base de datos

relacional se organizan como un conjunto de tablas con columnas y filas.

2.4.2 Bases de datos orientadas a objetos:

La información de una base de datos orientada a objetos se representa en forma de objetos.

2.4.3 Bases de datos distribuidas:

Una base de datos distribuida consta de dos o más archivos que se encuentran en sitios

diferentes. La base de datos puede almacenarse en varios ordenadores, ubicarse en la misma

ubicación física o repartirse en diferentes redes.

2.4.4 Almacenes de datos.


Un repositorio central de datos, un data warehouse es un tipo de base de datos diseñado

específicamente para consultas y análisis rápidos.

2.4.5 Bases de datos NoSQL.


Conocida de base de datos no relacional, permite almacenar y manipular datos no

estructurados y semiestructurados
2.4.6 Bases de datos orientadas a grafos.
Una base de datos orientada a grafos almacena datos relacionados con entidades y las

relaciones entre entidades.

2.4.7 Bases de datos OLTP.


Es una base de datos rápida y analítica diseñada para que muchos usuarios realicen un gran

número de transacciones.

Otras bases de datos menos comunes se adaptan a funciones científicas, financieras o de otro

tipo muy específicas.

2.4.8 Bases de datos de código abierto.


Es aquel cuyo código fuente es de código abierto; tales bases de datos pueden ser bases de

datos SQL o NoSQL.

2.4.9 Bases de datos en la nube:


Es una recopilación de datos, estructurados o no estructurados, que reside en una plataforma

de cloud computing privada, pública o híbrida. Existen dos tipos de modelos de bases de

datos en la nube: tradicional y base de datos como servicio (DBaaS). Con DBaaS, un

proveedor de servicios realiza las tareas administrativas y el mantenimiento.

2.4.10 Base de datos multimodelo:


Las bases de datos multimodelo combinan distintos tipos de modelos de bases de datos en un

único servidor integrado.

2.4.11 Bases de datos de documentos/JSON.


Diseñadas para almacenar, recuperar y gestionar información orientada a los documentos en

formato JSON en lugar de en filas y columnas.


2.4.12 Bases de datos de autogestión.

El tipo de base de datos más nuevo e innovador, las bases de datos de autogestión (bases de

datos autónomas) están basadas en la nube y utilizan el machine learning para automatizar el

ajuste de la base de datos, la seguridad, las copias de seguridad, las actualizaciones y otras

tareas de gestión rutinarias que tradicionalmente realizan los administradores de bases de

datos.

2.5 ¿Qué es un software de base de datos?

El software de base de datos se utiliza para crear, editar y mantener archivos y registros de

bases de datos, lo que facilita la creación de archivos y registros, la entrada de datos, la

edición de datos, la actualización y la creación de informes. El software también maneja el

almacenamiento de datos, las copias de seguridad y la creación de informes, así como el

control de acceso múltiple y la seguridad. La seguridad sólida de las bases de datos

2.6 DBMS

Un sistema de administración de bases de datos (DBMS) es un software de sistema para crear

y administrar bases de datos. El DBMS proporciona a los usuarios y programadores una

forma sistemática de crear, recuperar, actualizar y administrar datos. Un DBMS también

permite a los usuarios finales crear, leer, actualizar y eliminar datos en una base de datos El

DBMS gestiona tres cosas importantes: los datos, el motor de la base de datos que permite

acceder a los datos, bloquearlos y modificarlos, y el esquema de la base de datos, que define

la estructura lógica de la base de datos.

La vista lógica presenta los datos según los perciben los usuarios finales o los espe- cialistas

de negocios, en tanto que la vista física muestra la verdadera forma en que están organizados

y estructurados los datos en los medios de almacenamiento físicos


Cómo resuelve un DBMS los problemas del entorno de archivos tradicional

Un DBMS reduce la redundancia e inconsistencia de los datos al minimizar los archivos

aislados en los que se repiten los mismos datos. Tal vez el DBMS no logre que la

organización elimine del todo la redundancia de datos, pero puede ayudar a controlarla. El

DBMS desacopla los programas y los datos, con lo cual los datos se pueden independizar. El

DBMS permite que la organización administre de manera central los datos, su uso y su

seguridad.

2.7 DBMS relacional

Los DBMS contemporáneos utilizan distintos modelos de bases de datos para llevar el

registro de las entidades, atributos y relaciones. Es el tipo más popular de sistemas DBMS, a

los cuales se puede hacer referencia como si fueran archivos. Las bases de datos relacionales

representan los datos como tablas bidimensionales, a las cuales se puede hacer referencia

como si fueran archivos . La base de datos tiene una tabla y cada tabla consiste en una

cuadrícula de columnas y filas de datos.

2.8 Operaciones de un DBMS relacional

En una base de datos relacional se utilizan tres operaciones básicas, como seleccionar, unir y

proyectar. En otras palabras, la selección crea un subconjunto de filas que cumplen con

ciertos criterios. La operación unir combina tablas relacionales para proveer al usuario con

más información de la que está disponible en las tablas individuales mientras La operación

proyectar crea un subconjunto que consiste en columnas en una tabla, con lo cual el usuario

puede crear nuevas tablas que contengan solamente la información requerida.


2.9 Bases de datos no relacionales y bases de datos en la nube

La computación en la nube, los volúmenes de datos sin precedentes, las enormes cargas de

trabajo para los servicios Web y la necesidad de almacenar nuevos tipos de datos requieren

alternativas de bases de datos con respecto al modelo relacional tradicional de los sistemas de

administración de bases de datos no relacionales usan un modelo de datos más flexible y

están diseñados para manejar grandes conjuntos de datos entre varios elementos, además de

que pueden escalar fácilmente para aumentar o reducir su tamaño. Son útiles para acelerar las

consultas simples contra grandes volúmenes de datos estructurados y no estructurados, ya sea

en Web, social media, gráficos y demás formas de datos difíciles de analizar con

herramientas tradicionales basadas en SQL.

2.10 Tipos populares de DBMS

Los modelos de bases de datos populares y sus sistemas de gestión incluyen:

- Sistema de gestión de bases de datos relacionales (RDMS): adaptable a la

mayoría de los casos de uso.

- NoSQL DBMS: adecuado para estructuras de datos poco definidas que pueden

evolucionar con el tiempo.

- Sistema de gestión de bases de datos en memoria (IMDBMS): proporciona

tiempos de respuesta más rápidos y un mejor rendimiento.

- Sistema de gestión de bases de datos en columnas (CDBMS): Adecuado para

almacenes de datos que tienen una gran cantidad de elementos de datos similares.

- Sistema de gestión de datos basado en la nube: El proveedor de servicios en la

nube es responsable de proporcionar y mantener el DBMS


2.11 Ventajas de DBMS

Una de las mayores ventajas de usar un DBMS es que permite que los usuarios finales y los

programadores de aplicaciones accedan y usen los mismos datos mientras administran la

integridad de los datos. Los datos se protegen y mantienen mejor cuando se pueden compartir

utilizando un DBMS en lugar de crear nuevas iteraciones de los mismos datos almacenados

en nuevos archivos para cada nueva aplicación. El DBMS proporciona un almacén central de

datos al que pueden acceder múltiples usuarios de manera controlada.

- Extracción de datos e independencia

- Seguridad de datos

- Un mecanismo de bloqueo para acceso concurrente

- Un controlador eficiente para equilibrar las necesidades de múltiples aplicaciones

que utilizan los mismos datos

- La capacidad de recuperarse rápidamente de accidentes y errores, incluyendo la

capacidad de reinicio y la capacidad de recuperación

- Robustas capacidades de integridad de datos

- Registro y auditoría de la actividad

- Acceso simple usando una interfaz de programación de aplicaciones (API)

estándar

- Procedimientos uniformes de administración de datos


2.12 Capacidades de los sistemas de administración de bases de datos

Un DBMS incluye capacidades y herramientas para organizar, administrar y acceder a los

datos en la base de datos. Las más importantes son: su lenguaje de definición de datos, el

diccionario de datos y el lenguaje de manipulación de datos. Los DBMS tienen una capacidad

de definición de datos para especificar la estructura del contenido de la base de datos. Podría

usarse para crear tablas de bases de datos y definir las características de los campos en cada

tabla. Esta información sobre la base de datos se puede documentar en un diccionario de

datos, el cual es un archivo automatizado o manual que almacena las definiciones de los

elementos de datos y sus características.

Consultas e informes

. La mayoría de los DBMS tienen un lenguaje especializado llamado lenguaje de

manipulación de datos el cual se utiliza para agregar, modificar, eliminar y recuperar los

datos en la base de datos. Este lenguaje contiene comandos que permiten a los usuarios

finales y a los especialistas validar cualquier información.

Los usuarios de DBMS para computadoras grandes y de rango medio, como DB2, Oracle o

SQL Server, pueden emplear SQL para recuperar la información que necesitan de la base de

datos. Microsoft Access también utiliza SQL, sólo que provee su propio conjunto de

herramientas amigables para que el usuario realice consultas en las bases de datos y para

organizar la información de las bases de datos en reportes con una mejor presentación.

Plataformas analíticas

Permite analizar y combinar datos maestros con otras fuentes de datos para lograr un

conocimiento más profundo de las operaciones de negocios. Los distribuidores de bases de

datos comerciales han desarrollado plataformas analíticas especializadas de alta velocidad


que utilizan tecnología tanto relacional como no relacional y están optimizadas para analizar

conjuntos de datos de gran tamaño. IBM Netezza y Oracle Exadata son plataformas analíticas

que cuentan con sistemas de hardware-software preconfigurados que están diseñados de

manera específica para el procesamiento de consulta y los análisis. Por ejemplo, IBM

Netezza tiene componentes de base de datos, servidor y almacenamiento estrechamente

integrados que manejan consultas analíticas complejas 10 a 100 veces más rápido que los

sistemas tradicionales.

3. Diseño de Base de Datos:

De acuerdo a Mendoza & López el Diseño de la base de datos debe hacerse de manera

correcta ya que esto facilitará el acceso a la información de manera correcta y actualizada. De

esta forma se lograrán los objetivos trazados para la base de datos. Para diseñar una base de

datos es importante tener en cuenta una serie de principios bien definidos, partiendo

esencialmente de un dominio del que se obtendrá un modelo conceptual. Seguido este de un

modelo lógico, a este se le aplicará normalización y finalmente obtendremos un modelo físico

y poder implementarlo. Como podemos ver hacer el diseño de una base de datos no sencillo;

para poder diseñar un base de datos es importante conocer estas etapas:

3.1 Etapas de diseño de bases de datos

3.1.1 Etapa del diseño Conceptual:

En esta etapa se obtiene una estructura de la futura información que tendrá nuestra base de

datos, sin tomar en cuenta la tecnología que está usará ni el Sistema de gestión de datos, la

cual puede ser relacional, orientada a objetivos o jerárquica, obteniendo así el modelo de flujo

de información.
3.1.2 Orientada a objetivos:

Este sistema es usado mucha organización, ya que muestra datos complejos de las nuevas

tecnologías, la misma que ido aumentado su uso, sobre todo la tecnología web.

3.1.3 Relacional:

El modelo relacional significa que las estructuras lógicas de datos (las tablas de datos, las

vistas y los índices) están separadas de las estructuras físicas de almacenamiento.

3.1.4 Etapa de diseño Lógico:

Esta etapa parte del diseño conceptual, el mismo que se transforma en el tipo de base de datos

que vamos a utilizar, es preciso de la misma manera se ajuste al sistema de gestión de datos

con el que se va a implementar la base de datos. El proceso de normalización que se aplica en

esta etapa consiste en una serie de reglas que deben cumplir las tablas y relaciones obtenidas

tras el paso del modelo entidad relación al modelo relacional, para entonces ser un modelo

lógico. Las bases de datos relacionales se normalizan básicamente para: evitar la redundancia

de los datos, evitar problemas de actualización de los datos en las tablas, proteger la

integridad de los datos

3.1.5 Etapa del diseño físico:

En esta etapa se va transformar la estructura obtenida en la etapa de diseño lógico, con el

objeto de conseguir más eficiencia; además, se completa con aspectos de implementación

física que dependen del Sistema de gestión de datos.

3.1.6 Diagramas de normalización y de entidad-relación

En el diseño de la base de datos se describe la forma en la que se agruparán los elementos de

datos en la base. El proceso de diseño identifica las relaciones entre los elementos de datos y
la forma más eficiente para agruparlos en conjunto para cubrir los requerimientos de

información de la empresa. Dicho proceso también identifica a los elementos de datos

relevantes y las agrupaciones de elementos de datos requeridas para ciertos programas de

aplicaciones específicas. Los datos se organizan, refinan y optimizan hasta que surja una vista

lógica general de las relaciones entre todos los datos en la base de datos.

Para usar un modelo de base de datos relacional de manera eficaz, hay que optimizar los

agrupamientos complejos de datos con el fin de disminuir el número de elementos de datos

redundantes y las incómodas relaciones de varios a varios. Por lo que la normalización es el

proceso de crear estructuras de datos pequeñas y estables, pero a la vez flexibles y adaptivas a

partir de grupos complejos de datos.

Es importante que la creación de las páginas web dinámicas tenga un correcto diseño de la

base de datos.

Entidad de Relación

Entidad: es un objeto, un persona o un lugar que va ser gestionado, como cuando compramos

en Amazon, aquí la entidad puede ser un cliente un pedido o un producto; con; respecto al

cliente este tiene atributos tales como nombre apellido, calle ciudad, Código postal, teléfono,

etc., en tanto en los pedidos podemos encontrar Número de pedidos, cliente ID, nombre de

cliente, calle, ciudad, estado, código postal, fecha de envió, en el producto encontramos los

Productos ID, cantidad, Tipo de producto, y esta a las vez se relacionan tenido una lógica

entre entidades, es por ello que las bases de datos deben estar debidamente estructuradas
3.2 ¿Cuáles son las principales herramientas y tecnologías para acceder a la

información de las bases de datos y mejorar tanto el desempeño de negocios como la

toma de decisiones?

Las empresas usan sus bases de datos para llevar un correcto registro de las transacciones

básicas por ejemplo pagar a los proveedores, procesar pedidos, llevar el registro de los

clientes, control de sus almacenes, pagar a los empleados. Además de que es necesario bases

de datos para proveer información que ayude a la compañía a operar sus negocios con

eficiencia, así mismo ayudar a los gerentes y empleados a tomar mejores decisiones. Si una

compañía desea saber cuál producto es más vendido o quién es su cliente más rentable, la

respuesta radica en los datos.

Con el mundo globalizado y digitalizado las base datos han cobrado mucha relevancia. Que

una empresa sepa usar y administrar de manera correcta la base de datos le da una ventaja

competitiva cuando inician sus actividades, los datos están digitalizados y almacenados en

discos que permiten acceder a ellos desde cualquier lugar del mundo. Para coronel et all

(2011) las bases de datos, “son estructuras especializadas que permiten a sistemas

computarizados guardar, manejar y recuperar datos con gran rapidez”. Para ellos la

importancia de conocer sobre las bases de datos y su funcionamiento radica en que

“prácticamente todos los sistemas modernos se apoyan en ellas (las bases de datos)”, por lo

que recomiendan “una buena comprensión de cómo se crean estas estructuras y cómo se

usan”

3.3 El desafío del Big Data

La mayoría de los datos que se recolectaban por las organizaciones eran datos que se

transferían fácilmente en filas y columnas de sistemas de administración de bases de datos

relacionales. Ahora, podemos ver de una explosión de datos provenientes del tráfico Web,
mensajes de correo electrónico y contenido de medios sociales (tweets, mensajes de estado),

al igual que los datos generados por máquinas de los sensores (utilizados en medidores

inteligentes, sensores de fabricación y medidores eléctricos) o de sistemas de e-commerce.

Dichos datos pueden estar estructurados o no y, por ello, tal vez no sean adecuados para

productos de bases de datos relacionales que organicen los datos en forma de columnas y

filas. El término bigdata describe al conjunto de datos con volúmenes tan grandes que están

más allá de la capacidad de un DBMS (Database management system) estándar para capturar,

almacenar y analizar. Big Data no tiene cantidad específica, sino por lo general a los datos en

el rango de los petabytes, Hard zone (2018)Si nos vamos al inicio de todo, la cantidad más

chica de memoria es el bit, ocho bits hacen un byte. Para llegar a un Petabyte (PB)

necesitamos 1125899906842618 bytes, unos mil billones de bytes, una cantidad bastante

llamativa de entrada, pero que son 1024 TB y exabytes, es una unidad de medida que es igual

a 1024 PB, que es actualmente el límite de almacenamiento de muchos sistemas de archivos.;

es decir, de miles de millones a billones de registros todos de orígenes distintos. Los Big Data

son producto de una cantidad mucho mayores y con mucha más rapidez que los datos

tradicionales. Por ejemplo, un solo motor de jet es capaz de generar 10 terabytes de datos en

sólo 30 minutos, y hay más de 25,000 vuelos de aerolíneas a diario. Aun cuando los “tweets”

se limitan a 140 caracteres cada uno, Twitter genera más de 8 terabytes de datos por día. De

acuerdo con la empresa de investigación de tecnología International Data Center (IDC), los

datos se duplican con creces cada dos años, por lo que la cantidad de datos disponibles para

las organizaciones está aumentando en forma indiscriminada.

A las empresas les interesan los Big Data ya que les permite revelar más patrones y

anomalías interesantes que los conjuntos de datos más pequeños, con el potencial de proveer

nuevas perspectivas en cuanto al comportamiento de los clientes, los patrones de clima, la

actividad del mercado financiero u otros fenómenos. Sin embargo, para derivar un valor de
negocios de estos datos, las organizaciones necesitan nuevas tecnologías y herramientas

capaces de administrar y analizar datos no tradicionales junto con sus datos empresariales

tradicionales.

3.4 Infraestructura de inteligencia de Negocios

Es importante saber dónde conseguir información concisa y confiable sobre las operaciones,

tendencias y cambios actuales en toda la empresa. Si trabajara en una empresa de gran

tamaño, tendría que reunir los datos necesarios de sistemas separados, como ventas,

manufactura y contabilidad, e incluso desde fuentes externas, como los datos demográficos o

de las competencias. Probablemente la Big Data tomará más importancia con el pasar del

tiempo. Una infraestructura contemporánea para la inteligencia de negocios cuenta con

variedad de herramientas para obtener información útil de todos los tipos diferentes de datos

que usan las empresas en la actualidad, incluyendo Big Data semiestructurados y no

estructurados en grandes cantidades. Dicha capacidades incluyen almacenes de datos y

mercados de datos, Hadoop(Permite a las aplicaciones trabajar con miles de nodos en

red y petabytes de datos), computación en memoria y plataformas analíticas. Algunas de

estas capacidades están disponibles como servicios en la nube.

De acuerdo a Promperú la inteligencia comercial combina el análisis de negocios,

visualización, herramientas e infraestructura de datos. La realización del estudio de

inteligencia de mercado es el paso uno que las empresas tienen que realizar antes de

embarcarse en un negocio o para mejorar su participación en el comercio internacional. El

procedimiento incluye la recopilación y procesamiento adecuado de toda la información que

la empresa necesita para tomar decisiones.


La inteligencia de comercial combina es la combinación de negocios, visualización,

herramientas e infraestructura de datos, y las prácticas recomendadas para ayudar a las

empresas a tomar decisiones basadas en los datos. En la práctica, implementar la inteligencia

comercial moderna implica contar con una vista integral de todos los datos de la

organización. También, consiste en usar estos datos para impulsar el cambio, eliminar las

ineficiencias y adaptarse rápidamente a los cambios del mercado o la demanda. La

inteligencia comercial ayuda a las organizaciones tomar decisiones más correctas, ya que

ofrece datos actuales e históricos dentro de su contexto empresarial. Los analistas pueden

aprovechar la inteligencia comercial para establecer valores de referencia de rendimiento y de

la competencia. De esta manera, la organización podrá operar de forma ágil y eficiente.

Para la elaboración de un estudio de mercado para la inteligencia comercial existen varias

herramientas, para esta exposición veremos las que nos brindan datos, de las cuales pueden

ser nacionales e internacionales, las nacionales podemos encontrar las elaboradas por las

instituciones del estado como Promperú, SIICEX, SUNAT; entre otros, y las que se elaboran

de manera privada, para lo cual se debe paga para conseguir una cuenta de acceso, entre los

cuales tenemos Veritrade, Azatrade, CCITrade, en el caso de las internacionales una de las

herramientas más importantes es Trade Map

3.5 Almacenes de datos y mercados de datos

La herramienta tradicional para analizar datos corporativos durante las últimas dos décadas

ha sido el almacén de datos. Un almacén de datos es una base de datos que almacena la

información actual e histórica de interés potencial para realizar una correcta toma de

decisiones a quien le corresponda. Los datos se originan en muchos sistemas básicos de

transacciones operacionales, como los sistemas de ventas, las cuentas de clientes, la

manufactura, los datos de importación y exportación y pueden incluir datos de transacciones


de sitios Web. El almacén de datos extrae los datos actuales e históricos de varios sistemas

operacionales dentro de cada organización. Dichos datos se combinan con los datos de

fuentes externas y se transforman al corregir los datos imprecisos e incompletos y

reestructurar los datos para generar informes gerenciales y realizar análisis antes de cargarlos

en el almacén de datos.

El almacén de datos pone los datos a disposición de todos dependiendo de la necesidad, pero

no se puede alterar. Un sistema de almacén de datos también provee un rango de

herramientas analíticas y facilidades de informes gráficos.

En el comercio exterior hay herramientas que muestran sus datos en forma gráfica tal es el

caso de Promperu, que muestra algunos datos atreves de Power BI este programa se esta

usando bastante en las compañías para poder ordenar y hacer interactiva la información

interna y externa de su empresa, además de entidades nacionales tales como el ministerio de

Salud.

Las herramientas que se mencionaran en el punto la infraestructura de inteligencia de

Negocios, también almacenan datos de exportación e imporatacion pero también existe

sistemas donde los agentes de aduanas, como es el caso de Sintad.

A menudo las empresas crean almacenes de datos a nivel empresarial, donde un almacén de

datos central da servicio a toda la organización, o crean almacenes de datos más pequeños y

descentralizados conocidos como mercados de datos. Un mercado de datos es un

subconjunto de un almacén de datos, en el cual se coloca una porción sintetizada o con alto

grado de enfoque en los datos de la organización en una base de datos separada para una

población específica de usuarios. Por ejemplo, una compañía podría desarrollar mercados de

datos sobre marketing y ventas para lidiar con la información de los clientes. El vendedor de

libros Barnes & Noble solía mantener una serie de mercados de datos: uno para los datos
sobre los puntos de venta en las tiendas minoristas, otro para las ventas de las librerías

universitarias y un tercero para las ventas en línea.

3.5.1 Hadoop

Los productos de DBMS relacionales y almacenes de datos no se adaptan bien para organizar

y analizar Big Data o datos que no caben fácilmente en las columnas y filas utilizadas en sus

modelos de datos. Para manejar datos no estructurados y semiestructurados en grandes

cantidades, así como datos estructurados, las organizaciones usan Hadoop, que es un marco

de trabajo de software de código abierto, administrado por la Fundación de Software Apache,

lo que ayuda al procesamiento paralelo distribuido de enormes cantidades de datos a través de

computadoras económicas. Segmenta un problema de Big Data en varios subproblemas, los

distribuye entre miles de nodos de procesamiento de computadoras económicas, para después

combinar el resultado en un conjunto de datos de menor tamaño que es más fácil de analizar.

Hadoop nos ayuda a encontrar la mejor tarifa aérea en Internet, obtener indicaciones para

llegar a un restaurante, realizar una búsqueda en Google o conectarse con un amigo en

Facebook.

Hadoop consta de varios servicios clave: el sistema de archivos distribuidos Hadoop (HDFS)

que sirve para el almacenamiento de datos y MapReduce para el proceso de datos en paralelo

de alto rendimiento. HDFS enlaza entre sí los sistemas de archivos en los numerosos nodos

en un clúster Hadoop para convertirlos en un gran sistema de archivos. MapReduce de

Hadoop se basa en el sistema MapReduce de Google para desglosar el procesamiento de un

gran conjunto de datos y asignar trabajo a los diversos nodos en un clúster (son grupos de

servidores que se gestionan juntos y participan en la gestión de la carga de trabajo). HBase, la

base de datos no relacional de Hadoop ofrece un acceso rápido a los datos almacenados en

HDFS y una plataforma transaccional para ejecutar aplicaciones en tiempo real de alta escala.
Hadoop procesa enormes cantidades de cualquier tipo de datos, incluyendo datos

transaccionales estructurados, datos poco estructurados tales como las fuentes de Facebook y

Twitter, datos complejos como los archivos de registro de servidor Web y datos de audio y

video no estructurados. Hadoop se ejecuta en un clúster de servidores económicos y pueden

agregarse o eliminarse procesadores según sea necesario. Las empresas usan Hadoop para

analizar grandes volúmenes de datos, así como el área que concentran datos no estructurados

y semiestructurados antes de cargarlos en un almacén de datos. Facebook por ejemplo

almacena gran parte de sus datos en un enorme clúster Hadoop, que contiene cerca de 100

petabytes, alrededor de 10,000 veces más información que la Biblioteca del Congreso

estadounidense. Yahoo usa Hadoop para rastrear cómo se comportan los usuarios de modo

que pueda modificar su página de inicio y adaptarla a sus intereses. La empresa de

investigación de ciencias de la vida NextBio usa Hadoop y HBase para procesar datos para

empresas farmacéuticas que realizan investigación genómica. Los principales distribuidores

de bases de datos como IBM, Hewlett-Packard, Oracle y Microsoft tienen sus propias

distribuciones de software de Hadoop. Otros distribuidores ofrecen herramientas para meter y

sacar datos de Hadoop, o para analizarlos dentro de Hadoop.

3.5.2 Computación en memoria

Otra manera de hacer fácil el análisis de Big Data es utilizar la computación en memoria, que

depende principalmente de la memoria principal (RAM) de la computadora para el

almacenamiento de datos (los DBMS convencionales usan sistemas de almacenamiento de

datos). Los usuarios acceden a los datos almacenados en la memoria principal del sistema,

con lo cual se eliminan los cuellos de botella por los procesos de recuperación y lectura de

datos en una base de datos tradicional basada en discos, y se reducen de manera drástica los
tiempos de respuesta de las consultas. El procesamiento en memoria hace posible que

conjuntos muy grandes de datos, del tamaño de un mercado de datos o de un almacén

pequeño de datos, residan totalmente en la memoria. Los cálculos de negocios complejos que

solían tardar horas o días pueden completarse en cuestión de segundos, y esto puede lograrse

incluso en dispositivos portátiles (vea la Sesión interactiva: tecnología).

La tecnología de hardware de computadora contemporánea que hacen posible el

procesamiento en memoria, como los poderosos procesadores de alta velocidad, el

procesamiento multinúcleo y los precios cada vez menores de la memoria de computadora.

Estas tecnologías ayudan a las empresas a optimizar el uso de la memoria y aceleran el

rendimiento del procesamiento, a la vez que reducen los costos.

4.Plataformas analíticas 

La base de datos analítica está diseñada especialmente para aplicaciones de análisis y

administración de empresas, generalmente aquellas relacionadas con un almacén de datos o

data mart. Este sistema es de solo lectura y almacena datos comerciales históricos, como el

rendimiento de ventas o los niveles de inventario. Presenta ventajas de adaptabilidad,

rendimiento, rentabilidad y facilidad de operación. Los usuarios podrán ver información

analizada diferente, como las ventas totales en un período determinado, y podrán compararla

con cualquier otro período deseado, así como obtener señales visuales como gráficos para

permitir a los ejecutivos ver fácilmente las tendencias y reaccionar en consecuencia ante el

cambio del mercado. Las plataformas de análisis hacen uso de construcciones de

contenedores en la memoria para asegurar y sincronizar muchos procesos que se ejecutan en

paralelo con aún más procesadores. Aparte de eso, estas plataformas usan hardware

económico que ya está disponible. Esto se debe a que es una solución de software que se

puede implementar en cualquier organización como un servicio pago, a medida que aumenta
la cantidad de datos, la complejidad analítica y el número de usuarios finales, las plataformas

analíticas ofrecen una variedad de opciones que pueden ayudar a reducir costos y más ayuda

para lograr una decisión informada adecuada. Un claro ejemplo de plataformas analíticas son

IBM Netezza y Oracle Exadata que cuentan con sistemas de hardware-software

preconfigurados que están diseñados de manera específica para el procesamiento de consulta

y los análisis.

4.1 Procesamiento analítico en línea (OLAP)

El procesamiento analítico en línea (OLAP) es una tecnología que organiza grandes bases de

datos empresariales y proporciona análisis complejos, se puede utilizar para realizar consultas

analíticas complejas sin afectar negativamente a algunos otros sistemas. Soporta el análisis de

datos multidimensional, el cual permite a los usuarios ver los mismos datos de distintas

formas mediante el uso de varias dimensiones. Cada aspecto de información, producto,

precios, costo, región o periodo de tiempo representa una dimensión distinta. OLAP permite a

los usuarios obtener respuestas en línea a preguntas en un tiempo muy corto, incluso  cuando

los datos se almacenan en bases de datos muy grandes, como las cifras de ventas  de varios

años.

4.2 Minería de datos

La minería de datos está más orientada al descubrimiento, ya que provee perspectivas hacia

los datos corporativos que no se pueden obtener mediante OLAP, al encontrar patrones y

relaciones ocultas en las bases de datos grandes e inferir reglas a partir de estos patrones y

relaciones, para predecir el comportamiento a futuro. Los tipos de información que se pueden

obtener de la minería de datos son: asociaciones, secuencias, clasificaciones, agrupamientos y

pronósticos.
-Las asociaciones: son ocurrencias vinculadas a un solo evento. Por ejemplo, un estudio de

los patrones de compra en supermercados podría revelar que cuando se compran frituras de

maíz, el 65% de veces se compra un refresco de cola, pero cuando hay una promoción, es el

85% de veces.

-En las secuencias: los eventos se vinculan en el transcurso del tiempo. Por ejemplo,

podríamos descubrir que, si se compra una casa, el 65% de veces se compra un refrigerador

nuevo dentro de las siguientes dos semanas, y el 45% se compra un horno dentro del mes

posterior a la compra de la casa.

La clasificación: ayuda a descubrir las características de los clientes con probabilidades de

dejar de serlo y puede proveer un modelo para ayudar a los gerentes a predecir quiénes son

esos clientes, de modo que puedan idear campañas especiales para retenerlos.

El agrupamiento: funciona de una manera similar a la clasificación

El pronóstico: utiliza las predicciones de una manera distinta. Se basa en una serie de valores

existentes para pronosticar cuáles serán los otros valores. Por ejemplo, el pronóstico podría

encontrar patrones en los datos para ayudar a los gerentes a estimar el futuro valor de

variables continuas, como las cifras de ventas.

La minería de datos puede contribuir significativamente en las aplicaciones de administración

empresarial basadas en la relación con el cliente. En lugar de contactar con el cliente de

forma indiscriminada a través de un centro de llamadas o enviando e-mails, solo se contactará

con aquellos que se perciba que tienen una mayor probabilidad de responder positivamente a

una determinada oferta o promoción. Las empresas que emplean minería de datos ven

habitualmente el retorno de la inversión, pero también reconocen que el número de modelos

predictivos desarrollados puede crecer muy rápidamente. En lugar de crear modelos para
predecir qué clientes pueden cambiar, la empresa podría construir modelos separados para

cada región y/o para cada tipo de cliente. También puede querer determinar qué clientes van a

ser rentables durante una ventana de tiempo (una quincena, un mes, ...) y solo enviar las

ofertas a las personas que es probable que sean rentables. Para mantener esta cantidad de

modelos, es necesario gestionar las versiones de cada modelo y pasar a una minería de datos

lo más automatizada posible.

4.3 Minería de texto y minería Web

En la actualidad hay herramientas de minería de texto disponibles para ayudar a las empresas

a analizar datos. Estas herramientas pueden extraer elementos clave de los conjuntos de datos

extensos no estructurados, descubrir patrones y relaciones, así como sintetizar la información.

Por ejemplo, el corredor de saldos Charles Schwab usa el software Attensity Analyze para

analizar cientos de miles de interacciones de sus clientes cada mes. El software analiza las

notas de servicio de los clientes de Schwab, los correos electrónicos, las respuestas de las

encuestas y las discusiones en línea para descubrir señales de descontento que puedan

provocar que un cliente deje de usar los servicios de la empresa.  Attensity puede identificar

automáticamente las diversas voces que usan los clientes para expresar su retroalimentación

(como una voz positiva, negativa o condicional) para señalar la intención de una persona de

comprar, su intención de abandonar, o la reacción a un producto o mensaje de marketing

específico.

Las empresas pueden recurrir a la minería Web para que les ayude a comprender el

comportamiento de los clientes, evaluar la efectividad de un sitio Web específico o

cuantificar el éxito de una campaña de marketing. Por ejemplo, los comerciantes utilizan los

servicios Google Trends y Google Insights for Search, que rastrean la popularidad de varias
palabras y frases utilizadas en las consultas de búsqueda de Google para saber en qué están

interesadas las personas y qué les interesa comprar.

4.4 Las bases de datos y web

Alguna vez hemos tratado de usar la Web para realizar un pedido o ver un catálogo de

productos pues es probable que hayamos usado un sitio Web vinculado a una base de datos

corporativa interna. Por ejemplo, que un cliente con un navegador Web desee buscar

información de precios en la base de datos en línea de un vendedor minorista. El usuario

accede al sitio Web del vendedor a través de Internet mediante el software de navegador Web

en su PC cliente. El software de navegador Web del usuario solicita información a la base de

datos de la organización, mediante comandos de HTML para comunicarse con el servidor

Web. Otras compañías han creado empresas totalmente nuevas con base en el acceso a bases

de datos extensas a través de la Web. Un ejemplo de esto es el sitio de redes

sociales Facebook, que ayuda a los usuarios a permanecer conectados entre sí o conocer

nuevas personas. Facebook incluye “perfiles” con información suministrada por 1,300

millones de usuarios activos sobre sí mismos, incluyendo intereses, amigos, fotos y grupos a

los que están afiliados. Mantiene una base de datos masiva para alojar y administrar todo su

contenido. También hay muchas bases de datos habilitadas para Web en el sector público que

ayudan a los consumidores y ciudadanos a acceder a información útil

4.4.1 ¿Por qué la política de información, la administración de datos y el aseguramiento

de la calidad de los datos son esenciales para administrar los recursos de datos de la

empresa?

Para poder asegurar que los datos de una empresa sigan siendo precisos, confiables y estén

disponibles de inmediato para quienes los necesiten, necesitará políticas y procedimientos

especiales para la administración de datos. Toda empresa, ya sea grande o pequeña, necesita
una política de información. Los datos de su empresa son un recurso importante, por lo que

no es conveniente que las personas hagan lo que quieran con ellos. Necesita tener reglas

sobre la forma en que se van a organizar y mantener los datos, y quién tiene permitido verlos

o modificarlos. Por ejemplo, una política de información típica especificará que solamente

miembros seleccionados del departamento de nómina y recursos humanos tendrían el derecho

de modificar y ver los datos confidenciales de los empleados, como el salario o número de

seguro social de un empleado, y que estos departamentos son responsables de asegurar

que los datos de cada empleado sean precisos.

La administración de datos es responsable de las políticas y procedimientos específicos a

través de los cuales se pueden gestionar los datos como un recurso organizacional. Estas

responsabilidades abarcan el desarrollo de la política de información, la planificación de los

datos, la supervisión del diseño lógico de la base de datos, y el desarrollo del diccionario de

datos, así como el proceso de monitorear la forma en que los especialistas de sistemas de

información y los grupos de usuarios finales utilizan los datos.

4.5 Aseguramiento de la calidad de los datos

Una base de datos y una política de información bien diseñadas son un gran avance en cuanto

a asegurar que la empresa tenga la información que necesita. Sin embargo, hay que llevar a

cabo ciertas acciones adicionales para asegurar que los datos en las bases de datos

organizacionales sean precisos y permanezcan confiables. Los datos imprecisos, inoportunos

o inconsistentes con otras fuentes de información conducen a decisiones incorrectas, llamadas

a revisión de los productos y pérdidas financieras. Un estudio de Sirius Decisions sobre “El

impacto de datos erróneos en la creación de demanda” descubrió que del 10 al 25% de los

registros de clientes y prospectos contienen errores críticos de datos. Al corregir estos errores

en su origen y seguir las prácticas recomendadas para promover la calidad de los datos,


aumentó la productividad del proceso de ventas y se generó un incremento del 66% en los

ingresos. Si una base de datos está diseñada adecuadamente y hay estándares de datos

establecidos a nivel empresarial, los elementos de datos duplicados o inconsistentes deben

reducirse al mínimo. Sin embargo, la mayoría de los problemas de calidad de los datos, como

los nombres mal escritos, los números traspuestos y los códigos incorrectos o faltantes, se

derivan de los errores durante la captura de los datos. Los problemas de calidad de los datos

no son sólo problemas de negocios, también representan serios problemas para los

individuos, en cuanto a que afectan su condición financiera e incluso sus empleos. Por

ejemplo, la información imprecisa u obsoleta sobre los historiales crediticios de los

consumidores que mantienen los burós de crédito pueden evitar que individuos solventes

obtengan préstamos o se reduzca su probabilidad de encontrar o conservar un empleo.

5. Conclusión:

La inteligencia de negocios, es una parte fundamental en una organización, ya que permite

conocer el estado de sus procesos mediante la información que almacenan en los sistemas

garantizando un rendimiento ideal. De esta forma permite generar una solución dinámica y

flexible para la gestión de sus procesos de negocios de una manera eficaz. Del mismo modo

la base de datos benefició a las empresas y como estas ayudaron a mejorar sus procesos en la

gestión por lo cual es muy importante contar con una base de datos bien establecida.

Por ello es recomendable que las empresas busquen un buen sistema de manejo de

información que les permita recolectar sus datos diarios, mensuales y anual y que le permita

contrastar con los externos y así tomar una mejor decisión. asimismo, es recomendable que

las empresas tengan un área especializada en el manejo de información, como en la

inteligencia de mercado.
6. Referencias:
Barrera (2022). Bases de datos: conoce 10 herramientas útiles para administrarlas

https://www.nextu.com/blog/bases-de-datos-herramientas/

Bustamante. (2017). Fundamentos de la inteligencia de negocios y su aplicación en la


administración de empresas

https://libros.ecotec.edu.ec/index.php/editorial/catalog/download/57/51/784-1?inline=1

Fundamentos de gestión de servicios de TI. (2016). Fundamentos de inteligencia de negocios

https://sites.google.com/site/fundamendegestionserviciosti/2-3-fundamentos-de-inteligencia-
de-negocios

ComputerWeekly.es, Margaret Rouse (2019)

https://www.computerweekly.com/es/definicion/Sistema-de-gestion-de-bases-de-datos-o-
DBMS#:~:text=Un%20sistema%20de%20administraci%C3%B3n%20de,recuperar%2C
%20actualizar%20y%20administrar%20datos.

Lucid Chart (2018). Tutorial - Diagrama Entidad-Relación (ER) [Video]. YouTube.


https://www.youtube.com/watch?v=TKuxYHb-Hvc

Promperú (2021) ¿Qué es la inteligencia comercial?


https://repositorio.promperu.gob.pe/bitstream/handle/123456789/5127/I.
%20Comercial_Subt1_text.pdf?sequence=1&isAllowed=y

Oracle Mexico/ Base de datos

https://www.oracle.com/mx/database/what-is-database/

También podría gustarte