Está en la página 1de 12

Métodos para la Inteligencia de

Negocios.

Elaborado por:
Dr. Abimael Antonio Pineda.

1
Temas Semana 2
2. Arquitectura para el almacenamiento de datos, data
Warehouse.
2.1. Elementos
2.2. Tipos de métricas
2.3. Modelo conceptual de datos, MySQL y NoSQL
2.3.1. Modelo físico
2.3.2. Modelo lógico

Objetivos Semana 2
• Aprender sobre las arquitecturas para el almacenamiento
de datos.
• Identificar los elementos que conforman el data
Warehouse.
• Conocer los tipos de métricas que se utiliza par el
almacenamiento de datos.
• Distinguir la diferencia entre los diferentes modelos de
datos.
• Saber elegir entre las bases de datos MySQL y NoSQL.

2
2. Arquitectura para el almacenamiento de datos, data
Warehouse.
Un Data Warehouse es un lugar donde se almacenan los datos con fines de
archivamiento, análisis de efectos y seguridad. Por lo general, un Data Warehouse
es un único equipo o varios ordenadores (servidores) atados juntos para crear un
sistema gigante de computadoras.
Los datos pueden consistir en datos primarios o datos con formato y pueden ser de
diversos tipos de temas, incluyendo una organización de ventas, los salarios, los
datos operativos, resúmenes de los datos incluidos, los informes, copias de los
datos, los datos de los recursos humanos, los datos de los inventarios, los datos
externos y para proporcionar simulaciones, análisis, etc.
Además de ser una Depósito (Warehouse) para almacenar grandes cantidades de
datos, poseen sistemas que facilitan el acceso a los datos y su utilización en
operaciones de día a día.
Un Data Warehouse es importante ya que sirve como un sistema de apoyo a las
decisiones. Además, sirve para organizar la utilización de los datos para llegar a los
hechos, las tendencias o las relaciones que pueden ayudarles a tomar decisiones
efectivas o crear estrategias eficaces para lograr sus objetivos.

Hay muchos modelos diferentes de Data Warehouse incluyendo el “procesamiento


de transacciones en línea” que es un modelo construido para la velocidad y la
facilidad de uso.

Otro tipo de Data Warehouse se llama “procesamiento analítico en línea”, este tipo
de Data Warehouse es más difícil de utilizar y agrega un paso adicional en el análisis
de los datos. Por lo general, requiere más medidas que hacen más lento el proceso
de datos y mucho más difícil el analizar algunas consultas.
Además de este modelo, uno de los modelos más comunes de almacenamiento de
datos incluye un Data Warehouse orientado al sujeto, variante en el tiempo, no

3
volátil e integrado. Orientado al sujeto se refiere a que los datos sean unidos y
organizados por las relaciones.
Variante en el tiempo significa que cualquier dato que se cambia en el Data
Warehouse puede ser rastreado. Por lo general, todos los cambios de datos son
marcados con un tiempo y con una fecha antes y después, de modo que se pueden
mostrar los cambios a lo largo de un período de tiempo.
No volátil, que los datos nunca sean eliminados o borrados. Esta es una gran
manera de proteger sus datos más importantes. Debido a que estos datos se
retienen, pueden seguir siendo utilizados en un análisis posterior.
Por último, los datos están integrados, lo que significa que en un Data Warehouse,
los datos son utilizados por toda la organización en lugar de sólo un departamento.
Además del término almacenamiento de datos, un término que se utiliza con
frecuencia es una base de “data mart”, data mart son más pequeños y menos
integrados almacenes de datos. Podrían ser sólo una base de datos sobre los
recursos humanos o de los registros de datos de ventas en una sola división.
Con las mejoras en la tecnología, así como las innovaciones en el uso de técnicas
de almacenamiento de datos, los Data Warehouse han cambiado a partir de bases
de datos operacionales sin conexión a una línea integrada de almacenamiento de
datos.

2.1. Elementos.
El almacén de datos se basa en un servidor RDBMS, que es un depósito de
información central rodeado de algunos componentes clave para que todo el
entorno sea funcional, manejable y accesible. Este almacén tiene cinco elementos
que lo componen:
• Base de datos del almacén de datos: La base de datos central es la base del
entorno de almacenamiento de datos. Esta base de datos se implementa en
la tecnología RDBMS.
• Herramientas de abastecimiento, adquisición, limpieza y transformación
(ETL): Estas herramientas se utilizan para realizar todas las conversiones,
resúmenes y todos los cambios necesarios para transformar los datos en un
formato unificado en el Data Warehouse.
• Metadatos: Los metadatos son datos sobre datos que definen el almacén de
datos. Se utiliza para construir, mantener y administrar el almacén de datos.
• Herramientas de consulta: Las herramientas de consulta permiten a los
usuarios interactuar con el sistema de almacenamiento de datos.

4
• Almacén de datos bus: El almacén de datos Bus determina el flujo de datos
en tu almacén. El flujo de datos en un almacén de datos se puede clasificar
como flujo de entrada, flujo ascendente, flujo descendente, flujo de salida y
metaflujo.

2.2. Tipos de métricas.


El objetivo principal de un sistema de Business
Intelligence es presentar información basada en
medidas. Es decir, valores con los que
cuantificamos procesos de negocio. Esta es la
parte más difícil. ¿Qué es lo que realmente
representa nuestro modelo de negocio? ¿Cuántas
medidas son necesarias?

Podemos distinguir diferentes tipos de medidas, basadas en el tipo de información


que recopilan, así como su funcionalidad asociada:

• Métricas: valores que recogen el proceso de una actividad o los resultados


de la misma. Esto medidas proceden del resultado de la actividad de negocio.
• Métricas de realización de actividad (leading): miden la realización
de un actividad. Por ejemplo, la participación de una persona en
un evento.
• Métricas de resultado de una actividad (lagging): recogen los
resultados de una actividad. Por ejemplo, la cantidad de puntos de
un jugador en un partido.

• Indicadores clave: entendemos por este concepto, valores correspondientes


que hay que alcanzar, y que suponen el grado de asunción de los objetivos.
Estas medidas proporcionar información sobre el rendimiento de una
actividad o sobre la consecución de una meta.

• Key Performance Indicator (KPI): Indicadores clave de


rendimiento. Más allá de la eficacia, se definen unos valores que
nos explican en qué rango óptimo de rendimiento nos deberíamos
situar al alcanzar los objetivos. Son métricas del proceso.
• Key Goal Indicator (KGI): Indicadores de metas. Definen
mediciones para informar a la dirección general si un proceso TIC
ha alcanzado sus requisitos de negocio, y se expresan por lo
general en términos de criterios de información.

5
Debemos distinguir que:

• Existen también indicadores de desempeño. Los indicadores clave de


desempeño (en definitiva, son KPI) definen mediciones que determinan qué
tan bien se está desempeñando el proceso de TI para alcanzar la meta. Son
los indicadores principales que indican si será factible lograr una meta o no,
y son buenos indicadores de las capacidades, prácticas y habilidades.
• Los indicadores de metas de bajo nivel se convierten en indicadores de
desempeño para los niveles altos.

2.3.- Modelo conceptual de datos, MySQL y NoSQL


Los modelos de datos definen cómo se modela la estructura lógica de una base de
datos. Los modelos de datos son entidades fundamentales para introducir la
abstracción en una base de datos.

Los modelos de datos definen cómo los datos se conectan entre sí y cómo se
procesan y almacenan dentro del sistema.

El primer modelo de datos fue el modelo de datos planos, donde todos los datos
utilizados se mantendrían en el mismo plano.

Código Postal

9063635

9345452

6345469

6654760

7754742

Los primeros modelos de datos no eran tan científicos, por lo tanto, eran propensos
a introducir muchas anomalías de duplicación y actualización.

Un modelo de datos puede ser concreto o abstracto, y están representados por la


notación de modelado de datos, que a menudo se presenta en formato gráfico.

6
Su enfoque principal es apoyar y ayudar a los sistemas de información mostrando
el formato y la definición de los diferentes datos involucrados.

También ayudan a evitar la redundancia de datos. La información almacenada en


los modelos de datos es de gran importancia para las empresas porque dicta las
relaciones entre las tablas de la base de datos, las claves externas y los eventos
involucrados.

Los tres tipos básicos de modelo de datos son:

1. Modelos de datos conceptuales


2. Modelos de datos físicos
3. Modelos de datos lógicos

Modelos de datos conceptuales

Un modelo conceptual de datos identifica las relaciones de más alto nivel entre las
diferentes entidades.

Las características del modelo conceptual de datos incluyen:

• Incluye las entidades importantes y las relaciones entre ellas.


• No se especifica ningún atributo.
• No se especifica ninguna clave principal.

La siguiente figura es un ejemplo de un modelo conceptual de datos.

Las bases de datos SQL asemejan a la transmisión automática en los vehículos, y


las NoSQL, a la manual. Una vez que se cambia a NoSQL, el usuario en el

7
responsable de una gran cantidad de trabajo que, en SQL, el sistema se encargaría
de forma automática.

Asimismo, las bases de datos NoSQL permiten ganar más rendimiento del sistema
mediante la eliminación de una gran cantidad de comprobaciones de integridad,
realizado por bases de datos relacionales, a partir del nivel de base de datos. Aquí
esto se compara a que, empleando transmisión manual, el usuario puede sacar más
rendimiento fuera del vehículo, frente a la automática.

Sin embargo, una de las más grandes ventajas de SQL es que, al igual que la
mayoría de los usuarios de vehículos de transmisión automática; la mayoría de los
sitios web, requieren más rapidez y menos experiencia.

¿CUÁNDO USAR SQL?

No existe una respuesta concreta, porque se presume que


cualquier cosa que se deba guardar, debe ser en una base
de datos relacional. Sin embargo, los programadores
podrían sugerir que en gaming o desarrollos de animación,
no sería necesario.

En la mayoría de las opiniones, una base de datos


relacional puede ser usada los siguientes ámbitos:

Educación: para estructurar información, y aportar conocimiento lógico al


estudiante.

Desarrollos web: para mantener jerarquía de datos, siempre y cuando la capacidad


de concurrencia, almacenamiento y mantenimiento no sean de considerable
dificultad y la información sea consistente.

Negocios: inteligencia y análisis de negocios, son temas que requieren el uso de


SQL para facilitar el consumo de la información y la identificación de patrones en
los datos.

Empresarial: porque tanto el software a la medida y el software empresarial, poseen


la característica de mantener información con estructura consistente.

8
¿CUÁNDO USAR NOSQL?

Básicamente se utilizan en:

Redes sociales: casi obligatorio.

Desarrollo Web: debido a la poca uniformidad de la


información que se encuentra en Internet; aun cuando
también puede emplearse SQL.

Desarrollo Móvil: debido a la tendencia – en crecimiento-


de Bring Your Own Device.

BigData: debido a la administración de grandísimas cantidades de información y su


evidente heterogeneida.

Cloud (XaaS): “Everything as a service”; NoSQL puede adaptarse casi a cualquier


necesidad del cliente, y sus particularidades.

2.3.1.- Modelos de datos físicos


El modelo de datos físicos representa cómo se construirá el modelo en la base de
datos.

Un modelo de base de datos física muestra todas las estructuras de tabla,


incluidos el nombre de columna, el tipo de datos de columna, las restricciones de
columna, la clave principal, la clave externa y las relaciones entre las tablas.

Las características de un modelo de datos físicos incluyen:

• Especificación de todas las tablas y columnas.


• Las claves externas se usan para identificar relaciones entre tablas.
• La desnormalización puede ocurrir según los requisitos del usuario.

Las consideraciones físicas pueden hacer que el modelo de datos físicos sea
bastante diferente del modelo de datos lógicos.

El modelo de datos físicos será diferente para diferentes Sistemas de Gestión de


Base de datos. Por ejemplo, el tipo de datos para una columna puede ser diferente
entre MySQL y SQL Server.

Los pasos básicos para el diseño del modelo de datos físicos son los siguientes:

• Convertir entidades en tablas.


9
• Convertir relaciones en claves externas.
• Convertir atributos en columnas.
• Modificar el modelo de datos físicos en función de las restricciones /
requisitos físicos.

Para más detalles lee el artículo Cómo modelar datos en una base de datos.

La siguiente figura es un ejemplo de un modelo de datos físicos.

2.3.2.- Modelos de datos lógicos


Un modelo de datos lógicos describe los datos con el mayor detalle posible,
independientemente de cómo se implementarán físicamente en la base de datos.

Las características de un modelo de datos lógicos incluyen:

• Incluye todas las entidades y relaciones entre ellos.


• Todos los atributos para cada entidad están especificados.
• La clave principal para cada entidad está especificada.
• Se especifican las claves externas (claves que identifican la relación entre
diferentes entidades).
• La normalización ocurre en este nivel.

Los pasos para diseñar el modelo de datos lógicos son los siguientes:

10
• Especifique claves primarias para todas las entidades.
• Encuentra las relaciones entre diferentes entidades.
• Encuentra todos los atributos para cada entidad.
• Resuelva las relaciones de muchos a muchos.
• Normalización.

La siguiente figura es un ejemplo de un modelo de datos lógicos.

Aquí comparamos estos tres tipos de modelos de datos. La tabla a continuación


compara las diferentes características:

Característica Conceptual Lógico Física

Nombres de entidades ✓ ✓

Relaciones de entidades ✓ ✓

Atributos ✓

11
Teclas principales ✓ ✓

Foreign Keys ✓ ✓

Nombres de tabla ✓

Nombres de columnas ✓

Tipos de datos de columna ✓

Referencias bibliográficas.
Data Warehouse: Tipos, Arquitectura y Características. (s. f.). Tecnologias-

Informacion. Recuperado 24 de enero de 2022, de https://www.tecnologias-

informacion.com/datawarehouse.html#:%7E:text=%C2%BFQu%C3%A9%2

0es%20un%20Data%20Warehouse,un%20sistema%20gigante%20de%20c

omputadoras.

Indicador Clave –. (2008, 12 junio). Josep Curto. Recuperado 24 de enero de 2022,

de http://josepcurto.com/tag/indicador-clave/

Modelos de datos: Modelo Conceptual, Físico y Lógico. (s. f.). Tecnologías-

Información. Recuperado 24 de enero de 2022, de https://www.tecnologias-

informacion.com/modelos-datos.html

Vergara, A. (2016, 26 julio). SQL vs NoSQL ¿Cuál debo usar? Tech blog for

developers | Facilcloud. Recuperado 24 de enero de 2022, de

https://www.facilcloud.com/noticias/sql-vs-nosql-which-one-should-i-use/

12

También podría gustarte