Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Objetivos Unidad 3
Tras realizar esta unidad podrás:
La tecnología y el acceso universal a la información son dos aspectos que llegaron para quedarse, en esta
era y también en las que siguen. Y las empresas no pueden dar un paso al costado ¡O quedarán obsoletas!
Con la fiebre por la automatización y la inteligencia de negocios, el mundo empresarial se ha visto impulsado a
desarrollar su tecnología con el fin de optimizar sus procesos.
Pensemos que en la actualidad existen más de 2.600 millones de smartphones en todo el mundo, y ese número
continúa creciendo. Esto quiere decir que las personas que conforman una empresa tienen en sus bolsillos una
herramienta con un gran potencial.
Y los números lo confirman. El 71% de los empleados en una empresa utilizan dispositivos móviles, y estos
invierten más de dos horas a la semana en acceder a la información de la compañía desde estos dispositivos.
Gracias a esta nueva forma de interactuar te tenemos una excelente noticia: las
empresas ganan 240 horas de tiempo de producción, lo que significa que es muy
necesario que tu software BI se adapte a los cambios de actitud de la empresa
respecto a las tecnologías móviles.
Además, se calcula que en 2020 más del 40% de las tareas de ciencias de datos o Business Intelligence serán
automáticas, aquello tendrá como resultado una mayor productividad y un mayor uso por parte de los “científicos
de datos civiles”.
Con toda esta información ¿estás preparada o preparado para sumarte a este cambio tecnológico?
En esta Unidad te guiaremos para que te sumerjas en el uso de distintos software de BI y su conocimiento tanto
teórico como técnico, con un taller que consta de videos tutoriales que te ayudarán a implementar tus
aprendizajes sobre Business Intelligence en tu contexto laboral, para que así logres aportar en los grandes
cambios tecnológicos que mejorarán la productividad de tu empresa.
Entonces ¡Comencemos!
Business Intelligence
El siguiente proceso corresponde al ETL (Extracción, transformación y carga), lo que implica la extracción de
datos desde diferentes fuentes, su transformación en un lenguaje unificado y la carga a una nueva base de datos
para su visualización.
En nuestro ejemplo este proceso se vería representado en la planta de tratamiento de aguas, donde se hace la
extracción de las piedras e insectos del agua y ésta se carga en un nuevo curso para la distribución al consumo
humano.
Desliza el mouse por cada una de las imágenes para visualizar el contenido.
A todas estas fuentes sistémicas de datos las llamaremos sistemas operacionales, ya que, como su nombre lo
indica, provienen de sistemas que permiten la operación del negocio.
Pero esto no siempre es tan fácil, ya que las fuentes de datos no son solamente datos esquematizados, sino que
también pueden corresponder a, por ejemplo, planillas de cálculo provistas por una persona, a correos
electrónicos o un archivo de texto con información relevante para elaborar un reporte.
Por ello, cualquier medio de información puede ser considerado como una fuente de datos. A todo este
proceso de obtención de datos desde diferentes fuentes se le llama “Extracción”, que corresponde a la
identificación del sistema y de los datos que se almacenarán en una nueva base de datos.
Esto significa que en nuestro trabajo de Business Intelligence, después de obtener los datos desde los
sistemas operacionales, tengamos que “unificar” la información para que quede guardada en una nueva
base de datos.
Business Intelligence
Esta información, quedará como nueva, ya que estará guardada en un sólo “lenguaje” orientado al
mejoramiento en la generación de reportes”. Entonces, tal como el agua potable que sale de nuestras llaves
luego de un largo proceso, el producto de nuestro trabajo será una transformación. Y justamente es así como se
llama este proceso.
Finalmente, todos estos datos son cargados a una base de datos diferente a la de los sistemas operacionales y
data en general, que tiene la información unificada y transformada para poder ser entendida por el sistema de
reportes (visualización). Este proceso recibe el nombre de “Carga”.
En la siguiente infografía podrás ver de forma gráfica cómo funciona este proceso tan importante para lograr tener
una buena y verídica base de datos que nos permite continuar avanzando en el proceso del Business Intelligence.
Es momento de practicar
Te invitamos a descargar esta planilla Excel con una fuente de datos de ventas simulada de una empresa ficticia.
El llamado es a que la observes y la estudies, ya que este documento lo utilizarás más adelante para las
actividades del taller de esta Unidad.
Además, te recomendamos que comiences a buscar otro documento similar en tu ámbito laboral para que puedas
utilizarlo y te familiarices con el trabajo de Business Intelligence de tu empresa mientras practicas con nosotros.
Comparte tu experiencia
¿Cómo funcionan los sistemas y fuentes de datos en tu empresa? ¿Crees que al momento de realizar el primer
paso en el proceso de BI tendrás desafíos? ¿Cómo crees que se podrían solucionar estos retos?
Business Intelligence
La era paleolítica fue un periodo de la historia de la humanidad que se inició hace 2,85 millones de años y se
caracterizó por el desarrollo de las sociedades cazadoras recolectoras, que viajaban de un lugar a otro buscando
alimento y protección.
Estas tribus, durante los climas templados salían a recorrer el territorio extrayendo alimentos de la vegetación
salvaje y cazando animales, que les servían de alimento y abrigo. Estos elementos eran utilizados por las tribus,
pero también eran guardados, ya que los utilizaban en las temporadas frías para alimentarse en periodos de
escasez.
Los investigadores han descubierto que los cazadores y recolectores se dedicaban con gran preocupación al
almacenamiento, y aprendieron que existían diversos frutos que podían conservarse sin perder sus propiedades
para entregarle energía a las tribus. Así, eran muy comunes los frutos secos como nueces o castañas, los que se
convirtieron en la reserva de emergencia de nuestros antepasados.
Esto, ya que en sus primeras etapas, al momento de extraer la información, es muy importante guardarla en
poderosas bases de datos para generar un espacio de fácil acceso ante cualquier necesidad futura de
información.
Lo que para los cazadores recolectores eran nueces y castañas, para nosotros son datos que protegemos para
poder utilizar cuando los necesitemos.
El Data Warehouse
Las bases de datos son el tercer paso del proceso de Business Intelligence. Recordemos en la siguiente infografía
el lugar que ocupa el Data Wareouse en el proceso de la construcción de Inteligencia de Negocios.
Business Intelligence
¿Recuerdas qué es el Data Warehouse? Exactamente, consiste en una base de datos. Y este sistema, tal como
hacían los cazadores recolectores, consiste en la recolección de datos, los que luego son guardados para que
pueda accederse a ellos de manera fácil y eficiente.
Así, un Data Warehouse es un repositorio unificado para todos los datos que recogen los sistemas de una
empresa. Este puede ser físico o lógico y busca la captura de datos desde diversas fuentes ya sea para fines
analíticos como de acceso.
Esta arquitectura de almacenamiento de datos, permite organizar, comprender y utilizar la información para
tomar decisiones estratégicas en el proceso del Business Intelligence.
SQL Server 2019 incorpora características innovadoras de seguridad y cumplimiento, rendimiento líder del
sector, alta disponibilidad para tus cargas de trabajo críticas y análisis avanzados en todas tus cargas de
trabajo de datos, y ofrece compatibilidad con big data.
Oracle Database es un sistema de gestión de base de datos de tipo objeto-relacional (ORDBMS, por el
acrónimo en inglés de Object-Relational Data Base Management System), desarrollado por Oracle
Corporation.
MySQL
MySQL es la base de datos de código abierto más popular del mundo. Por su rendimiento, confiabilidad y
facilidad de uso comprobados, MySQL se ha convertido en la opción de base de datos líder para
aplicaciones basadas en la web ya que es utilizada por propiedades web de alto perfil como Facebook,
Twitter, YouTube y los cinco sitios web más importantes*. Además, es una opción extremadamente popular
como base de datos integrada y es distribuida por miles de ISV y OEM.
Business Intelligence
2. El Administrador:
El administrador de la Base de Datos es el corazón humano de este proceso, ya que es el software que nos
permite interactuar con el motor, visualizar los datos, realizar consultas (queries) y crear funciones de
programación y mantenimiento.
Por esa misma razón, un sistema de bases de datos es capaz de manejar múltiples bases, con muchos datos
cada una y debe cumplir todo lo que le pide el administrador.
Por ejemplo, un servidor de bases de datos debe manejar millones de consultas, desde cientos de usuarios
diferentes, a miles de bases de datos distintas, e incluso desde variados sistemas operacionales.
¡Es un enorme trabajo!
Pero no siempre es así. Porque por lo general, cada sistema operacional contiene una base de datos propia,
donde almacena la información de cada transacción realizada, usuarios conectados, clientes, proveedores,
relaciones entre ellos, etc.
Por eso la configuración de una base de datos varía en razón de la complejidad del sistema operacional que
la necesite.
Conociendo estos dos aspectos del Data Warehouse, y su relevancia en torno a las funcionalidades y
capacidades de cada uno, estaremos preparados para crear nuestro propio sistema de almacenamiento. ¿Estás
preparada(o)?
Para descargar la base de datos ingresa a www.mysql.com y sigue las instrucciones que te damos en el taller de
esta Unidad, en el video llamado “Descarga Mysql”.
Para apoyarte en esta etapa te recomendamos leer el material de profundización “Las 3 formas normales de
Fred Coulson”, que explica de manera muy educativa cómo se crea una base de datos, con el objetivo que sea
consistente y eficiente. Es un material muy ilustrativo y que te ayudará a complementar tus conocimientos sobre
bases de datos, que escapan al alcance del contenido de este curso.
¡Mucha suerte!
Comparte tu experiencia
¿Cuál es la importancia del almacenamiento de datos en tu empresa? ¿Crees que puede solucionar problemas
que se viven diariamente en la organización?
Business Intelligence
Data Warehouse significa "Base de Datos". Es donde se almacena la información relevante y su objetivo es
“aliviar” la carga de los sistemas operacionales. Es decir, un Data Warehouse es, literalmente, una Bodega de
Datos.
Veamos un ejemplo de la importancia que tiene esta bodega de datos para aliviar los sistemas operacionales:
Desde diferentes usuarios, con muchas sucursales y diferentes módulos del ERP (contabilidad, finanzas, ventas,
facturación, cobranzas, etc).
Y todo esto recae sobre una base de datos del sistema ERP
Business Intelligence
Si a esto sumamos otra gran cantidad de usuarios que quieren obtener reportes de esta base de datos,
Se puede provocar la caída del sistema o su ralentización, haciendo que toda la organización funcione más lenta,
provocando ineficiencias y frustración en los usuarios del sistema. Un verdadero dolor de cabeza.
Por lo tanto, necesitamos un servidor que guarde esta información (no todo el ERP) para consultas de reportes
posteriores.
Asimismo, la base de datos nos servirá para consolidar información cuando viene de sistemas diferentes.
De esta forma, si necesitamos unificar información desde un ERP, un CRM o algún otro sistema, es bueno reunir
esta información previamente y guardarla en un Data Warehouse con un buen servidor, para después
consultarla, ya que de lo contrario, conseguir un reporte que saque datos desde todos los sistemas operacionales
al mismo tiempo, se hace técnicamente muy complejo.
Así, tanto los reportes como los sistemas operacionales funcionarán de mejor forma.
transacciones de su propia explotación) hasta nuestro almacén de datos, que será consultado al día siguiente.
Así no tendrás mayores problemas.
Es momento de practicar
Ahora que ya tenemos las nociones básicas acerca de una base datos y que hemos podido descargar e instalar
nuestro motor de base de datos, te invitamos a diseñar nuestro Data Warehouse en la sección de Taller de la
Unidad 3 y con el título “Creación de tu base de datos”.
¡Manos a la obra!
Comparte tu experiencia
¿Qué desafíos has experimentado durante este proceso? ¿Cómo has podido resolverlos?
Business Intelligence
13
Business Intelligence
Piensa en tu cocina, e imagina que llegas con muchas bolsas de tus compras desde el mercado. Cuando
guardas tus alimentos, le dedicas un lugar especial a cada tipo de comida, ¿verdad? Por ejemplo, los
carbohidratos van en la alacena, las carnes en el congelador, las frutas en un canasto, etc. ¿Y por qué lo haces?
Porque necesitas que cada alimento esté en buenas condiciones cuando los necesites y para ellos debes cuidar
cada tipo de necesidad especial de conservación. Al menos esa es la lógica más básica.
Esta misma idea es la que usamos cuando hablamos de los Data marts o cubos de información, ya
que organizamos esta gran cantidad de datos (o alimentos según el ejemplo) en distintas categorías. Y la idea
es que cumplan una funcionalidad específica, de acuerdo a las necesidades de la organización.
Por eso, a diferencia de lo que ocurre con las bases de datos, que son grandes cantidades de información
procedente de muchos centros de datos, los Data marts son unidades mucho más pequeñas y organizadas.
Business Intelligence
Desliza el mouse por cada una de las imágenes para visualizar el contenido.
Así como vemos, los datos se agrupan en categorías útiles y fáciles de utilizar para cada área de la empresa.
Ahora, ¿sabes cuál es la diferencia entre un Warehouse y un Data marts?
La principal diferencia, y esto es muy importante, es que los Data marts son consultados directamente por los
usuarios, mientras que un Warehouse es solamente la fuente de alimentación de datos para Data marts.
A continuación veamos el proceso del Data marts desde su división en el Warehouse hasta la llegada a los
usuarios.
Business Intelligence
Imaginemos que en nuestra empresa, debemos crear un Data mart para el área de ventas.
Antes de insertarnos en el mundo de los programas y software, debemos pensar qué tipo de información
necesitamos recopilar en el cubo de información de ventas. Para ello usaremos los objetivos estratégicos
planteados en el Balanced Scorecard (BSC).
Business Intelligence
Por lo general los objetivos y metas de estas áreas, se relacionan con las perspectivas financieras y de clientes.
Entonces, los datos que necesitamos entregarle a los usuarios de esta sección, deben estar alineados con el
cumplimiento de estos objetivos.
¿Qué tipo de información utilizarías en este Data mart para ayudar al área de ventas? Una buena forma de
entregar datos útiles, puede ser a través de la clasificación de las ventas. Por ejemplo, por región, barrio, grupo de
ventas y por vendedor.
Ahora, imagina que ya creaste el Data mart y que un usuario generó su primer reporte para la gerencia de ventas.
Con la información obtenida, la o el Gerente podrá tener una visión amplia de las ventas totales de su gerencia. Y
también podrá ver detalles, como por ejemplo, en qué regiones tiene bajas ventas.
Business Intelligence
Si encuentra una disminución de las ventas en una región en particular, podrá revisar los barrios de esa región y,
finalmente, dentro de los barrios con menor performance, podrá analizar qué grupo o qué vendedor está bajo su
expectativa de cumplimiento.
Como vemos, el Data mart ayuda enormemente a que el proceso de Business Intelligence sea mucho más
efectivo, ya que estos datos dejarán de ser números sin significado y se transformarán en información acerca de
qué parte de cada gerencia está funcionando bien o mal, y así se podrán tomar acciones que le permitan cumplir
con el objetivo estratégico final. ¡Es toda una evolución!
Y esto no termina en el reporte final, ya que los objetivos estratégicos tienen metas, las que nos guiarán para
saber si los resultados de nuestro trabajo son acordes o no, a lo que hemos planificado.
Comparte tu experiencia
Te invitamos a aplicar estos conocimientos a tu contexto laboral. Clasifica cada área de tu empresa y determina
qué tipo de Data marts sería útil para cada una. ¿Cómo crees que este proceso beneficiaría a tu empresa?
Business Intelligence
Es increíble el uso que se da en el mundo laboral a las planillas. Hay una grilla para todo, desde la planificación
del trabajo personal hasta el control de grandes empresas y sus finanzas. ¿Tú también las usas a diario?
Como bien sabemos, el uso de esta forma de registro es realmente muy necesaria para ordenar la información, y
por ende su función es muy utilizada en el Business Intelligence.
En este artículo revisaremos la importancia que tienen las planillas o Tablas de Hechos en la construcción de un
Data mart y los distintos modelos en que puede ser representada según las necesidades de la empresa y las
características de los datos a registrar.
Recordemos que los Data marts son cubos de información que categorizamos a partir del Data Warehouse y que
servirán para el uso específico de las diferentes áreas de una empresa.
Entonces, una Tabla de Hechos es una estructura que nos permite organizar la información de tal forma
que sea mucho más fácil de visualizar y encontrar.
Esta planilla, nos mostrará acciones realizadas bajo ciertos criterios, (en el caso de ventas puede mostrar
sucursales, equipos, zonas, supervisores, etc.) y pueden estructurarse de diferentes formas, lo que explicaremos
más adelante.
Ahora ¿recuerdas la planilla que descargaste en el primer artículo de esta unidad? Bueno, llegó el momento de
que la abras y analicemos juntos esta Tabla de Hechos.
Business Intelligence
En esta imagen vemos que la Tabla de Hechos representa las ventas realizadas de acuerdo a ciertos criterios,
destinados a cumplir el objetivo estratégico de la compañía. Como por ejemplo: Sucursal, Equipo, Zona, etc.
Pero ¿sabes cómo diseñar estos criterios? A continuación te lo enseñaremos.
Medida
Es la cantidad que queremos medir. En el caso del ejemplo del área de ventas, las medidas son las cantidades
vendidas, que al mezclarlas con el precio, nos entregan el monto de ventas.
Business Intelligence
Dimensión
Es el punto de vista con el que se quiere analizar las ventas. Volviendo al ejemplo, las dimensiones son fecha,
sucursal, equipo, zona, etc.
Debes tener en cuenta que las medidas siempre representarán un valor numérico, mientras que las
dimensiones, mostrarán los criterios de ordenamiento o de visión, los que pueden ser temporales o de otro
tipo.
En el caso de nuestro ejemplo, las dimensiones tienen fecha, pero a partir de ese dato se puede obtener
información de semana, mes, trimestre, año y otros.
1. La Estrella:
Este modelo nos permite visualizar una menor cantidad de información y organizarla de manera segmentada,
por dimensiones. Aquello resulta muy útil ya que nos permite tener una visión total de la Tabla y la información
que nos muestra, pero también se puede acceder a información mucho más específica de forma anexa.
Pensando en el ejemplo de nuestra empresa ficticia, en el Área de Ventas, el modelo de “La Estrella” se puede ver
representado de la siguiente forma:
Business Intelligence
Estas dimensiones nos ayudarán a tener una visión mucho más amplia de toda la información disponible
en el sistema. Y nos darán la posibilidad de especificar de forma anexa cada sector.
Así, en nuestro ejemplo para el área de ventas, podemos construir una planilla a partir de las siguientes
dimensiones del modelo “La Estrella”:
Ahora te preguntarás ¿por qué algunas columnas poseen números en vez del nombre de la sucursal?
Esto ocurre, ya que para tener una visualización más amplia de la información general, se anexan
planillas con información específica a través de esos códigos o IDs, donde hay tablas independientes.
Entonces, por ejemplo, los códigos de sucursal, equipo y zona quedarán guardados en tablas independientes, tal
como se ve en la siguiente tabla:
Así, el esquema “La Estrella” contendrá menos información y quedará guardado como una tabla más liviana, con
referencias a tablas auxiliares con los datos que se repiten constantemente. ¡Simplificar será nuestro mantra
desde hoy!
Cabe destacar que se puede hacer exactamente lo mismo con los supervisores y los vendedores. La ventaja es
que esta configuración es muy rápida para consultas a las bases de datos, y puede recargarse con facilidad si es
que tiene mucho texto repetido en su configuración.
¿Crees que este tipo de estructura te ayudará al momento de construir la Tabla de Hechos en tu contexto laboral?
Business Intelligence
2. El Copo de Nieve:
A la segunda configuración la llamaremos “Copo de Nieve”. Esta es un poco más compleja que la anterior, ya que
su objetivo es ser más detallada.
El “Copo de nieve”, no sólo separa en dimensiones un área, sino que también busca normar la relación entre
ciertas categorías, a través de una jerarquía o de relaciones horizontales.
Sin embargo, tiene como desventaja que cuando el esquema es muy complejo y hay muchos datos, el sistema
puede colapsar y demostrar problemas de rendimiento.
No te angusties si crees que es un modelo muy complejo de desarrollar, porque para el caso de nuestro Data
mart, utilizaremos el esquema Estrella, por la simplicidad de nuestros datos y su poca cantidad.
Pero si quedaste con la curiosidad sobre el modelo “Copo de Nieve” te dejamos un video tutorial, en el que
podrás profundizar sobre su uso e importancia.
Podemos concluir entonces, que las Tablas de Hechos nos permiten organizar la información de forma fácil y
práctica, para así optimizar el trabajo de búsqueda de datos por parte de los usuarios de cada área. Gracias a su
estructura y los modelos que podemos utilizar, será mucho más simple el diseño de la configuración de estas
planillas. El desafío está saber definir de forma adecuada cuáles serán las dimensiones necesarias para cada
sector de la empresa.
Business Intelligence
Es momento de practicar
Ahora que tienes los conocimientos necesarios para la construcción de un Data Warehouse, un Data mart y una
Tabla de Hechos, te invitamos a aplicar tu aprendizaje en el taller de esta Unidad. Allí podrás instalar el Software
MySQL y Pentaho, para la creación de tus propias bases de datos.
Comparte tu experiencia
¿Cuáles serían las dimensiones y el modelo que utilizarías al momento de construir la Inteligencia de Negocios en
tu organización? ¿Consideras que estos mejorarían el manejo de la información de cada área?
Business Intelligence
Resumen y Glosario
Resumen
Cualquier medio de información puede ser considerado como una fuente de datos. Al proceso de
obtención de datos desde diferentes fuentes se le llama “Extracción”, que corresponde a la identificación del
sistema y de los datos que se almacenarán en una nueva base de datos.
Después de obtener los datos desde los sistemas operacionales, se debe “unificar” la información para
que quede guardada en una nueva base de datos, pero en un sólo “lenguaje” orientado al mejoramiento en
la generación de reportes. Este proceso se denomina “Transformación”.
Todos estos datos son cargados a una base de datos diferente a la de los sistemas operacionales y data en
general, que tiene la información unificada y transformada para poder ser entendida por el sistema de
reportes (visualización). A este proceso se le llama “Carga”.
Una base de datos es un sistema de recolección de datos, guardados de forma tal, que puede accederse
a ellos de manera rápida, eficiente y precisa. Es importante recalcar que las bases de datos tienen dos
corazones principales: el Motor de Base de Datos y el administrador.
Para crear un Datamart debemos centrarnos en su objetivo, que es poder apoyar al procesos de toma
de decisiones del área en cuestión.
La tabla de hechos tiene dos componentes, la medida y las dimensiones. Las medidas representarán
siempre el valor numérico y las dimensiones, los criterios de ordenamiento o de visión, y que pueden ser
temporales o de otro tipo.
Las tablas de hechos pueden representarse en dos modelos, según la cantidad de data que manejen: el
modelo estrella y el modelo copo de nieve.
Business Intelligence
Glosario
Motor de base de datos: es el software capaz de manejar la data extraída, dada su magnitud y amplitud. Es
el corazón cibernético de la base de datos. Este motor no es manejable por el usuario, por lo que, para poder
hacerlo, es necesario tener un Administrador de Bases de Datos.
Administrador de base de datos: es el software que nos permite interactuar con el motor, visualizar los
datos, realizar consultas (queries) y funciones de programación y mantenimiento.
Datamart o cubo de información: Un datamart es un subconjunto de un Data Warehouse, que tiene parte de
la información del Data Warehouse corporativo, con algún procesamiento extra, y que permitirá optimizar la
consulta de reportes de los usuarios.