Está en la página 1de 6

CASO PRÁCTICO

BUSINESS INTELLIGENCE Y GESTION DOCUMENTAL

Lina Yineth Yara Triana

UNIVERSIDAD INTERNACIONAL IBEROAMERICANA

MASTER INTERNACIONAL EN ADMINISTRACION Y DIRECCION DE EMPRESAS

30 de enero de 2020
CASO PRÁCTICO
“CASO ARAUCANIA S.A.”

Lea y analice el caso práctico que encontrará a continuación y responda las siguientes
interrogantes atendiendo al modelo presentado anteriormente:

1. ¿Cuáles fueron las acciones realizadas por el equipo de trabajo para cumplir el
primer paso de la metodología CRIS-DM?

El primer paso de la metodología CRIS-DM corresponde a la Comprensión del


Negocio para lo cual se realizaron reuniones con la Gerencia de Clientes y
conocieron los hallazgos de la oficina de fraudes los cuales son detectados con
visitas directamente a los sitios donde se encuentran los medidores.

El equipo de trabajo ha recibido de Aguas Araucania la necesidad obtener


indicadores de consumo para su análisis, incluyendo en él tiempo, ubicación y
características; es fundamental también que la solución que se ofrezca permita un
análisis visual, matemático con entrega de reportes.

2. ¿Cuáles fueron las acciones realizadas por el equipo de trabajo para


comprender la naturaleza de los datos involucrados en el negocio?

Se analizó el modelo de base de datos relacional del sistema de información,


específicamente de aquellas empresas que tienen relación con el proceso de
facturación ya que allí se encuentra el detalle del consumo mensual de cada cliente
de los servicios de agua y alcantarillado; para el entendimiento y unificación de
conceptos de los datos, se realizaron reuniones con personal especialista, para
revisar la documentación existente de la base de datos, sus atributos
3. Explique el proceso utilizado para acometer la preparación de los datos en la
organización.

En primera medida, se diseñó un Almacén de datos (AD), la cual es alimentada con

los datos extraídos a través del proceso ETL de las bases de datos transaccionales.

Esta información queda almacenada en un repositorio que representa la información

en un esquema de estrella; la tabla de hechos muestra los indicadores a medir y los

criterios de análisis a utilizar.

Como parte del análisis de datos, se ha utilizado un Data Mart, que contiene
información de consumos y alcantarillado por región, unidades consumidas en
metros cuadrados facturados de agua potable y alcantarillado, aumentos en el
consumo y un contador de consumos facturados; los datos almacenados fueron
organizados de tal forma que permitiera mostrar: Lugar (localidad con el subsector
y ruta), Servicio (tipo de servicio prestado), Tiempo (fundamental para trazas lo
que ha ocurrido, pero también para realizar proyecciones), Tabla de hechos de venta
(indicadores a consultar)

4. Mencione qué etapa le sigue a la preparación de los datos y de qué modo fue
realizada por el equipo de trabajo.

El cuarto paso de la metodología CRIS-DM es el Modelado de la información;


se aplicó el modelo Clementine que genera grupos homólogos para la detección de
anomalías, presentando cantidad de registros procesados, anomalías encontradas y los
campos escogidos para el estudio.
Para este análisis se ha seleccionado el 4% de los registros de la localidad de
Lautaro, alojados en el Data Mart.

El modelo Clementine es muy sensible a los cambios en los parámetros de


configuración, ya que podría alterar el número de grupos y sus resultados; por tanto es
una tarea clave que requiere una definición especial y su validación con relación a los
resultados que arroja por lo que el equipo de trabajo incorporó pruebas preliminares.

5. ¿Cuáles fueron los algoritmos utilizados?

Se aplicaron 3 algoritmos:

- El COBWEB, es un algoritmo jerárquico que utiliza aprendizaje incremental,

realizando agrupaciones instancia a instancia, formando un árbol de

clasificación. Para este caso, COBWEB proporcionó 74 clúster

- K-MEANS, utiliza la participación de la base de datos, creando grupos, cada

uno con un centro. Para este caso, se utilizó un incide de anomalías de 0,5, 1 y

2; el porcentaje de registros que posiblemente sean un fraude no fue superior al

55%.

- EM, es un algoritmo que utiliza clustering probabilístico; se aplicó una cantidad

máxima de iteraciones de 100 arrojó como resultado que el 73% de los registros

anómalos podrían ser un fraude.

K-MEANS y EM proporcionaron 10 clúster.


6. ¿De qué forma se logró garantizar la fase de evaluación en el proyecto?

Los resultados fueron obtenidos con base en los algoritmos aplicados para la

detección de anomalías de Clementine, en los datos almacenados en el Data

Mart.

Estos resultados, que corresponden a registros anómalos, fueron comparados con


la información histórica de fraude de la empresa, para confirmar que los datos
sean correctos.

7. Explique brevemente la fase de implementación del proyecto.

Ya teniendo seguridad de los datos del sistema de detección de anomalías, Aguas

Araucania implementa en el servidor de la empresa, para obtener la información de

clientes que podrían ser casos de fraude, con el fin de realizar la visita de

comprobación física.

Este sistema creado con la metodología CRIS-DM, facilidad a Aguas Araucania el contar

con una lista de clientes que presentan comportamientos anómalos en sus consumos,

dando la posibilidad de detectar posibles fraudes en forma oportuna, lo que implica

un trabajo más efectivo, impactando positivamente en la reducción del tiempos de

búsqueda y los costos asociados a esta actividad, redundando en mejores resultados

financieros para la empresa.


BIBLIOGRAFÍA – WEBGRAFIA

Cuevas, S. S. (2009). www.semanticscholar.org. Obtenido de


www.semanticscholar.org
Román, J. V. (Agosto de 2016). Singular. Obtenido de
https://www.sngular.com/es/data-science-crisp-dm-metodologia/