Está en la página 1de 3

Ejercicio de Data Warehouse

Un banco desea crear una base de datos de soporte a la decisión a la hora de conceder
créditos a sus clientes.

Para cada cliente que pide un crédito se va a almacenar la siguiente información:


nombre, apellidos, DNI, sexo, nacionalidad, profesión, estado civil, dirección, teléfono,
número de hijos, tipo de contrato que tiene, sueldo bruto, si tiene casa en propiedad.

La información de la solicitud del crédito contendrá a parte del individuo o empresa que
lo realiza se almacenará el empleado que tramita el préstamo, la fecha de contratación,
la fecha de vencimiento del crédito, el interés aplicado y si el préstamo ha vencido si se
ha devuelto la cantidad pedida o no.

Además el banco almacenará el tipo de crédito y las condiciones de dicho crédito,


además de un identificado.

Además de los datos que almacena el propio banco, también se disponen de unas bases
de datos externas (Mosaic) que son bases de datos con información demográfica.
También dispone de unas “listas negras” publicadas periódicamente por la oficina del
moroso, que contienen la información de aquellas personas que no pagan los créditos
que piden. Adicionalmente el banco encarga a una consultora la realización de una serie
de encuestas.

Con todo ello la dirección desea conocer la siguiente información.

1. Posibilidad de que un cliente que realiza la solicitud de un nuevo crédito no lo


devuelva
2. Tipos de cliente que realizan peticiones de créditos
3. Ante el lanzamiento de un nuevo tipo de crédito, que clientes responderían al
lanzamiento de ese nuevo tipo de préstamo

Describir el diagrama de la arquitectura del data warehouse (todos los niveles)

Se quiere además:
• Para establecer el grado de morosidad, qué tablas seria necesario modificar y/o
añadir. Qué implantaría en la parte de acceso al data warehouse. Sería necesario
modificarlo esta solución o bastará con añadir nuevos datos al data warehoues
• Qué es necesario realizar para poder establecer comparativas por empleado, por
sucursal y por zonas geográficas
• Dado que se dispone de una segmentación externa de clientes (Mosaic), qué es
más fiable, fiarse de esos patrones o fiarse de los patrones obtenidos con los
datos propios del banco
Ejercicio de Data Warehouse
Se desea diseñar el data warehouse de soporte a la decisión para una compañía de
seguros. El tipo de seguros ofertados por esta compañía puede ser: seguro de automóvil,
seguro de vida o seguro del hogar. Cada uno de estos tipos de seguros tiene
características diferentes que será necesario tener en cuenta.
El data warehouse se va a alimentar de dos grandes bases de datos operacionales que
son la base de datos de operaciones sobre pólizas de seguros y la base de datos de
tratamiento de partes de accidentes.
Se quieren analizar tanto las pólizas (sólo se tendrán en cuenta las altas por simplicidad)
como los partes, para poder estudiar qué seguros son los que más beneficios aportan,
perfiles de los compradores, eficiencia de los vendedores de seguros, sucesos
(accidentes) más frecuentes, eficiencia de los peritos etc..
En realidad, los productos que vende la compañía son garantías sobre siniestros
(incendio, robo, inundación, invalidez, ...) que quedan cubiertos. Una póliza agrupa a
una serie de garantías. La póliza se le vende al tomador del seguro un agente de seguros
e interesa saber la fecha en la que una póliza se da de alta.
Tanto el objeto asegurado como las garantías, quedan claramente identificados en cada
póliza. De esta manera, por ejemplo en un seguro de vivienda el asegurado es la
vivienda y se tienen que saber los daños contratados (robo, inundación, incendio,...) así
como el valor de la casa asegurada, en un seguro de vida, hay un asegurado (una
persona que no tiene por que ser la tomadora del seguro), unas garantías (invalidez total
o parcial, fallecimiento, asistencia sanitaria). En cualquier caso siempre se tiene una
suma garantizada en caso de que el siniestro asegurado ocurriera sobre el objeto
asegurado.
Una vez que todas las garantías para un determinado asegurado han quedado claramente
fijadas se establece la prima a pagar en la póliza.
Después de que se ha creado la póliza es posible que en algún momento se den partes de
accidentes. La naturaleza del parte de accidente nuevamente depende del objeto
asegurado y de las garantías aseguradas.
Antes de realizar los pagos, la compañía manda a un perito a que se evalúen los daños.
La persona que realiza el parte de accidente no tiene porqué ser quien reciba el dinero
del seguro puesto que el daño se le ha podido realizar a un tercero. En cualquier caso, a
la compañía le interesa saber qué cantidad se pagó finalmente sobre cada objeto
asegurado por la póliza contra la cual se está realizando el parte de accidentes y la fecha
de apertura del parte. Es importante conocer las fechas de apertura de los partes, el
perito, el tomador del seguro y el receptor la póliza así como las cantidades cobradas
sobre cada objeto asegurado de cara a poder establecer posibles fuentes de fraudes.
Se pide:
1. Realizar el (los) diagrama(s) en estrella correspondiente(s) al data warehouse propuesto.
Especifique en el diagrama los atributos de las tablas de hechos y de dimensión.
2. Establezca la estrategia de data mining a seguir para resolver las siguientes
preguntas ( en cada caso establézcanse los pasos y el algoritmo de data mining
más adecuado en cada caso (siempre que sea necesario) :

♦ Perfiles de los clientes de la compañía


♦ Comparativa del número de pólizas creadas en los distintos trimestres del año.
♦ Comparativa del número de partes de accidentes por cuatrimestres, semestres,
estaciones del año según los distintos tipos de seguros
♦ Perfiles de los clientes de la compañía según los distintos tipos de seguros
ofertados
♦ Opciones que más frecuentemente contratan los tomadores de seguros en sus
pólizas
♦ Valor potencial de un nuevo cliente

3. ¿Con qué detalle se tendrán que almacenar las fechas en este data
warehouse?.¿Es necesario en este caso establecer una jerarquía sobre la
dimensión fecha? En caso afirmativo diga cual y en cualquier caso justifique su
respuesta
4. ¿Sería necesario la creación de tablas de agregados? En caso afirmativo diga
cuales y justifique su respuesta. (0,5 ptos)