Está en la página 1de 23

UNIVERSIDAD PRIVADA ANTENOR ORREGO

FACULTAD DE INGENIERA

ESCUELA PROFESIONAL DE INGENIERA DE COMPUTACIN Y SISTEMAS

PLAN DE TRABAJO DE SUFICIENCIA PROFESIONAL PARA OBTENER TTULO DE INGENIERO DE COMPUTACIN Y SISTEMAS, MEDIANTE LA MODALIDAD DE TITULACIN EXTRAORDINARIA 2011-10

IMPLEMENTACION DE UN DATAMART DE CREDITOS DESEMBOLSADOS PARA LA EMPRESA MI BANCO USANDO LA METODOLOGIA KIMBALL Y LA HERRAMIENTA SQL SERVER 2008

AUTOR(ES): Bach. Espinoza Ninaquispe, Ellwin Bach. Gutirrez Ortiz Erika ASESOR: Ing. Heber Abanto Cabrera TRUJILLO PER 2011

PLAN DEL TRABAJO


1. Ttulo:

IMPLEMENTACION DE UN DATAMART DE CREDITOS DESEMBOLSADOS PARA LA EMPRESA MI BANCO USANDO LA METODOLOGIA KIMBALL Y LA HERRAMIENTA SQL SERVER 2008 2. Autor(es):

Bach. Espinoza Ninaquispe Ellwin Bach. Gutirrez Ortiz Erika. 3. Asesor:

Ing. Heber Abanto Cabrera 4. 5. Cronograma de Actividades: Presupuesto:

a).- Recursos Humanos:

Investigadores Gutirrez Ortiz Erika. Espinoza Ninaquispe Ellwin Heber Abanto Cabrera TOTAL

Recursos Humanos Costo Mano de Tiempo (Meses) Obra 1000.00 1000.00 4 4

Costo (S/.) 4000.00 4000.00

200.00

800.00 S/.8800.00

b).- Bienes: materiales, equipos, software BIENES Materiales Lapicero tinta liquida S/80.00 Cartucho de Tinta S/10 .00 Folder manila 20 unidades S/. 26.00 Papel Bond A-4, S/ .50.00 CD DVD S/ .100.00 Memoria USB 4 GB S/. 5.00 Cable crossover S/150.00 Otros Materiales S/.426 TOTAL Laptop Intel Corel i7 Disco Duro de 500GB, Memoria RAM 8GB Laptop Intel Corel 2 Duo Disco Duro de 320GB, Memoria RAM 4GB Memoria Grabador audio Sony de 2 Gb. Impresora Canon PIXMA 270 Tinta Canon 270 Computadora PIV procesador 1.85GHZ TOTAL MS Windows 7 Ultimate COSTO MENSUAL S/. 5.00

Equipos

S/4000 S/3000 S/. 179.00 S/. 299.00 S/. 50.00 S/. 1200 S/.8728 S/. 250.00

Microsoft Office 2007

S/. 379.00

Ms Project 2007 Software Licencia Servidor SharePoint Licencia SQL Server 2008 TOTAL Internet ( Speedy 1Mb) Transporte urbano Servicios Copias Anillado TOTAL

S/. 379.00 S/.3600 S/.3300

S/.7,908.00
S/.100.00 S/.150.00 S/.50.00 S/.10.00

S/. 310.0

D) Presupuesto Total PRESUPUESTO TOTAL GENERAL CATEGORA Recursos Humanos Materiales Equipo Software Servicios TOTAL: COSTO TOTAL S/.8800.00 S/.426.00 S/.8728.00 S/. 7,908.00 S/. 310.00 S/. 26,172.00

5. Descripcin General del Trabajo de Habilitacin 5.1. rea Temtica MIBANCO es el primer banco privado comercial especializado en microfinanzas, en el Per. Por ende es importante que Business Intelligence sea no solo un concepto en la empresa sino parte de cualquier proceso en la toma de decisiones, por ende el motivo del trabajo es proponer a dicha entidad financiera la creacin de un Datamart el cual contiene muchas ventajas para el anlisis de la informacin y la flexibilidad de convinar diversos resultados. El Business Intelligence, surge a inicios de los noventa, como una forma de proveer a los usuarios, un mejor acceso a la informacin, que apoye la toma de decisiones. Su objetivo principal era el de proveer a los analistas una herramienta que les permitiera concentrarse

en la toma de decisiones, con rapidez y seguridad, lo cual ofrece una ventaja competitiva a la empresa y la acerca al cumplimiento de los objetivos. Actualmente Inteligencia Empresarial (BI) o Business Intelligence se define como la plataforma compuesta por productos y tecnologas diseadas para apoyar a los departamentos de TI y a los usuarios de negocio en la toma de decisiones empresariales. Encontrar el listado completo de soluciones en Inteligencia Empresarial de Microsoft aqu. Los productos y tecnologas en inteligencia empresarial se disearon para interoperar de manera ptima desde el primer momento, contribuyendo cada producto y tecnologa a tomar mejores decisiones empresariales.

5.2. Realidad Problemtica La empresa mi banco , presenta la siguiente realidad problemtica:


requiere.

La empresa no puede tomar decisiones diarias sobre los crditos

desembolsados, Es muy lento el procesamiento de reportes relacionados con sus

clientes, asesores y productos, adems no hay informacin exacta de lo que se Inconsistencia en reportes sobre montos desembolsados. La gerencia del negocio y jefes territoriales usan mas su tiempo en

de sistemas.

generar reportes que en tomar decisiones, pues es muy lenta la ayuda del rea

Aportes del trabajo El presente trabajo contribuir a: Generar informacin de crditos desembolsados y cancelados en Brindar un anlisis multidimensional, explotando la informacin de

forma eficiente. las dimensiones.

Brindar informacin diaria y mensual y que se puede mirar hacia Brindar Informacin para los usuarios segn sean sus roles.

atrs para ver la evolucin de los crditos desembolsados .

Enunciado del problema

Cmo mejorar la toma de decisiones usando tecnologa de informacin? 7. Objetivos del Trabajo de Habilitacin 7.1. Objetivo General Implementar un datamart de crditos desembolsados y cancelados para la caja trujillo que sirva de apoyo y soporte estratgico para el rea de negocios usando el motor de base de datos sql server 2008 y la metodologa kimball. 7.2. Objetivos Especficos Definir los requerimientos del proceso seleccionado (modulo de crditos) Analizar los requerimientos del negocio y las herramientas a utilizar. Disear el modelo del datamart y los formatos de los reportes.

Implementar el datamart y los reportes en el tiempo establecido.

8. Fundamento Terico
8.1.Temtica 8.1.1.Business Intelligence El tema de este proyecto se encuentra en Business Intelligence, est dirigido al rea de gestin de la informacin. Actualmente la capacidad para tomar decisiones de negocio precisas y de forma rpida se ha convertido en una de las claves para que una empresa llegue al xito. Sin embargo, los sistemas de informacin tradicionales (como la mayora de los programas de gestin, las aplicaciones a medida, e incluso los ERP ms sofisticados), suelen presentar una estructura muy inflexible para este fin. Aunque su diseo se adapta con mayor o menor medida para manejar los datos de la empresa, no permite obtener la informacin de los mismos, y mucho menos extrapolar el conocimiento almacenado en el da a da de las bases de datos Las principales caractersticas que limitan estos sistemas son: Gran rigidez a la hora de extraer datos, de manera que el usuario tiene que ceirse a los informes predefinidos que se configuraron en el momento de la implantacin, y que no siempre responden a sus dudas reales. Necesidad de conocimientos tcnicos. Para la generacin de nuevos informes o mtricas suele resultar ineludible acudir al departamento tcnico, solicitando una consulta adecuada para interrogar la base de datos. Largos tiempos de respuesta, ya que las consultas complejas de datos suelen implicar la unin de tablas operacionales de gran tamao, lo que se traduce en una incmoda espera que dificulta la fluidez del trabajo. Deterioro en el rendimiento del SI. Cuando la base de datos consultada, para generar informes o ratios de negocio, es la misma que la que soporta el operativo de la empresa, el funcionamiento del sistema puede degradarse hasta afectar y paralizar a todos los usuarios conectados.

Falta de integracin que implica islas de datos. Muchas organizaciones disponen de mltiples sistemas de informacin, incorporados en momentos distintos, para resolver problemticas diferentes. Sus bases de datos no suelen estar integradas, lo que implica la existencia de islas de informacin. Datos errneos, obsoletos o incompletos. El tema de la calidad de los datos siempre es considerado como algo importante, pero esta labor nunca se lleva al extremo de garantizar la fiabilidad de la informacin aportada. Problemas para adecuar la informacin al cargo del usuario. No se trata de que todo el mundo tenga acceso a toda la informacin, sino de que tenga acceso a la informacin que necesita para que su trabajo sea lo ms eficiente posible. Ausencia de informacin histrica. Los datos almacenados en los sistemas operacionales estn diseados para llevar la empresa al da, pero no permiten contrastar la situacin actual con una situacin retrospectiva de aos atrs. 8.2.Datamart Un Datamart es una base de datos departamental, especializada en el almacenamiento de los datos de un rea de negocio especfica. Se caracteriza por disponer la estructura ptima de datos para analizar la informacin al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un datamart puede ser alimentado desde los datos de un datawarehouse, o integrar por si mismo un compendio de distintas fuentes de informacin.

Por tanto, para crear el datamart de un rea funcional de la empresa es preciso encontrar la estructura ptima para el anlisis de su informacin, estructura que puede estar montada sobre una base de datos OLTP, como el propio datawarehouse, o sobre una base de datos OLAP. La designacin de una u otra depender de los datos, los requisitos y las caractersticas especficas de cada departamento. De esta forma se pueden plantear dos tipos de datamarts:

8.3.Metodologas El Data Warehouse es un conglomerado de todos los Data Marts dentro de una empresa, siendo una copia de los datos transaccionales estructurados de una forma especial para el analisis, de acuerdo al Modelo Dimensional (no normalizado), que incluye, como ya vimos, las dimensiones de anlisis y sus atributos, su organizacin jerarquica, asi como los diferentes hechos de negocio que se quieren analizar. Por un lado tenemos tablas para las representar las dimensiones y por otro lado tablas para los hechos (las facts tables). Los

diferentes Data Marts estan conectados entre si por la llamada bus structure, que contiene los elementos anteriormente citados a traves de las dimensiones conformadas (que permiten que los usuarios puedan realizar querys conjuntos sobre los diferentes data marts, pues este bus contiene los elementos en comn que los comunican). Una dimensin conformada puede ser, por ejemplo, la dimensin cliente, que incluye todos los atributos o elementos de analisis referentes a los clientes y que puede ser compartida por diferentes data marts (ventas, pedidos, gestin de cobros, etc).

Enfoque Kimball - Arquitectura Bus del DW Este enfoque tambin se referencia como Bottom-up, pues al final el Datawarehouse Corporativo no es mas que la unin de los diferentes datamarts, que estan estructurados de una forma comn a travs de la bus structure. Esta caracteristica le hace mas flexible y sencillo de implementar, pues podemos construir un Data Mart como primer elemento del sistema de anlisis, y luego ir aadiendo otros que comparten las dimensiones ya definidas o incluyen otras nuevas. En este sistema, los procesos ETL extraen la informacin de los sistemas operacionales y los procesan igualmente en el area stage, realizando posteriormente el llenado de cada uno de los Data Mart de una forma individual, aunque siempre respetando la estandarizacion de las dimensiones (dimensiones conformadas). La metodologa para la construccin del Dw incluye las 4 fases que vimos en la entrada anterior del blog, que son: Seleccin del proceso de negocio, definicin de la granuralidad de la informacin, eleccin de las dimensiones de anlisis e identificacin de los hechos o mtricas. Igualmente define el tratamiento de los cambios en los datos a travs de las Dimensiones Lentamente Cambiantes (SCD).

Para el desarrollo del DataMart de Crditos Desembolsados se har uso de la metodologa Kimball. La metodologa de Kimball se enfoca principalmente en el diseo de la base de datos que almacenar la informacin para la toma de decisiones. El diseo se basa en la creacin de tablas de hechos (FACTS) que son tablas que contienen la informacin numrica de los indicadores a analizar, es decir la parte cuantitativa de la informacin. Ralph Kimball, es reconocido como uno de los padres del concepto de Data Warehouse, se ha dedicado desde hace ms de 10 aos al desarrollo de su metodologa para que ste concepto sea bien aplicado en las organizaciones y se asegure la calidad en el desarrollo de estos proyectos Metodologa Kimball Ciclo de Vida Fases Metodologa Kimball a) Planificacin del Proyecto La planificacin busca identificar la definicin y el alcance del proyecto de data warehouse, incluyendo justificaciones del negocio y evaluaciones de factibilidad. La planificacin del proyecto se focaliza sobre recursos, perfiles, tareas, duraciones y secuencialidad. El plan de proyecto resultante identifica todas las tareas asociadas con el ciclo de vida del datawarehouse e identifica las partes involucradas.

b) Definicin de Requerimientos del negocio Un factor determinante en el xito de un proceso de Data Warehouse es la interpretacin correcta de los diferentes niveles de requerimientos expresados por los diferentes niveles de usuarios. Aqu se identificar la informacin que requiere el usuario para desempear sus tareas. En esta etapa se especifica las funciones especficas que se obtendrn del Data Mart describiendo con claridad los requerimientos tales como: i. Definir los requerimientos del propietario. ii. Definir los requerimientos del usuario final. Estos requerimientos permitirn entregar el Data Mart. tener el ambiente operativo en el que se

c) Diseo Tcnico de la Arquitectura Los ambientes de data warehouse requieren la integracin de numerosas tecnologas. Se debe tener en cuenta tres factores: los requerimientos del negocio, los actuales ambientes tcnicos y las directrices tcnicas estratgicas futuras planificadas para de esta forma poder establecer el diseo de la arquitectura d) Modelo Dimensional La definicin de los requerimientos del negocio determina los datos necesarios para cumplir los requerimientos analticos de los usuarios. Disear los modelos de datos para soportar estos anlisis requieren un enfoque diferente al usado en los sistemas operacionales. Bsicamente se comienza con una matriz donde se determina la dimensionalidad de cada indicador y luego se especifican los diferentes grados de detalle (atributos) dentro de cada concepto del negocio (dimensin), como as tambin la granularidad de cada indicador (variable o mtrica) y las diferentes jerarquas que dan forma al modelo dimensional del negocio (BDM) o mapa dimensional. e) Diseo Fsico El diseo fsico de las base de datos se focaliza sobre la seleccin de las estructuras necesarias para soportar el diseo lgico. Algunos de los elementos principales de este proceso son la definicin de convenciones estndares de nombres y seteos especficos del ambiente de la base de datos. La indexacin y las estrategias de particionamiento son tambin determinadas en esta etapa. f) Diseo y Desarrollo de Presentacin de Datos Las principales sub-etapas de esta zona del ciclo de vida son: la extraccin, la transformacin y la carga (ETL process). Se definen como procesos de extraccin a aquellos requeridos para obtener los datos que permitirn efectuar la carga del Modelo Fsico acordado. As mismo, se definen como procesos de transformacin los procesos para convertir o recodificar los datos fuente a fin poder efectuar la carga efectiva del Modelo Fsico. Por otra parte, los procesos de carga de datos son los procesos requeridos para poblar el Data Warehouse. Todas estas tareas son altamente crticas pues tienen que ver con la materia prima del data warehouse: los datos. La desconfianza y prdida de credibilidad del data warehouse sern resultados inmediatos e inevitables si el usuario choca con informacin inconsistente. Es por ello que la calidad de los datos es un factor determinante en el xito de un proyecto de data warehouse. Es en esta etapa donde deben sanearse todos los inconvenientes relacionados con la calidad de los datos fuente.

10

g) Seleccin de Productos e Instalacin Utilizando el diseo de arquitectura tcnica como marco, es necesario evaluar y seleccionar componentes especficos de la arquitectura como ser la plataforma de hardware, el motor de base de datos, la herramienta de ETL o el desarrollo pertinente, herramientas de acceso, etc. Una vez evaluados y seleccionados los componentes determinados se procede con la instalacin y prueba de los mismos en un ambiente integrado de data warehouse. h) Especificacin de Aplicaciones para Usuarios Finales No todos los usuarios del data warehouse necesitan el mismo nivel de anlisis. Es por ello que en esta etapa se identifican los diferentes roles o perfiles de usuarios para determinar los diferentes tipos de aplicaciones necesarias en base al alcance de los diferentes perfiles (gerencial, analista del negocio, vendedor, etc.) i) Desarrollo de Aplicaciones para Usuarios Finales Siguiendo a la especificacin de las aplicaciones para usuarios finales, el desarrollo de las aplicaciones de los usuarios finales involucra configuraciones del metadata y construccin de reportes especficos. Una vez que se ha cumplido con todos los pasos de la especificacin y se tiene la posibilidad de trabajar con algunos datos de prueba, comienza el desarrollo de la aplicacin. j) Implementacin La implementacin representa la convergencia de la tecnologa, los datos y las aplicaciones de usuarios finales accesible desde el escritorio del usuario del negocio. Hay varios factores extras que aseguran el correcto funcionamiento de todas estas piezas, entre ellos se encuentran la capacitacin, el soporte tcnico, la comunicacin. Todas estas tareas deben ser tenidas en cuenta antes de que cualquier usuario pueda tener acceso al data warehouse.

k) Mantenimiento y crecimiento Data Warehouse es un proceso, de etapas bien definidas con comienzo y fin, pero de naturaleza espiral, pues acompaa a la evolucin de la organizacin durante toda su historia. Se necesita continuar con los relevamientos de forma constante para poder seguir la evolucin de las metas por conseguir. Segn afirma Kimball, si se ha utilizado el Ciclo de Vida, el data warehouse esta preparado para evolucionar y crecer. Al contrario de los sistemas tradicionales, los cambios en el desarrollo deben ser vistos como signos de xito y no de falla. Es importante establecer las prioridades para poder manejar los nuevos requerimientos de los usuarios y de esa forma poder evolucionar y crecer.

11

l)

Gerenciamiento del Proyecto El gerenciamiento del proyecto asegura que las actividades del ciclo del datawarehouse se lleven en forma y sincronizadas. Como lo indica el diagrama, el gerenciamiento acompaa todo el ciclo de vida. Entre sus actividades principales se encuentra el monitoreo del estado del proyecto y la comunicacin entre los requerimientos del negocio y las restricciones de informacin para poder manejar correctamente las expectativas en ambos sentidos. (Kimball R. Reeves, 1998)

Datamart o Datawarehouse. Modelo Dimensional El modelado dimensional se basa en HECHOS (Facts) y es una alternativa al modelado relacional. Sus principales ventajas son: Enfocado en el negocio y sus actividades Permite bsquedas a gran velocidad

Caractersticas del modelado dimensional Debemos tener en cuenta al llenar un modelo dimensional: No deben existir en el modelo dimensional datos nulos Cada dimensin tiene un cdigo auto correlativo independiente que es su llave Los datos deben estar estandarizados.

principal (IDENTITY)

9. Mtodos y Herramientas 9.1.Mtodos El presente trabajo presentar las siguientes Fases de la metodologa Kimball, representada en siguiente cuadro:

FASES Planificacin

FLUJOS TRABAJO Elaborar el Plan de Trabajo. Identificando la metodologa y las herramientas con las que se implementara el Datamart

RESULTADOS Informe del plan de trabajo

12

Anlisis de Requerimientos

Definir el Proceso de Negocio a Modelar Seleccin de Entrevistados Entrevistar a las personas seleccionadas Definir los requerimientos obtenidos en las entrevistas. Definir las Tablas Dimensionales Definir la Tabla de Hechos Disear el Modelo Estrella Definir la Arquitectura de la Implementacin

Cuestionarios de las entrevistas Modelo del negocio

Modelo Dimensional

Modelo dimensional

Diseo Tcnico de la Arquitectura

Diagrama de Arquitectura

tecnolgica de la empresa.

Modelo Fsico

Trasladar el Modelo Dimensional al Modelo Fsico Transformacin de Datos Realizar Carga de Datos Realizar Extraccin de Datos Generar el Cubo Disear los Reportes a Mostrar

Modelo fsico

Diseo y Desarrollo de Presentacin de Datos

Informa de la

Implementacin de los ETLs

Desarrollo de Aplicacin para el Usuario Final

Informe final del desarrollo

del Datamart

9.2.Herramientas

Microsoft PowerPivot es un complemento de anlisis de datos de Excel 2010, antes conocido como Project Gemini, que proporciona una potencia computacional sin precedentes directamente dentro de Excel 2010. PowerPivot proporciona su enlace a los usuarios de negocios de BI, mientras permite a las organizaciones monitorear y manejar la colaboracin eficientemente usando SharePoint 2010 y SQL Server 2008 basado en herramientas de gestin.

13

Este es un ejemplo de lo que produce PowerPivot, es una imagen tomada directamente de Excel:

Novedades de BI. La tecnologa de PowerPivot redefine a los departamentos de TI el entregar y tener xito con BI. Dar a los usuarios la mejor herramienta disponible de anlisis de datos.

Se basa en la familiaridad con Excel para acelerar la adopcin del usuario. Ampliar las capacidades existentes con la compresin basada en columnas y en la memoria del motor BI, fuentes de datos prcticamente ilimitadas, y las nuevas expresiones de anlisis de datos en una familiar formula de Sintaxis. Facilita el compartimiento de conocimientos y colaboracin generados por los usuarios de BI. Implementar Sharepoint para proveer la base de colaboracin con todas las capacidades escenciales incluyendo seguridad, flujo de trabajo, control de versin y servicios de Excel. Instalar SQL Server 2008 R2 para habilitar el soporte de aplicaciones BI en Sharepoint, incluyendo la actualizacin de datos automtica, el procesamiento de datos con el mismo rendimiento que en Excel y el tablero de manejo de Power Pivot. Sus usuarios pueden acceder a los libros de trabajo en el navegador, sin tener que descargar los libros de trabajo y los datos para cada estacin de trabajo. Aumenta la eficiencia de la Gestion de BI. Utilizar la interfaz de Gestion Power Pivot para gestionar el rendimiento, la disponibilidad y calidad del servicio. Descubra las aplicaciones de misin critica y asegurese que se asignan los recursos adecuados. Proporcionar el acceso seguro a los datos de confianza. Aprovecha la alimentacin de datos de SQL Server Reporting Services para encapsular los sistemas de la empresa y reusar los libros compartidos como fuentes de datos en nuevos anlisis. Muestra de Power Pivot usando Silverlight.

14

Power Pivot para Excel 2010. Es un complemento de Microsoft Excel 2010 que permite crear poderosos anlisis mediante una rpida manipulacin de millones de filas de datos dentro de un libro de trabajo de Excel y utilizar Microsoft Office 2010 para compartir y colaborar en tus ideas con tu equipo.

SQL SERVER 2008 SQL Server 2008 es una plataforma global de base de datos que ofrece administracin de datos empresariales con herramientas integradas de inteligencia empresarial (BI). El motor de la base de datos SQL Server 2008 ofrece almacenamiento ms seguro y confiable tanto para datos relacionales como estructurados, lo que le permite crear y administrar aplicaciones de datos

15

altamente disponibles y con mayor rendimiento para utilizar en su negocio. El motor de datos SQL Server 2008 constituye el ncleo de esta solucin de administracin de datos empresariales. Asimismo, SQL Server 2008 combina lo mejor en anlisis, informacin, integracin y notificacin. Esto permite que su negocio cree y despliegue soluciones de BI rentables que ayuden a su equipo a incorporar datos en cada rincn del negocio a travs de tableros de comando, escritorios digitales, servicios Web y dispositivos mviles. La integracin directa con Microsoft Visual Studio, el Microsoft Office System y un conjunto de nuevas herramientas de desarrollo, incluido el Business Intelligence Development Studio, distingue al SQL Server 2008. Ya sea que usted se desempee como encargado de desarrollo, administrador de base de datos, trabajador de la industria de la informacin o dirija una empresa, SQL Server 2008 ofrece soluciones innovadoras que le ayudan a obtener ms valor de sus datos.

La plataforma de datos SQL Server incluye las siguientes herramientas:

Base de datos relacional: Un motor de base de datos relacional ms


segura, confiable,escalable y altamente disponible con mejor rendimiento y compatible para datos estructurados y sin estructura (XML).

Servicios de rplica: Rplica de datos para aplicaciones de procesamiento


de datos distribuidas o mviles, alta disponibilidad de los sistemas, concurrencia escalable con almacenes de datos secundarios para soluciones de informacin empresarial e integracin con sistemas heterogneos, incluidas las bases de datos Oracle existentes.

Notification Services: Capacidades avanzadas de notificacin para el


desarrollo y el despliegue de aplicaciones escalables que pueden entregar

16

actualizaciones de informacin personalizadas y oportunas a una diversidad de dispositivos conectados y mvi les.

Integration Services: Capacidades de extraccin, transformacin y carga (ELT)


de datos para almacenamiento e integracin de datos en toda la empresa.

Analysis Services: Capacidades de procesamiento analtico en lnea


(OLAP) para el anlisis rpido y sofisticado de conjuntos de datos grandes y complejos, utilizando almacenamiento multidimensional.

Reporting Services: Una solucin global para crear, administrar y


proporcionar tanto informes tradicionales orientados al papel como informes interactivos basados en la Web.

Herramientas de administracin: SQL Server incluye herramientas


integradas de administracin para administracin y optimizacin avanzadas de bases de datos, as como tambin integracin directa con herramientas tales como Microsoft Operations Manager (MOM) y Microsoft Systems Management Server (SMS). Los protocolos de acceso de datos estndar reducen drsticamente el tiempo que demanda integrar los datos en SQL Server con los sistemas existentes. Asimismo, el soporte del servicio Web nativo est incorporado en SQL Server para garantizar la interoperabilidad con otras aplicaciones y plataformas.

Herramientas de desarrollo. SQL Server ofrece herramientas integradas de


desarrollo para el motor de base de datos, extraccin, transformacin y carga de datos, minera de datos, OLAP e informes que estn directamente integrados con Microsoft Visual Studio para ofrecer capacidades de desarrollo de aplicacin de extremo a extremo. Cada subsistema principal en SQL Server se entrega con su propio modelo de objeto y conjunto de interfaces del programa de aplicacin (API) para ampliar el sistema de datos en cualquier direccin que sea especfica de su negocio.

Nuevas funcionalidades de SQL Server 2008: 1. Proteccin de la Informacin Cmo podra saber si ha copiado la base de datos del servidor de produccin de un cliente y lo han instalado en otra base de datos o si estn accediendo a la informacin? Con SQL 2008, puede proteger la informacin con una clave de proteccin (Encriptacin). Cmo podra saber que datos estn siendo ledos y modificados, a qu hora y por quien? SQL 2008 da la opcin de Auditora de Datos.

17

2.

Continuidad del Negocio Si sus clientes necesitan estar siempre en lnea con sus sistemas sin cadas, SQL 2008 ofrece mejoras en una tcnica llamada Mirroring, el cual es una copia o espejo de la base de datos. Si el disco se daa, donde reside los datos, SQL 2008 recupera la informacin de una copia reciente de los datos daados al otro equipo espejo de manera transparente. Ahorro en espacio en disco, mediante la tcnica de comprensin, ahorrando costos en compra de discos si es que el volumen de la informacin de Base de Datos empieza a crecer en forma rpida

3. 4.

Datos Geoespaciales Poder manejar informacin geogrfica, la que hoy en da es de alta importancia Acceder a la Informacin desde cualquier lugar en cualquier momento Con SQL 2008 podre crear rpidamente aplicaciones conectadas a la base de datos con la funcionalidad de funcionar en forma desconectada y despus sincronizarlos con la base de datos central sin perder la lnea de negocio y manteniendo los datos validados en las organizaciones, con todo el tema de globalizacin

5.

Reportes Poder acceder a reportes directamente desde Word, mejoras en los tipos de grficos en los reportes, hacindolos ms entendibles y poder editar los reportes de Microsoft Office, sin saber donde fue diseado el reporte

Lenguaje SQL El lenguaje SQL est compuesto por comandos, clusulas, operadores y funciones de agregado Estos elementos se combinan en las instrucciones para crear, actualizar y manipular las bases de datos. 1. Comandos

Existen dos tipos de comandos SQL: DDL que permiten crear y definir nuevas bases de datos, campos e ndices. DML que permiten generar consultas para ordenar, filtrar y extraer datos de la base de datos.

Comandos DDL Comando Descripcin

18

CREATE DROP ALTER

Utilizado para crear nuevas tablas, campos , ndices, procedimientos, funciones, etc. Empleado para eliminar tablas, campos , ndices, procedimientos, funciones, etc. Utilizado para modificar las tablas, campos , ndices, procedimientos, funciones, Comandos DML

Comando SELECT INSERT

Descripcin Utilizado para consultar registros de la base de datos que satisfagan un criterio Utilizado para cargar lotes de datos en la base de datos en una nica operacin.

UPDATE

Utilizado para modificar los valores de los campos y registros especificados.

DELETE

Utilizado para eliminar registros de una tabla de una base de datos.

2.

Clausulas

Las clusulas son condiciones de modificacin utilizadas para definir los datos que desea seleccionar o manipular. Clusula FROM WHERE GROUP BY HAVING ORDER BY Descripcin Utilizada para especificar la tabla de la cual se van a seleccionar los registros. Utilizada para especificar las condiciones que deben reunir los registros que se van a seleccionar. Utilizada para separar los registros seleccionados en grupos especficos. Utilizada para expresar la condicin que debe satisfacer cada grupo. Utilizada para ordenar los registros seleccionados de acuerdo con un orden especfico.

3.

Operadores Lgicos Uso Es el "y" lgico. Evala dos condiciones y devuelve un valor de verdad slo si. Es el "o" lgico. Evala dos condiciones y devuelve un valor de verdad. Negacin lgica. Devuelve el valor contrario de la expresin.

Operador AND OR NOT

4.

Operadores de Comparacin:

19

< Menor que , > Mayor que, <> Distinto de, <= Menor o igual que , >= Mayor o igual que, = Igual que, BETWEEN Utilizado para especificar un intervalo de valores., LIKE Utilizado en la comparacin de un modelo, In Utilizado para especificar registros de una base de datos

5.

Funciones de Agregado

Las funciones de agregado se usan dentro de una clusula SELECT en grupos de registros para devolver un nico valor que se aplica a un grupo de registros.

AVG: Utilizada para calcular el promedio de los valores de un campo


determinado.

COUNT : Utilizada para devolver el nmero de registros de la seleccin. SUM: Utilizada para devolver la suma de todos los valores de un campo
determinado.

MAX: Utilizada para devolver el valor ms alto de un campo especificado. MIN Utilizada para devolver el valor ms bajo de un campo especificado.
6. Orden de ejecucin de los comandos

Dada una sentencia SQL de seleccin que incluye todas las posibles clusulas, el orden de ejecucin de las mismas es el siguiente: Clusula FROM Clusula WHERE Clusula GROUP BY Clusula HAVING Clusula SELECT Clusula ORDER BY

20

10.

Referencias Bibliogrficas

1) Business Intelligence, Business Intelligence, disponible en:


http://www.sinnexus.com/business_intelligence/sistemas_informacion.aspx [Accesado el da 04 de Abril del 2010]

2) Datamart, Datamart, disponible en:


http://www.sinnexus.com/business_intelligence/datamart.aspx [Accesado el da 04 de Abril del 2010]

3) Modelado Dimensional, Ampliacin de Conceptos del Modelado Dimensional,


disponible en: http://churriwifi.wordpress.com/2010/04/19/15-2-ampliacion-conceptos-del-modeladodimensional/ [Accesado el da 04 de Abril del 2010]

4) Metodologa Kimball, Ciclo de Vida de la Metodologa Kimball, disponible en:


http://es.scribd.com/doc/52203545/21/Metodologia-Kimball-%E2%80%93-Ciclo-de-Vida [Accesado el da 04 de Abril del 2010]

5) Microsoft PowerPivot , Microsoft PowerPivot, disponible en:


http://www.gravitar.biz/index.php/bi/microsoft-powerpivot/ [Accesado el da 06 de Abril del 2010]

6) SQL Server 2008, SQL Server 2008, disponible en:


https://partner.microsoft.com/spain/40047231 [Accesado el da 06 de Abril del 2010] http://www.gradodigital.gob.sv/CURSOS/SQL2008/MODULO1INTRODUCCION_A_SQL_2008.pdf (Libros en pantalla de SQL Server 2008 de Microsoft Corporation (Edicin de Enero de 2009)) [Accesado el da 06 de Abril del 2010] SQL Server 2008 Integration Services, Ao 2008 , Brian Knight,Erik Veerman, Grant Dickinson, Douglas Hinson y Darren Herbold, Wiley Publishing, Inc., Indianapolis, Indiana

7) MI BANCO, Mi Banco, disponible en:


http://www.mibanco.com.pe [Accesado el da 06 de Abril del 2010]

8) Negocios Inteligentes , BI, disponible en:


http://www.microsoft.com/spain/bi [Accesado el da 06 de Abril del 2010]

21

ACREDITACIN

El Ingeniero Abanto Cabrera Heber que suscribe, asesor del Plan de Trabajo de Suficiencia Profesional titulado: Implementacin del Datamart de Crditos desembolsados para la empresa mi banco usando la metodologa Kimball y la herramienta SQL Server 2008 , elaborado por los seores bachilleres: Espinoza Ninaquispe, Ellwin y Gutirrez Ortiz Erika, deja constancia que el presente plan ha sido revisado, observado y hecho las recomendaciones del caso, encontrndose expedito para presentarlo para la evaluacin de los seores Miembros del Jurado que se designe.

Trujillo, ___ del Marzo del 2011

Nombre y Firma del Asesor 22

Solicito: Revisin e Inscripcin del Plan de Trabajo de Suficiencia Profesional Seor: Dr. LAZO AGUIRRE LAZO Director de la Escuela de Ingeniera de Computacin y Sistemas

Nosotros________________________________________________, con ID; ___________, y ______________________________________________________, Sistemas, ante usted nos presentamos y decimos: con ID; ___________, alumnos del Programa de Titulacin Extraordinaria 2009-II de Ingeniera de Computacin y

Que, habiendo culminado de elaborar el Plan del Trabajo de Suficiencia Profesional Titulado _____________________________________________________________________________ _____________________________________________________________________________ ___________________________________________________________________, Solicito a usted la revisin e inscripcin del Plan de Trabajo de Suficiencia Profesional, para lo cual alcanzo a vuestro Despacho los tres ejemplares, en anillado, incluyendo el informe final del Profesor Asesor; para su evaluacin por el Jurado Calificador que vuestra Direccin designe.

A usted Seor Director solicito vuestro trmite par la expedicin de la resolucin respectiva. Por ser de justicia. Trujillo, ___ de Abril del 2011

Br.

Br.

Se adjunta: Recibo de Derecho de Trmite Tres juegos del Trabajo de Suficiencia Profesional

23