Está en la página 1de 17

|

| |

p  
 

|

   
 

     


! "   

#
$ $ %

&
$  '( p  

)* +
$&
 

á á

,& -./
p   
 
       p 
 
 

   
  
   

¦ 
Œ| Introdução.଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄
଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄.pag.03
Œ| O que é data
warehouse଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄
଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄pag.04
Œ| pata
warehousing଄଄଄଄଄଄଄଄଄଄଄..଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄
଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄pag.04
Œ| ipos de data
warehouse଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄..଄଄଄଄଄଄଄଄଄଄
଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄pag.04
D| Orientação por
tema଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄..଄଄଄..଄଄଄଄଄଄
଄଄଄଄଄଄଄଄଄଄଄଄pag.04
D| Integrado଄଄଄଄଄଄଄଄଄଄..଄଄଄଄଄଄଄଄଄଄଄଄଄଄..଄଄଄
଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄pag.04
D| ×ariável
tempo଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄..଄..଄଄଄଄଄଄଄଄
଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄pag.04
D| rão
volátil଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄..଄଄଄଄଄଄଄଄଄
଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄pag.05
Œ| pata warehouse vs SGBp
Heterogéneos଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄..଄଄଄଄଄଄଄଄଄.
଄଄଄଄଄pag.05
Œ| pata warehouse vs SGBp
Operacionais଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄..଄଄଄଄଄଄଄଄଄.
଄଄଄.଄଄pag.06
p   
 
       p 
 
 

   
  
   

Œ| @rincipais diferenças entre O @ e


O @଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄..଄଄଄଄଄଄଄଄଄.଄଄଄
଄pag.07
Œ| Yodelação conceptual de data
warehouse଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄..଄଄..଄଄଄଄଄଄.଄
଄଄଄pag.08
D| 0squema
estrela଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄..଄଄଄଄଄଄଄଄
଄଄଄଄..଄..଄଄଄଄଄଄.଄଄଄଄pag.08
D| 0squema floco de
neve଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄...଄଄଄଄଄଄଄଄଄଄..଄଄..
଄଄଄଄଄଄.଄଄଄଄pag.09
D| Gonstelação
facto଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄,଄଄଄଄଄଄଄଄଄଄.଄଄଄଄
଄..଄଄..଄଄଄଄଄଄.଄଄଄଄pag.09
Œ| pesenho de data
warehouse଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄
଄଄଄଄଄଄଄଄଄଄଄଄଄pag.10
D| @erspectiva op-
pown଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄.଄଄଄଄
଄଄଄଄଄଄଄଄଄଄଄଄pag.10
D| @erspectiva de origem de
dados଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄
଄଄଄଄଄଄pag.10
D| @erspectiva data
warehouse଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄
଄଄଄଄଄଄଄଄଄଄଄pag.10
D| @erspectiva de consulta de
análise଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄.଄଄
଄଄଄଄pag.10
p   
 
       p 
 
 

   
  
   

Œ| @rocesso de desenho de data


warehouse଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄.଄଄଄
଄଄଄଄଄pag.10
D| ordagem op-pown, Bottom-
up଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄..଄଄଄଄଄଄଄
଄଄pag.10
D| 0ngenharia
software଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄
଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄pag.10
D| pesenho
típico଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄
଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄.଄pag.11
Œ| rquitectura Yulti-
camada଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄
଄଄଄଄଄଄଄଄଄଄଄଄଄pag.11
Œ| ipo de arquitectura
O @଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄
଄଄଄଄଄଄଄଄଄଄..଄଄pag.12
D| ’O @଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄
଄଄଄଄଄..଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄..଄଄pag.12
D| YO @଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄
଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄...଄଄pag.12
D| HO @଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄
଄଄଄଄଄଄଄଄଄଄଄..଄଄଄଄଄଄଄଄଄଄..଄଄pag.12
Œ| Gonclusão଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄ ଄଄
଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄଄..଄଄pag.13

  

p  | 
|| |
  ||| ||p ||
|
|

  |  |
||
|| |
|
0ste traalho foi realizado no âmito da disciplina de   
 


 leccionada pelo professor   0ste traalho vai consistir em definir e
exemplificar vários tipos de pata warehouse, fala tamém nas diferenças e
especificações de O @ e O @.
p  | 
|| |
  ||| ||p ||
|
|

  |  |
||
|| |
|
O




pata warehouse é uma ase dados de suporte à decisão, sendo esta mantida
separadamente da ase operacional da organização.

Suporta processamento de informação fornecendo uma plataforma sólida para


análise de dados históricos e consolidados.

p
 

O processo de construir e usar data warehouses.

 


Œ| Orientado por tema:

O pata warehouse orientado por tema é organizado em torno detemas


importantes, tais como cliente, produto, vendas. Foca-se na modelação e análise de
dados para quem toma decisões, em vez de operações diárias eprocessamento de
transacções.

Fornece tamém uma visão simples e concisa sore questões de um tema


particular através da exclusão de dados que não são importantes no suporte ao processo
de decisão.

Œ| Integrado:

O pata warehouse integrado é construído por integração de múltiplas e


heterogéneas fontes de dados.
p  | 
|| |
  ||| ||p ||
|
|

  |  |
||
|| |
|
s Bases de dados são relacionais, contêm ficheiros simples e registos de
transacções on-line onde são aplicadas técnicas de limpeza de dados eintegração de
dados. É assim assegurada a consistência na convenção denomes, codificação de
estruturas, atriutos de medidas, etc. entre diferentes fontes de dados (ex: Hotel price:
currency, tax, reakfast covered, etc.)

Goncluindo quando a informação é movida para o warehouse, é feita a


conversão.

Œ| ×ariável tempo:

Gada estrutura chave no data warehouse contém um elemento de tempo,


explicita ou implicitamente, mas a chave de dados operacionais pode ou não conter um
ૼelemento de tempo૽.

O horizonte de tempo para um data warehouse é significativamente maior do


que o de um sistema operativo, onde a ase de dados operacional contem a informação
actual, e os dados nela contidos fornecem a informação numa perspectiva histórica (ex:
últimos 5-10 anos)

Œ| rão ×olátil:

Uma pata warehouse não volatíl é um repositório fisicamente separado de dados


transformados do amiente operacional.

reste tipo de pata warehouse não ocorre actualização de dados operacionais


sore a informação, pois não requer mecanismos de processamento detransacções,
recuperação e controlo de concorrência mas requer apenas duas operações de acesso a
dados:

D| Garregamento inicial de dados e


p  | 
|| |
  ||| ||p ||
|
|

  |  |
||
|| |
|
D| cesso a dados.

p
p   

ra integração tradicional de ase de dados heterogéneas constroem-se


conversores/mediadores sore este tipo de ase de dados.

 aordagem usada é a orientada-a-consulta, ou seja quando uma consulta é


feita a uma determinada ase de dados, usa-se um meta-dicionário para traduzir a
consulta em consultas apropriadas para outras ase de dados envolvidas, e os resultados
são integrados num conjunto resposta gloal.

resta aordagem a filtragem de informação é complexa.

Já pelo pata warehouse a aordagem usada é a orientada-por-actualizaçao. 


informação de fontes heterogéneas é previamente integrada e guardada em warehouses
para consulta e análise directa.

p
p  

reste tópico vamos falar sore O @ e O @.

O @ (on-line transaction processing), São sistemas que se encarregam de


registar todas as transacções contidas em uma determinada operação organizacional. @or
exemplo: sistema de transacções ancárias que regista todas as operações efectuadas em
um anco, caixas de multianco, reservas de viagens ou hotel on-line, Gartões de
Grédito.

O @ é a tarefa principal dos SGBp relacionais tradicionais.


p  | 
|| |
  ||| ||p ||
|
|

  |  |
||
|| |
|
O @ (on-line analytical processing), é a capacidade para manipular e analisar
um grande volume de dados so múltiplas perspectivas. s aplicações O @ são
usadas pelos gestores em qualquer nível da organização para lhes permitir análises
comparativas que facilitem a suas decisões diárias.

O @ é a tarefa principal de sistemas de data warehouse.

Garacterísticas distintas
 O  O 
O   
Gliente Yercado

 
     actuais, detalhados históricos, consolidados
p  
0’ + aplicaçao estrela + tema
 
  actual, local evolucionária, integrada
consultas read-only,
!  actualização
complexas

 "  O O 

 O  O 
0scriturário,
#  nalista de mercado
profissional I
p  | 
|| |
  ||| ||p ||
|
|

  |  |
||
|| |
|
À
 Operações diárias Suporte a decisões
p  $
Orientado-por-aplicaçao Orientado-por-tema
 
históricos,
correntes, actualizados
sumarizados,
p  detalhados, relacional
multidimensionais
simples isolado
integrados, consolidados
#  repetitivo ad-hoc
read/write
  index/hash na chave eitura exaustiva
prim.
ransacção simples e
# $  Gonsulta complexa
curta
%
  
dezenas Yilhões
 
%
 
milhares centenas

 
  $
100YB-GB 100GB-B
 
Gonsultas por minuto,
& ransacções por minuto
resposta


p  | 
|| |
  ||| ||p ||
|
|

  |  |
||
|| |
|
&   



0xistem 3 tipos de modelação para as data warehouse, esquema estrela, esquema


floco de neve e constelações de factos.

0squema estrela:

aela de factos no centro ligada a um conjunto de taelas dimensão.


p  | 
|| |
  ||| ||p ||
|
|

  |  |
||
|| |
|

0squema floco de neve:

Um refinamento do esquema estrela onde parte da hierarquia dimensional é


normalizada num conjunto de taelas dimensão mais pequenas, numa
forma similar a um floco
de neve.

Gonstelações de factos:

aelas de factos múltiplas partilham taelas dimensão, formando um grupo de


estrelas, logo chamado constelação de factos.


p  | 
|| |
  ||| ||p ||
|
|

  |  |
||
|| |
|
p  


0xistem quatro perspectivas de desenho de um data warehouse:

Œ| @erspectiva op-down

@ermite a selecção da informação relevante necessária para o data warehouse.

Œ| @erspectiva de Origem de pados

Yostra a informação a ser adquirida, guardada e gerida por sistema operacionais.

Œ| @erspectiva pata warehouse

Gonsiste em taelas de factos e taelas dimensão.

Œ| @erspectiva de Gonsulta de nálise

×ê a perspectiva dos dados no warehouse do ponto de vista do utilizador final.

    




@rocesso de desenho de pata Warehouses pode ser através de 3 aordagens


diferentes:
Œ| ordagens op-down, ottom-up ou uma cominação de amos
D| op-down: Gomeça com o desenho e planeamento geral
D| Bottom-up: Gomeça com experiencias e protótipos
Œ| po ponto de vista da engenharia de software
D| Gascata: nálise estruturada e sistemática em cada passo antes de
prosseguir para o próximo
p  | 
|| |
  ||| ||p ||
|
|

  |  |
||
|| |
|
D| 0spiral: Geração rápida e incremental de funcionalidades do
sistema

Œ| @rocesso de desenho típico de data warehouse


D| 0scolher um processo de negócio a modelar, e.g., encomendas,
facturas, etc.
D| 0scolher o grão (nível de dados atómico) do processo de negócio
D| 0scolher as dimensões que estão associadas a cada taela de
factos
D| 0scolher as medidas presentes em cada registo da taela de factos



&
'
p  | 
|| |
  ||| ||p ||
|
|

  |  |
||
|| |
|


p  | 
|| |
  ||| ||p ||
|
|

  |  |
||
|| |
|
 

O 

0xistem 3 tipos diferentes de arquitecturas O @: ’elacional, multidimensional


e hyrid O @.

ra arquitectura relacional (’O @) usa-se ase de dados relacionais estendidas


para guardar e gerir os dados do data warehouse e aplicações O @ para suportar
análise complexa de dados.
0ste tipo de arquitectura inclui uma optimização dos sistemas de ase de dados
de ackend e contém a implementação de navegação aseada em agregação assim como
mais ferramentas e serviços.

 arquitectura multidimensional (YO @) é aseada em matrizes de


armazenamento multidimensionais. reste tipo a indexação é rápida sore dados
sumarizados pré-calculados.

 Hyrid O @(HO @) é uma cominação das outras 2 arquitecturas.


0sta arquitectura permite armazenar parte dos dados em um YO @ e outra
parte dos dados em ’O @.

 
p  | 
|| |
  ||| ||p ||
|
|

  |  |
||
|| |
|
 
 

 realização deste traalho foi astante complexa e intensiva. Yas apesar disso
os ojectivos propostos inicialmente foram cumpridos.