Está en la página 1de 31

1

Relevamiento: Diseo Fsico de Sistemas OLAP



Iedeiico Iiedialuena, Cuslavo Vzquez
Inslilulo de Conpulacin,
Univeisidad de Ia ReplIica,
Monlevideo, Uiuguay
|fpiedial, gusvazfing.edu.uy

Abstract. LI diseo fsico de Ios sislenas OLAI iequieie lecnicas conpIelanenle
dislinlas aI de Ios sislenas OLTI. Dado eI gian voIunen de infoinacin
invoIuciado y Ias opeiaciones a Ias que esl oiienlado un sislena OLAI, Ios
nelodos de diseo delen eslai oiienlados a Ia eficiencia en Ia iesoIucin de
consuIlas. Iaia eslo se iequieien nuevas esliucluias de dalos y acceso, nuevas
nelodoIogas de diseo y piocesos de nanleninienlo eficienles. Lsle lialajo
iefIeja eI ieIevanienlo de Ias acluaIes Ineas de invesligacin en eI diseo fsico
de sislenas OLAI e idenlifica aIgunos lenas de invesligacin incipienles.
Iiovee lanlien un oveiviev de Ias esliucluias, aiquilecluias, aIgoiilnos,
nelodoIogas y lecnoIogas invoIuciadas en eI dala vaiehousing.
Pa!abras c!avcs: Dala Waiehouise, Diseo Isico, OLAI, Indices, Conpiesin,
V|SS Prco|cn, Cache.
I. IntrnduccIn
LI On|inc Ana|q|ica| Prcccssing (OLAI) iequieie Ia ejecucin de opeiaciones coslosas, cono poi
ejenpIo jcins y aggrcga|icns. Lsla siluacin se hace nas conpIeja poi eI hecho de que Ias consuIlas
OLAI delen ieaIizaise solie esliucluias que lienen polenciaInenle niIIones de iegislios y
poique Ios iesuIlados lienen que sei enliegados inleiaclivanenle aI anaIisla de negocios que
opeia eI sislena. Dadas eslas caiacleislicas, eI enfasis en eI anlienle O|AP esl en eI
piocesanienlo eficienle de consuIlas.

Ln leininos lecnicos, eI sislena O|AP es una pioyeccin nuIlidinensionaI iedundanle de una
ieIacin. Conpula lodos Ios gicup oq (lonando opeiadoies SQL cono ejenpIo) y ieaIiza una
agiegacin de sus iesuIlados en un espacio N-dinensionaI paia iespondei consuIlas O|AP. Lslas
agiegaciones son enlonces aInacenadas en lalIas de sunaiizacin deiivadas o aiiegIos
nuIlidinensionaIes. Dado que eslas agiegaciones geneiaInenle son nuy giandes y que Ias
consuIlas son a nenudo conpIejas se hace necesaiio aceIeiai Ios lienpos de iespuesla de Ias
consuIlas usando nejoies nodeIos, esliucluias de dalos, ndices y nelodos de conpiesin.

Lslas son aIgunas de Ias iazones poi Ias que eI diseo fsico de sislenas OLAI es difeienle deI
diseo de lases de dalos oiienladas a sislenas OLTI. A eslo, se Ie suna eI hecho de que Ios
sislenas OLTI iequieien lajos lienpos de iespuesla en opeiaciones deI lipo upda|cs, nienlias
que Ios sislenas OLAI luscan lajos lienpos de iespueslas en opeiaciones de consuIlas.
Asinisno, eI canlio de peispecliva a un enfoque nuIlidinensionaI |KinlaII96j infIuye en Ia
oiganizacin de dalos y esla en Ias esliucluias de acceso.

LI piincipaI facloi a consideiai en Ia elapa de diseo de un sislena OLAI es eI gian voIunen de
infoinacin invoIuciado. Ioi esla iazn Ias Ineas de invesligacin en esla iea apunlan aI
incienenlo en Ia peifoinance lanlo de Ia ejecucin de consuIlas cono de Ia caiga iniciaI o
incienenlaI leniendo en cuenla Ia oplinizacin en Ia uliIizacin deI espacio.

La invesligacin de esle lialajo se ha cenliado en ocho giandes ieas de invesligacin:
2
ModeIo de Dalos: Ln esla iea se esludian Ias esliucluias de dalos uliIizadas en
aInacenanienlo fsico, as cono Ios necanisnos de apIicacin de eslas segn Ios
iequeiinienlos geneiaIes deI sislena OLAI.
Conpiesin: Dado eI gian voIunen de infoinacin nanejado y Ios aIlos giados de
dispeisin invoIuciados, delido a que no lodos Ios posilIes ciuzanienlos de
dinensiones deleininan vaIoies paia Ias nedidas, nuchas de Ias esliucluias esludiadas
no oplinizan eI espacio de aInacenanienlo. Ioi esla iazn se han desaiioIIado vaiios
nelodos de conpiesin que peinilen consuIlai Ios dalos sin desconpiiniiIos.
Indices: LI esludio de ndices apIicalIes a Ios sislenas OLAI es un lena inpoilanle y
exlensanenle invesligado. Muchos de Ios ndices ya exislenles paia sislenas OLTI son
ievisados y nodificados paia sislenas OLAI.
SeIeccin de vislas e ndices: Una de Ias piincipaIes aclividades en Ia elapa de diseo es
Ia seIeccin deI conjunlo adecuado de vislas e ndices a naleiiaIizai paia ollenei eI
nejoi desenpeo, iespelando Ias iesliicciones de espacios y lienpos de nanleninienlo.
Lsle piolIena es conocido cono eI piolIena de seIeccin de vislas e ndices, Vicu and
|ndcx Sc|cc|icn Prco|cn (V|S Prco|cn).
Cache: Cuando no se conoce Ia fiecuencia de ocuiiencia de Ias consuIlas no es posilIe
seIeccionai un conjunlo de vislas a naleiiaIizai. Ioi Io lanlo, se iequieien lecnicas de
naleiiaIizacin dinnicas lasadas en Ias condiciones de uso deI OLAI. Ln eslos casos, eI
cache es Ia nejoi iespuesla a esla piolIenlica.
Oplinizacin de ConsuIlas: Una vez apIicados Ios nelodos de diseo anleiioies, es
necesaiio ieaIizai canlios a Ias consuIlas ieaIizadas a Ios sislenas OLAI. De esla
naneia, se podin apiovechai Ios leneficios liindados poi Ios nelodos vislos,
piincipaInenle Ia naleiiaIizacin de vislas y eI cache de iespueslas.
Iiagnenlacin y Disliilucin: TaI cono se esludia en eI diseo de lases de dalos paia
sislenas OLTI, nuchas veces es necesaiio disliiluii Ios dalos enlie dislinlos silios paia
nejoiai Ia peifoinance y Ia disponiliIidad.
Caiga y Manleninienlo: Dado eI gian voIunen de infoinacin invoIuciado, Ia
conpIejidad de Ias esliucluias de dalos y eI exlensivo uso de ndices, es necesaiio conlai
con necanisnos de caiga y nanleninienlo eficienles. La caiga y eI nanleninienlo
conpIenenlan nuchas de Ias nelodoIogas exislenles de diseo fsico con Ia finaIidad de
cunpIii, de naneia gIolaI, Ia oplinizacin piopuesla.

Lslos lenas son lialados en eI lialajo. Iaia cada caso, se ieIev Ia infoinacin ieIacionada y Ias
invesligaciones ieaIizadas en eI iea. Ln Ia seccin II se especifican Ias esliucluias de dalos, Ias
lecnicas de conpiesin en Ia seccin III y en Ia seccin IV se desciilen Ias piincipaIes esliucluias
de ndices. Ln Ia seccin V se especifican Ios piolIenas a iesoIvei en Ia elapa de diseo. Ln Ia
seccin VI se desciilen Ias lecnicas de cache y en Ia VII se desciilen lecnicas de oplinizacin de
consuIlas. Ln Ia seccin VIII se enuneian Ias posilIes aiquilecluias enfocadas piincipaInenle a
Ia fiagnenlacin y disliilucin de dalos y finaInenle, en Ia seccin IX, se piesenla eI lena de
caiga y nanleninienlo de sislenas OLAI. La seccin X nueslia aIgunas consideiaciones que
delen lonaise en cuenla a Ia hoia de seIeccionai cuI es eI nelodo de diseo fsico ns
apiopiado paia eI escenaiio solie eI que se apIicai. IinaInenle, Ia seccin XI nosliai aIgunas
concIusiones exliaidas deI ieIevanienlo ieaIizado.
II. Mndc!n dc Datns
Los Dala Waiehouses delen sei diseados esliucluiando Ios dalos de una naneia que puedan
sei nanejados poi eI sislena O|AP. CeneiaInenle, se encuenlian dos lecnicas paia nodeIai Ios
Dala Waiehouses: eI nodeIo nuIlidinensionaI y eI nodeIo ieIacionaI. Lslas dos lecnicas
piopoicionan una visla nuIlidinensionaI de Ios dalos que sopoila y faciIila eI acceso a Ios
nisnos poi paile de Ias apIicaciones O|AP.

LI nodeIo ieIacionaI es IIanado RO|AP |Haiinaiayan96, AgiavaI95j o RDl (ReIalionaI Dala
Waiehouse). LI olio nodeIo es IIanado MO|AP |Haiinaiayan96, AgiavaI95j o MDl
3
(MuIlidinensionaI Dala Waiehouse). Los RDls se consliuyen solie un nanejadoi de lases de
dalos ieIacionaIes (RD8MS), nienlias que Ios MDls se lasan en nanejadoies
nuIlidinensionaIes de lase de dalos (MDD8S). Las esliucluias de dalos en Ias cuaIes Ios RDls
y MDls aInacenan sus dalos son iadicaInenle difeienles cono se podi vei en Ias siguienles
secciones.

La eslialegia ieIacionaI es nuy escaIalIe y puede nanejai Dala Waiehouses nuy giandes, sin
enlaigo esle ciecinienlo afecla Ia peifoinance de Ias consuIlas. LI enfoque nuIlidinensionaI,
poi olia paile, liene nucho nejoi desenpeo en eI piocesanienlo de consuIlas, peio no es nuy
escaIalIe. Lsas son Ias iazones de Ia exislencia de eslas dos eslialegias y Io que fundanenla su
invesligacin.

Ln Ios Ilinos lienpos, con eI adveninienlo de Ia Wel, han suigido olias lecnicas que uliIizan
lipos de dalos seniesliucluiados lanlo cono fuenle de dalos, ieposiloiio infoinacin
nuIlidinensionaI y necanisno de inleicanlio. Ls inleiesanle vei Ia capacidad de eslos lipos de
dalos paia Ia inpIenenlacin de Dala Waiehouses y Ios lialajos que exislen aI iespeclo.
II.1 ROLAP
Los RDWs uliIizan lalIas ieIacionaIes cono esliucluia de dalos, es decii, una "ceIda" en un
espacio Igico nuIlidinensionaI se iepiesenla cono un iegislio con aIgunos aliilulos que
idenlifican Ia ulicacin de Ia ceIda en eI espacio nuIlidinensionaI y olios que conlienen Ios
vaIoies de Ias nedidas de Ia ceIda.

Lsla eslialegia peinile a Ios usuaiios consuIlai diieclanenle Ios dalos en liulo, es decii, Ias
opeiaciones en eI O|AP se liaducen en consuIlas ieIacionaIes. LI piolIena de Ia peifoinance de
Ias consuIlas se alaca usando ndices y olias eslialegias convencionaIes de oplinizacin de
consuIlas ieIacionaIes.

A nenudo, un Da|a-Cuoc se uliIiza paia nodeIai un Dala Waiehouse y una lase de dalos
ieIacionaI se uliIiza paia su inpIenenlacin. Un Da|a-Cuoc |Ciay96, LsleiO1j consisle en vaiios
aliilulos independienles, agiupados en dinensiones, y aIgunos aliilulos dependienles IIanados
nedidas. Un Da|a-Cuoc puede veise cono un aiiegIo d-dinensionaI cuyas ceIdas conlienen Ias
nedidas paia Ios iespeclivos sul-culos.

Ln eslialegias liadicionaIes de piocesanienlo de consuIlas que se lasan en Da|a-Cuocs, Ios sul-
culos de eslos pueden sei piecaIcuIados y aInacenados. Dada una consuIla, se geneia una
lsqueda en eI Da|a-Cuoc paia ollenei Ia infoinacin ieIevanle. Los iesuIlados de Ia lsqueda
pueden iequeiii sei piocesados, dependiendo deI lipo de consuIla, paia finaInenle ieloinai una
iespuesla exacla.

Dado eI gian voIunen de aInacenanienlo iequeiido poi Ios nodeIos ieIacionaIes, delido aI aIlo
niveI de iedundancia inpIicada en pos de luenos lienpos de iespuesla, es que han suigido
vaiias lecnicas que peinilen oplinizai eI espacio consunido sin peijudicai Ios lienpos de
iepuesla.

Ls as que suigen Ios Cuasi-Cuocs |ailaia97, Villei99j que pioveen una desciipcin inconpIela
deI Da|a-Cuoc y un nelodo de eslinacin de Ias enliadas que faIlen con un cieilo niveI de
exaclilud. La desciipcin dele lonai una fiaccin deI espacio lolaI deI culo y eI piocedinienlo
de eslinacin dele sei ns ipido que eI piocesanienlo de Ios dalos que se encuenlian en Ias
lalIas sulyacenles.

La idea nosliada en |ailaia97j de Cuasi-Cuocs es dividii eI culo en iegiones y uliIizai un
nodeIo de eslinacin paia desciilii cada iegin. LI nodeIo piopoiciona una desciipcin de
cada iegin, ocupando esle nenos espacio que eI giupo de ceIdas nodeIadas. LI nodeIo es
uliIizado paia eslinai Ias ceIdas de Ia iegin, Io que inlioduce eiioies (con iespeclo a Ios vaIoies
4
oiiginaIes). Iaia eslinai Ias enliadas que faIlan, con un niveI iazonalIe de exaclilud, se uliIiza
iegiesin IineaI que peinile nanlenei acolado eI eiioi nxino. La iegiesin y Ia eslinacin deI
eiioi son opeiaciones aIlanenle paiaIeIizalIes, Io que peinile aIcanzai nejoies lienpos de
iespuesla. Iaia nanlenei eI nneio de eiioies acolado, Ios vaIoies de Ias ceIdas que pioducen
Ios nayoies eiioies son aInacenados y no nodeIados.

Ln |Villei99j se piesenla un nelodo que piopoiciona iespueslas apioxinadas lasadas en nu||i-
rcsc|u|icn uatc|c| dcccnpcsi|icn que olliene una iepiesenlacin apioxinada de Ios dalos
sulyacenles, especiaInenle cuando Ia infoinacin en liulo es nuy dispeisa.

|RoussopouIos97j desciile una alsliaccin deI aInacenanienlo deI Da|a-Cuoc IIanada Cuoc|rcc.
Lsle se ieaIiza con una coIeccin lien oiganizada de R-|rcc enpaquelados, que aIcanzan aIlos
giados de concenliacin de dalos y lajos niveIes de consuno de espacio.
Prnductns
Hay nuchos pioduclos que se lasan en inpIenenlaciones ROLAI. AIgunos de eIIos son
usinessOljecls |OSj, Micioslialegy's DSS Agenl |MICj, Redliick |RLDj, OiacIe Waiehouse
|ORAj y D2 Dala Waiehouse |D2j. La peifoinance es nejoiada naleiiaIizando vislas deI culo
y cieando ndices solie eIIas, Io que puede consunii nucho espacio.
II.2 MOLAP
Los MDls aInacenan sus dalos nedianle aiiegIos nuIlidinensionaIes, guaidando soIanenle
Ios vaIoies de Ias nedidas ya que Ios vaIoies de Ias dinensiones se lialan cono ndices de Ios
aiiegIos nuIlidinensionaIes. La posicin de Ios vaIoies de Ia nedida denlio de Ios aiiegIos
nuIlidinensionaIes se puede caIcuIai a pailii de Ios vaIoies de Ia dinensin.

Lsla eslialegia evila eI uso de SQ| y lases de dalos ieIacionaIes, uliIizando sislenas piopielaiios
de lase de dalos nuIlidinensionaIes (MDD8) y AP|s paia OLAI. Mienlias que Ia infoinacin
en liulo esl en Dala Waiehouses ieIacionaIes, eI culo se naleiiaIiza en una MDD8, es decii,
nanliene Ios dalos cono una naliiz k-dinensionaI lasada en una esliucluia especiaIizada no
ieIacionaI de aInacenanienlo. LI diseadoi de Ia lase de dalos especifica lodas Ias agiegaciones
que consideia liIes. Mienlias se consliuyen Ias esliucluias de aInacenanienlo, Ias agiegaciones
asociadas a lodos Ios rc||-ups posilIes se piecaIcuIan y se aInacenan. As, Ios rc||-ups y dri||-dcuns
se iesponden en lienpos pequeos, peiniliendo poi Io lanlo consuIlas inleiaclivas. Los usuaiios
consuIlan eI culo y eI MDD8 iecupeia eficienlenenle eI vaIoi de una ceIda a pailii de su
diieccin. CeneiaInenle se uliIiza un esquena de nasning solie Ia diieccin de cada ceIda paia
asignai espacio soIanenle a Ias ceIdas piesenles con infoinacin en liulo y no a cada posilIe
ceIda deI culo.

Ioi ejenpIo, en Ia esliucluia Cuoc Ios dalos se exliaen de Ias lase de dalos, se convieilen en
aiiegIos nuIlidinensionaIes y se agiupan de nodo que Ias consuIlas conunes deI culo
iequieian un I/O nnino.
Prnductns
Ailoi's Lsslase |ARj, IRI Lxpiess |IRIj, O3 |ISIj, Miciosofl AnaIysis Seivices |MSSj, Cognos
|CCNj y nuchos olios MDDs son inpIenenlados de esla naneia. Lsla Inea naleiiaIiza lodas
Ias ceIdas deI culo piesenles en Ia infoinacin en liulo, Io que lanlien iequieie nucho espacio.
II.3 5cmI-Estructuradn
Fucntc dc Datns
Muchos lialajos se han ieaIizado en eI nundo acadenico paia ideai nelodoIogas de diseo de
sislenas de Dala Waiehousing capaces de inlegiai Ia infoinacin de diveisas fuenles, en
pailicuIai de lases de dalos heleiogeneas. Delido a que ns oiganizaciones ven Ia vel cono
paile inlegiaI de su eslialegia de conunicacin y negocio, Ia necesidad de inlegiai dalos desde
5
docunenlos XM| en Ios Dala Waiehouses colia cada vez ns inpoilancia. AIgunas
heiianienlas coneiciaIes sopoilan Ia exliaccin de dalos de fuenles XM| paia aIinenlai eI Dala
Waiehouse, peio eI esquena de esle Ilino, as cono eI napeo Igico enlie eI esquena fuenle y
deslino, delen sei definido poi eI diseadoi.

Un enfoque aIleinalivo a diseai desde fuenles XM| consisle en liaducii eslas piineio a un
esquena ieIacionaI equivaIenle, paia Iuego conenzai de esle Ilino a diseai eI Dala
Waiehouse. Lxislen vaiios lialajos aceica de cono liaducii docunenlos XM| en lase de dalos
ieIacionaIes, peio pocos lialan eI piolIena de deleininai Ia caidinaIidad de Ias ieIaciones, Io
que juega un papeI inpoilanle en eI diseo nuIlidinensionaI.

Ln pailicuIai suigen dos lenas cuando se liala esle piolIena. Uno, Ia exislencia de diveisas
lecnicas paia iepiesenlai ieIaciones en XM| (en pailicuIai, DTDs y esquenas), cada una con
dislinlo podei de expiesividad, eI olio, dado que Ios XM| nodeIan dalos seniesliucluiados no
loda Ia infoinacin necesaiia paia eI diseo puede sei deiivada con seguiidad.

|CoIfaieIIiO1lj piopone un enfoque seniaulonlico paia Ia consliuccin deI esquena concepluaI
de un Dalanail pailiendo de Ias fuenles XM| y nueslia cno eI diseo nuIlidinensionaI paia
Ios Dala Waiehouses puede sei ieaIizado diieclanenle solie una fuenle XM|. Su conliilucin es
dolIe: poi un Iado, piopone una ievisin y conpaiacin oiienladas a Dala Waiehouses, de Ios
enfoques paia esliucluiai docunenlos XM|, poi eI olio, piopone un aIgoiilno en eI cuaI eI
piolIena de deducii coiieclanenle que infoinacin es necesaiia, se soIuciona consuIlando Ios
docunenlos XM| de Ias fuenles y, en caso de sei necesaiio, pidiendo ayuda aI diseadoi.
RcpnsItnrIn Mu!tIdImcnsInna!
Olio enfoque en eI esludio de Ios lipos de dalos seniesliucluiados es eI uso de Ios nisnos paia
Ia inpIenenlacin deI Dala Waiehouse.

Ln |HnneiO3j se inlioduce XCuoc, una faniIia de pIanliIIas lasadas en docunenlos XM| paia
aInacenai, inleicanliai y consuIlai dalos de Dala Waiehouses. XCuoc se oiganiza
noduIainenle, de naneia que eI esquena nuIlidinensionaI, Ias desciipciones de Ias
dinensiones y Ios dalos en s nisnos se pueden liansnilii en pasos sepaiados. Las venlajas
esln dadas poi eI uso de eslndaies, Ias desvenlajas poi eI hecho de que Ios docunenlos XML
lienden a sei nuy giandes. Los XCuoc consislen en un sislena de lies esquenas XML
iesponsalIes de expiesai eI esquena nuIlidinensionaI, Ias dinensiones y Ios vaIoies de Ia lalIa
de nedidas: XCuocScncna, XCuocDincnsicn y XCuoc|ac|. Lslos lies esquenas peinilen desciilii
lolaInenle un Da|a-Cuoc, con eI XCuocScncna conleniendo eI esquena nuIlidinensionaI, eI
XCuocDincnsicn Ia esliucluia jeiiquica de Ias dinensiones inpIicadas y eI XCuoc|ac| Ios dalos
de Ia lalIa de nedidas, es decii Ias ceIdas deI culo. Una iazn paia esla desconposicin es Ia
posiliIidad de ieuliIizai aIgunos de eslos docunenlos: poi ejenpIo un docunenlo de
XCuocDincnsicn puede sei conpailido poi vaiios culos o incIuso apIicaciones. Olia iazn es Ia
posiliIidad de nininizai Ia diveisidad de leininoIoga nuIlidinensionaI.

Olia piopuesla de eslndai paia neladala de Dala Waiehouses es Mc|aCuoc-X |NguyenO1j que
lanlien se lasa en XM|. Senejanlenenle a ClM se concenlia piincipaInenle en Ia neladala y
no en Ios dalos de Ia lalIa de hecho, poi Io que no hay sepaiacin enlie eI esquena y Ios dalos de
Ia dinensin.
III. CnmprcsIn
Las lalIas de nedidas o vislas naleiiaIizadas se uliIizan paia nejoiai Ios lienpos de pioceso de
consuIlas, especiaInenle Ias que inpIican giandes agiegaciones de dalos y cosloso jcins de vaiias
lalIas. Lslo inpIica espacios de aInacenanienlo nuy giandes, y geneiaInenle aIlos giados de
dispeisin, Io que ha hecho de Ia conpiesin de dalos una heiianienla nuy inpoilanle y
efecliva.
6

Lxislen vaiias iazones paia Ia necesidad de conpiinii dalos en un Dala Waiehouse
|SiivaslavaO2j. La piineia iazn es que Ios conjunlos nuIlidinensionaIes de dalos cieados poi eI
pioduclo cailesiano de Ias dinensiones pueden sei nuy dispeisos. La segunda iazn es Ia
necesidad de conpiinii Ias desciipciones deI espacio nuIlidinensionaI. A eslas iazones se Ie
suna Ias caiacleislicas inlinsecas a Ios vaIoies de Ios dalos. A nenudo eslos se sesgan a
conjunlos con nuchos vaIoies ceicanos y nuchos vaIoies dispeisos.
III.1 PrnpIcdadcs y RcqucrImIcntns
Las lecnicas noinaIes de conpiesin pueden aIcanzai giandes niveIes de conpiesin, peio no
son usalIes en esle conlexlo, segn Io nosliado en |IuiladoOOj, con excepcin deI aichivado de
dalos a niveI de fiIesyslen. Lslo es poique Ios dalos delen sei conpiinidos de a lIoques,
peidiendo loda capacidad de sei consuIlalIe, degiadando Ia peifoinance e inposiliIilando Ia
lsqueda poi paliones sin incuiiii piineio en coslosas desconpiesiones de lIoques.

Hay vaiios iequeiinienlos que dele cunpIii una luena eslialegia de conpiesin. AIgunos de
eIIos son:
devoIvei Ios iesuIlados exaclos o Io ns apioxinados posilIe paia cuaIquiei consuIla
conpiinii Ios dalos con eficacia
inlegiaise aI conlexlo deI Dala Waiehouse
sei apIicalIe a cuaIquiei conjunlo de dalos de una lalIa de nedidas
liindai lienpos de desconpiesin iguaIes o nejoies que Ios lienpos de Iecluia de Ios
discos paia Ias expIoiaciones secuenciaIes

Ieio Ios iequeiinienlos piincipaIes son Ia capacidad de nanleninienlo de Ios eIenenlos
conpiinidos y Ia posiliIidad de sei consuIlados sin sei desconpiinidos, lodo eslo con luenos
niveIes de peifoinance.

Ls desealIe enlonces, desaiioIIai lecnicas de conpiesin de dalos que peinilan consuIlai Ios
dalos en su foina conpiinida y Ias opeiaciones se puedan ieaIizai diieclanenle en Ios dalos
conpiinidos. TaIes lecnicas piopoicionan geneiaInenle dos napeos. Uno IIanado fcruard
napping que caIcuIa Ia ulicacin en eI conjunlo conpiinido de dalos dada una posicin en eI
conjunlo oiiginaI. LI olio IIanado oac|uard napping que caIcuIa Ia posicin en eI conjunlo
oiiginaI dado una ulicacin en eI conjunlo conpiinido. Un nelodo de conpiesin es napping-
ccnp|c|c si piopoiciona fcruard napping y oac|uard napping. Los nelodos de conpiesin
napping-ccnp|c|c son geneiaInenle usados paia lases de dalos nuIlidinensionaIes. Muchas
lecnicas de conpiesin son napping-ccnp|c|c, cono sei Ia ncadcr ccnprcssicn, 8AP ccnprcssicn y
cnun|-cffsc| ccnprcssicn.

Un piocedinienlo de conpiesin paia MDls se nueslia en |SiivaslavaO2j y consisle en piineio
aInacenai cada conjunlo en un aiiegIo nuIlidinensionaI segn Ios vaIoies de Ia dinensin.
Luego, esle es liansfoinado en un aiiegIo Iineaiizado poi nedio de una funcin adecuada.
IinaInenle, eI aiiegIo Iineaiizado es conpiinido poi un nelodo de conpiesin napping-
ccnp|c|c.

Un piocedinienlo de conpiesin paia RDls se nueslia en |CoIdslein98j, en eI un iegislio
conpiinido se puede idenlificai poi un pagc-id y un s|c|-id de Ia nisna naneia que Ios iegislios
sin conpiinii son idenlificadas en un D8MSs convencionaI. La naneia en que se uliIiza eI
idenlificadoi de iegislio no canlia con Ia conpiesin.
III.2 TcnIcas
Ln |IuiladoOOj se piesenla |Ccnprcss, una lecnica de conpiesin de infoinacin que nanliene
Ia piopiedad de consuIla sin necesidad de desconpiinii Ios dalos. Lsla lecnica es apIicalIe a Ios
dalos de Ias lalIas de nedidas, sunaiizacin y culos. Lsl diseado paia inlegiaise aI anlienle
7
deI Dala Waiehouse y se lasa en eI ieenpIazo de Ios dalos oiiginaIes poi vaIoies apioxinados
de Ios aliilulos, aInacenando oi|ccdcs conpaclos.

|CoIdslein98j inlioduce un aIgoiilno de conpiesin/desconpiesin a niveI de pgina de dalos
en esliucluias ieIacionaIes. LxpIoia lanlien eI uso de oidenanienlo lipo 8-Trcc solie dalos
conpiinidos as cono solie Ios dalos oiiginaIes.

Los niveIes de desconpiesin nosliados en |CoIdslein98j son ns ipidos que Ios lienpos de
Iecluia lpicos de Ios discos paia expIoiaciones secuenciaIes. Lsle aIgoiilno es sinpIe, y puede
agiegaise fciInenle a Ia capa de adninisliacin de aichivos de un RD8MS, pueslo que sopoila
Ia lecnica usuaI de idenlificai un iegislio poi eI pai (pagc-id, s|c|-id). Iuede desconpiinii
iegislios individuaIes sin necesidad de desconpiinii loda Ia pgina. Tanlien nejoia Ias
esliucluias de ndice 8-|rccs y R-|rccs noloiianenle ieduciendo eI nneio de pginas de hoja y
conpiiniendo enliadas deI ndice. Lsle aIgoiilno liene Ia desvenlaja de que conpiine
soIanenle canpos nuneiicos, sin enlaigo, Ias lalIas de nedidas en Dala Waiehouses conlienen
nuchos canpos nuneiicos y de laja caidinaIidad, y nuy poco de lexlo.

Ln |SiivaslavaO2j se piesenla un conjunlo de aIgoiilnos de agiegacin en Dala Waiehouses
conpiinidos paia OLAI nuIlidinensionaIes. Lslos aIgoiilnos funcionan diieclanenle solie Ios
conjunlos conpiinidos nedianle aIgn nelodo napping-ccnp|c|c, sin Ia necesidad de
desconpiiniiIos. Tanlien se liinda un piocedinienlo de decisin, paia seIeccionai eI aIgoiilno
de agiegacin ns eficienle, lasado en Ia consuIla y nenoiia disponilIe, as cono lanlien eI
conjunlo de painelios dados paia Ia consuIla.
IV. ndIccs
Uno de Ios piincipaIes lenas de invesligacin en eI diseo fsico se iefieie a Ia seIeccin plina
de ndices |Haiinaiayan97j, que se lasa en eI esquena Igico y en Ia caiga de lialajo, y iequieie
que se lonen en cuenla esliucluias especficas de acceso. Los ndices, poi Io lanlo, juegan un
papeI ciuciaI en Ia peifoinance deI OLAI.

Los pasos paia agiegai ndices van de lecnicas sinpIes, cono ndices secundaiios, a esliucluias
conpIejas, cono Ias que se nosliain nas adeIanle. Ln geneiaI se piensa que eI nejoi
sulconjunlo de ndices es eI que ieduce aI nnino eI coslo de acceso. Si lien en Ia nayoia de Ios
casos cuaIquiei esliucluia de ndice iesueIve Ios iequeiinienlos de peifoinance, eI piolIena es
eI coslo asociado. Cuando eI diseadoi liene Ia posiliIidad de ponei unos o ns ndices en una
ieIacin paia nejoiai cieilas consuIlas, Ia venlaja de naleiiaIizai una visla puede sei afeclada
poi eI espacio que, invaiialIenenle, dicho ndice va a uliIizai. Adens deI coslo en espacio se
agiega eI lienpo de cieacin, adninisliacin de dalos y oveihead de aIgunas opeiaciones.
IV.1 PrnpIcdadcs y RcqucrImIcntns
Dado que Ios sislenas OLAI nanejan enoines voInenes de infoinacin se hace necesaiio
conlai con esliucluias de ndices eficienles, que consunan poco espacio y que su cieacin y
nanleninienlo consunan pocos iecuisos.

Iueslo que Ios Dala Waiehouses son geneiaInenle acluaIizados cff-|inc, Ios ndices se pueden
ieoiganizai peiidicanenle de foina de agiupai sus enliadas plinanenle. Ioi Io lanlo, no es
necesaiio ieaIizai eI nanleninienlo de Ios ndices cuando ocuiien acluaIizaciones de dalos, Io
que peinile adoplai poi esliucluias ns conpIejas sin que eslo iepeicula negalivanenle en Ios
lienpos de iespuesla de Ias consuIlas ieaIizadas.

|ONeiI97j indica que puede sei desealIe, en un anlienle de Dala Waiehouses, lenei ns de un
lipo de ndice disponilIe en una coIunna paia podei eIegii eI nejoi paia cada consuIla.

8
|Zhuge95j indica a su vez, que eI pioceso de cieacin de ndices no dele consunii denasiado
lienpo, de olia foina Ia opeiacin se podia ejeculai ns eficienlenenle sin eI nisno. Ls decii,
eI ndice puede no sei pailicuIainenle liI si Ia ejecucin de Ia opeiacin sin eI ndice es vaiias
veces ns ipida que eI lienpo lolaI de ejeculaiIa, incIuyendo eI lienpo de consliuii eI ndice.
Ioi supueslo, Ios ndices se uliIizan a nenudo, aunque consuna nucho lienpo en su cieacin, si
Ios dalos indexados se consuIlan iepelidas veces. Ln esle caso, eI lienpo de consliuii eI ndice es
anoilizado poi eI nneio de consuIlas hechas solie Ios dalos indexados.

AI indexai coIunnas de una lalIa de nedidas, aInacenai eI ndice y Ia coIunna coiiespondienle
en Ia lalIa de nedidas iesuIla en una dupIicacin de dalos. Ln laIes siluaciones, puede sei
ieconendalIe soIo aInacenai eI ndice si Ios iegislios oiiginaIes de Ia lalIa se pueden ieconsliuii
fciInenle a pailii deI ndice, segn Io piesenlado en |Dalla99j.
IV.2 Estructuras
Ln geneiaI un ndice es cuaIquiei esliucluia de dalos que lona cono enliada cieila piopiedad de
Ios iegislios, lpicanenle Ios vaIoies de uno o ns canpos
1
, y peinile enconliai de foina ipida
Ios iegislios que Ia cunpIe.

Los ndices se cIasifican en unidinensionaIes o nuIlidinensionaIes en lase aI nneio de canpos
que inleiviene en eI.

Los ndices unidinensionaIes son aqueIIas esliucluias de acceso que aceplan un nico
scarcn-|cq y en lase a Ios vaIoies de esle ieloinan Ios iegislios coiiespondienles.
Los ndices nuIlidinensionaIes son aqueIIas esliucluias de acceso que aceplan ns de
un scarcn-|cq y en lase a Ios vaIoies de eslos ieloinan Ios iegislios coiiespondienles.

Si paia iesoIvei consuIlas nuIlidinensionaIes se enpIeaian esliucluias de ndices
unidinensionaIes paia cada dinensin, eI espacio en disco necesaiio y eI nneio de enliada-
saIida iequeiido paia ollenei Ios punleios a Ios iegislios candidalos de cada dinensin seia lan
giande que no pioduciian venlajas en Ia peifoinance deI sislena O|AP. Ioi esle nolivo es que
en geneiaI se uliIizan esliucluias de ndices nuIlidinensionaIes. Lslas se cIasifican segn su
esliucluia sulyacenle en dos giupos, Ias lasadas en iloIes y Ias lasadas en funciones de hash.
Basadas cn rbn!cs
Un esquena sinpIe lasado en iloIes puede veise cono un ndice de ndices, o de naneia ns
geneiica, un iloI en eI que Ios nodos de cada niveI son ndices paia una dinensin, cono se
nueslia en Ia figuia 1.


Iiguia 1: Lsliucluia lasada en iloIes


1
Los canpos en Ios que se lasa un ndice son IIanados scarcn-|cq (cIave de lsqueda).
9
LI ndice 8-|rcc (cieado poi ayei y McCieighl en 1972) y sus vaiianles oiganizan Ios dalos de
una naneia jeiiquica y es, poi Iejos, Ia esliucluia de ndice nas uliIizada en lase de dalos
ieIacionaIes.

Los ndices 8-|rcc |Caede98j son iloIes laIanceados
2
en eI que cada nodo inleino conliene
punleios a olios nodos coiiespondienles a inleivaIos, siendo geneiaInenle Ias hojas Ias que
conlienen Ios punleios a Ios dalos. Dependiendo deI lipo de 8-|rcc Ios nodos inleiioies podian
lenei punleios a dalos. Los 8-|rccs lienen un Inile supeiioi e infeiioi paia eI nneio de
descendienles de un nodo. LI Inile infeiioi pieviene Ia degeneiacin de Ios iloIes y conduce a
una uliIizacin eficienle deI aInacenanienlo. LI Inile supeiioi sigue eI hecho de que cada nodo
deI iloI coiiesponda exaclanenle a una pgina de disco.

Lsle lipo de ndice es unidinensionaI, poi Io que en eI anlienle OLAI no es nuy usado. No as
sus vaiianles, cono poi ejenpIo Ios 8
+
-Trcc, Ios U8-Trcc, Ios R-Trcc (junlo con sus vaiianles), Ios
X-Trcc y Ios DC-Trcc, que son nuIlidinensionaIes.

LI 8
+
-Trcc |Dalla99, ONeiI97j es una vaiianle deI 8-Trcc y es nuy uliIizado en Ios sislenas
ieIacionaIes paia iecupeiai iegislios de una lalIa a liaves de vaIoies especificados que inpIican
unas o ns coIunnas. Cada enliada en eI ndice a niveI de hoja apunla a una Iisla de R|Ds
3
de
iegislios que conlienen Ios dalos. Iaia cuaIquiei |cq-ta|uc dado, eslo es paia cada vaIoi dislinlo
conlenido en Ia coIunna de Ia lalIa, Ia Iisla geneiada se aInacena en una cadena de lIoques de
dalos.

Una nejoia significaliva aI 8
+
-Trcc esl dada poi Ios U8-Trcc (UniveisaI -liee) |IenkxOO,
ayei97j. Se Ie IIana as a cuaIquiei vaiianle de 8-|rcc en eI cuaI Ios |cq-ta|ucs son diiecciones de
iegiones oidenadas poi cieila funcin. Las pginas hojas nanlienen oljelos o sus idenlificadoies
en iegiones. Iiovee una peifoinance Iogailnica paia opeiaciones lsicas de inseicin, loiiado
y consuIla, y una uliIizacin de pgina deI 5O deI oiiginaI.

Una geneiaIizacin deI 8-Trcc esl dada poi R-Trcc (cieado poi Cullnan en 1984). |LsleiO1,
Caede98j geneiaIiza eI 8-|rcc de 1-dinensin a espacios de dalos d-dinensionaIes, es decii un R-
|rcc naneja hipeiieclnguIos d-dinensionaIes en Iugai de |cq-ta|ucs nuneiicos 1-dinensinaIes.
Un R-|rcc puede oiganizai oljelos exlendidos, laIes cono poIgonos, usando M8R (Mininun
8cunding Rcc|ang|cs) cono apioxinaciones, as cono punleios a oljelos cono caso especiaI de
ieclnguIos. Iaia iesoIvei una consuIla, piineio se deleinina eI conjunlo de MRs que iesponde
Ia consuIla enpezando poi Ia iaz y Iuego se luscan Ias iefeiencias a sus nodos hijos hasla IIegai
a Ias pginas de dalos. LI R
+
-Trcc (SeIIis el aI. 1987) |Caede98j Ls una vaiianle deI R-Trcc en Ia que
no se peinile soIapanienlo enlie Ias iegiones.

Las inseiciones aIealoiias no soIo son nuy Ienlas, delido a Ia conlinua ieoiganizacin deI
espacio, sino que lanlien desliuyen Ios cIusleis de dalos en lodos Ios esquenas
nuIlidinensionaIes de indexacin de diiecciones. LI pac|cd R-Trcc (cieado poi RoussopouIos en
1987) |RoussopouIos97j evila eslos piolIenas, cIasificando piineio Ios oljelos en cieilo oiden y
caigando eI R-|rcc desde eI aichivo, oidenado y enpaquelando Ios nodos hasla su nxina
capacidad. Lsle nelodo de enpaquelanienlo oidenado aIcanza exceIenles niveIes de
cIusleiizacin y ieduce significalivanenle Ia soliecaiga y espacios nueilos.

X-Trcc (cieado poi eichloId en 1996) liene cieilas venlajas iespeclo aI R-Trcc en Ios casos en que
Ios vaIoies son iefeienciados poi una gian canlidad de dinensiones. LI ndice X-|rcc
|eichloId96, LsleiO1j se ha diseado paia lialajai eficienlenenle con vaIoies giandes de
dinensiones. Si Ia lopoIoga eslndai divide Ios iesuIlados con un aIlo giado de soIapanienlo, eI
X-|rcc inlenla enconliai una divisin de nnino soIapanienlo lasada en Ia hisloiia de
divisiones. Si eI nneio de eIenenlos en una de Ias pailiciones iesuIlanles esl poi delajo de un

2
Significa que lodos Ios caninos desde Ia iaz a Ias hojas lienen eI nisno Iaigo.
3
RID: Idenlificadoi de Regislio
1O
unliaI dado, Ia divisin sei denasiado desequiIiliada y, poi Io lanlo, eI aIgoiilno de pailicin
leininai sin pioducii divisin. Ln esle caso, eI nodo acluaI se anpIa paia conveiliise en un
supeinodo nIlipIo deI lanao de lIoque eslndai.

DC-Trcc |LsleiO2j es un ndice jeiiquico esliucluiado siniIai aI X-|rcc que expIola eI conceplo de
jeiaiquas definidas lpicanenle paia Ias dinensiones de un culo. LI ndice DC-Trcc uliIiza
secuencias desciiplivas nninas y eI oiden paiciaI de Ios vaIoies de Ios aliilulos inducidos poi
Ias jeiaiquas, en Iugai de M8R y oidenanienlo ailificiaI lolaI (ar|ificia| |c|a| crdcring).

LI ndice |-d-|rcc |Caede98j es unas de Ias ns pioninenles esliucluias nuIlidinensionaIes. Ls
un iloI linaiio de lsqueda que iepiesenla eI univeiso d-dinensionaI de infoinacin poi
nedio de suldivisiones iecuisivas en espacios de (d-1)-dinensiones. Cada nodo deI iloI
conliene un aliilulo y un vaIoi, Io que peinile dividii Ios hijos en aqueIIos que poseen vaIoies
nayoies de Ios que poseen vaIoies nenoies. Ln dislinlos niveIes deI iloI Ios nodos pueden
hacei iefeiencia a dislinlos aliilulos. La desvenlaja de eslos ndices es que Ia esliucluia es
sensilIe aI oiden en que son inseilados Ios punleios. AIgunas vaiianles de esle ndice (cono eI
adap|a|itc |-d-|rcc, o eI oin|rcc), que pueden veise en |Caede98j, soIucionan esle piolIena.

LI ndice Quad-Trcc |LsleiO1, Caede98j es un ndice donde Ias enliadas de Ios nodos consislen en
Ia desciipcin de un culo secundaiio y eI nxino vaIoi de Ia nedida naleiiaIizado paia esle.
Basadas cn FuncInncs dc Hash
Las funciones de nasn pueden iecilii una Iisla de vaIoies de aliilulos cono aigunenlo y ieloinai
cono iesuIlado eI punleio a Ia infoinacin soIicilada. Lslo hace aliaclivas Ias funciones de nasn
paia sei uliIizadas en esliucluias de acceso. CeneiaInenle se enpIea una funcin de nasn
conpuesla de K funciones de nasn, cada una apIicalIe a una de Ias K dinensiones, cono se
nueslia en Ia figuia 2.


Iiguia 2: Lsliucluia lasada en funciones de hash

LI |incar Hasning |ndcx (cieado poi Laison en 198O) divide eI univeiso |A,) de posilIes vaIoies
de nasn en inleivaIos linaiios de lanaos (- A) / 2
k
o (- A) / 2
k + 1
paia k > O. Cada inleivaIo
coiiesponde a un ouc|c|. Un punleio l |A,) sepaia Ios inleivaIos chicos de Ios giandes: Ios
inleivaIos de lanao (- A) / 2
k
van a Ia izquieida de l y Ios de lanao (- A) / 2
k + 1
a Ia
deiecha.

Olia opcin es eI 8udq Trcc (cieado poi Seegei y KiiegeI en 199O), un esquena dinnico de nasn
con un diiecloiio esliucluiado en foina de iloI. LI iloI es consliuido poi sucesivas
inseiciones, coilando eI univeiso iecuisivanenle en dos pailes deI nisno lanao con
hipeipIanos iso-oiienlados.
11

Un caso pailicuIai de indice lasado en hash es eI oi|nap indcx |LsleiO1, ONeiI95, ONeiI97,
Dalla99j. Ln eIIa, Ias pginas hojas de una esliucluia de ndice no conlienen Iislas de R|Ds, sino
vecloies de lils con un lil paia cada iegislio. LI lil liene vaIoi 1 en eI oi|nap si eI iegislio
conliene eI vaIoi en Ia Iisla iepiesenlada, si no, eI lil liene vaIoi O. Lsla lecnica es pailicuIainenle
aliacliva cuando eI conjunlo de |cq-ta|ucs posilIes en eI ndice es pequeo y con una gian
canlidad de iegislios, ejenpIo un ndice solie un aliilulo geneio, donde CLNLRO = 'M' o
CLNLRO = 'I. Cuando una gian canlidad de vaIoies exislen en un ndice, es piolalIe que cada
uno de Ios oi|naps sea nuy dispeiso, es decii, nuy pocos lils sein 1 en Ios oi|naps, dando poi
iesuIlado iequeiinienlos de aInacenanienlo nuy giandes paia aInacenai nuchos ceios. Ln laI
caso, se uliIizan oi|naps conpiinidos, o se canlia Ia iepiesenlacin de lilnap a Iisla de R|D
cono en |ONeiI95j.

Usai ndices de lipo oi|nap liinda enoines venlajas en peifoinance y espacio. Iaia conenzai, eI
I/O es ieducido cuando una fiaccin giande de una lalIa giande es iepiesenlada usando un
oi|nap y no una Iisla de R|D. Ioi ejenpIo, un oi|nap paia un conjunlo de 1O niIIones de iegislios
iequeiii un nxino de soIanenle aIgunos negalyles de aInacenanienlo (1O niIIones de lils =
1.25 niIIones de lyles) de esla foina Ios oi|nap pueden sei aInacenados en nenoiia, y Ia Iisla de
R|Ds iepiesenlada se nanliene aulonlicanenle en oiden segn Ios R|Ds. Adens, Ias
opeiaciones ns conunes usadas paia conlinai piedicados, Y y O, se pueden ieaIizai
usando insliucciones nuy eficienles que pueden sei ejeculadas en paiaIeIo en 32 o 64 lils en Ia
nayoia de Ios piocesadoies.

Ioi olio Iado Ios oi|nap indcx son ndices esllicos poi Io que en Ia inseicin de un iegislio lodas
Ias enliadas deI ndice lienen que sei despIazadas. |ONeiI97j discule vaiios lipos de esliucluias
oi|nap indcx convenienles.

LI ndice oi|-s|iccd |Dalla99, ONeiI97j sigue eI nisno piincipio que eI prcjcc|icn indcx y eI oi|nap
indcx: eI vaIoi de Ia coIunna indexada paia cada iegislio en Ia lalIa se iepiesenla en ese oiden en
eI ndice. Sin enlaigo, cada vaIoi "se ielana" en vez de sei aInacenado en su foina oiiginaI. Ls
decii, cada posicin de lil en Ia coIunna que es indexada se aInacena en una cadena sepaiada
deI lIoque de dalos.

Los Grid |i|cs (cieados poi NieveigeIl en 1984) enpIea un diiecloiio y una pailicin deI doninio
de naneia de iesoIvei un pedido con soIo dos acceso a disco. LI diiecloiio es inpIenenlado
geneiaInenle poi nedio de una funcin de nasn Io que iesuIla en giiIIas de lanaos y foinas
heleiogeneas. LI |xcc|| |ndcx (LxlendilIe CeII) |Caede98j (cieado poi Tanninen en 1992) es una
vaiianle deI Grid |i|c en Ia que Ias iegiones en Ias que se desconpone eI univeiso es unifoine.
OrIcntadas a JnIns
Iueslo que Ias consuIlas OLAI iequieien geneiaInenle uno o ns jcins, Ia seIeccin de ndices
dele consideiai Ios difeienles aIgoiilnos de jcins. Si lien esla seccin no cIasifica Ios ndices poi
su esliucluia sulyacenle vaIe Ia pena iesaIlai que, delido aI gian voIunen de dalos y eI aIlo
nneio de joins invoIuciados, una caiacleislica desealIe es que Ios ndices peinilan iesoIvei
ipidanenle Ios joins.

Mienlias que Ios ndices liadicionaIes de lalIas napean Ios vaIoies de Ias coIunnas a Ios
iegislios que Ios conliene (geneiaInenle nedianle un RID), un jcin indcx |ONeiI95, ONeiI97j
asocia Ios vaIoies de una coIunnas de dos lalIas. De esla naneia, eI jcin indcx iepiesenla un join
piecaIcuIado conpIelanenle. Ls una foina especiaI de visla naleiiaIizada. Oiganizaciones
lpicas paia un jcin indcx incIuyen 8-|rccs o nasn indcx. Con jcins piecaIcuIados, lanlien es posilIe
lenei acceso a iegislios de una lalIa poi vaIoies aililiaiios de una coIunna en Ia segunda lalIa.

Los jcin indcx pueden sei geneiaIizados de dos lalIas a nIlipIes lalIas. Lsla geneiaIizacin es
conocida cono dcnain indcx ya que asocian Ios vaIoies de un doninio (poi ejenpIo nneios de
Seguiidad SociaI) a lodas Ias coIunnas de lalIas en Ia lase de dalos en Ias que se encuenlien
12
eslos vaIoies. Tpicanenle, hay soIo una lalIa paia Ia cuaI Ia coIunna indexada es cIave, paia Ias
ieslanles geneiaInenle es una cIave exleina, y nuchos iegislios pueden conlenei eI nisno vaIoi
de coIunna.

Olia opcin a Ia hoia de inpIenenlai un ndice oiienlado a jcins, es eI prcjcc|icn indcx |Dalla99,
ONeiI97j. LI nisno consisle en una copia espejo de una coIunna especfica de una lalIa. Las
enliadas en eI ndice apaiecen en eI nisno oiden que Ias coiiespondienles |cq-ta|ucs de Ia lalIa
sulyacenle, Io que piopoiciona un napeo eficienle de Ias |cq-ta|ucs a Ios iegislios de Ia lalIa. La
coIunna pioyeclada, que puede o no sei dupIicada, es aInacenada cono una cadena de unos o
ns lIoques de dalos.
V. 5c!cccIn dc VIstas c ndIccs
Los sislenas de Dala Waiehouse son en geneiaI un ieposiloiio de vislas naleiiaIizadas,
diseadas con un enfoque g|coa| as ticu, de dalos ollenidos de vaiias fuenles, inlegiados y
piocesados. Ieio dado eI gian voIunen de dalos cale piegunlai: Que vislas hay que
naleiiaIizai` Ls posilIe nejoiai eI iendinienlo deI Dala Waiehouse naleiiaIizando vislas
inleinedias` Que esliucluias de dalos o ndices hay que agiegai` Mejoias en Ia peifoinance no
inpIican soIo eI lienpo de iespuesla a consuIlas, sino lanlien eI lienpo necesaiio paia ieaIizai
Ia acluaIizacin de Ias esliucluias sulyacenles enpIeadas.

Los sislenas OLAI esln oiienlados piincipaInenle a opeiaciones de consuIlas solie giandes
voInenes de dalos. Los dos piincipaIes facloies que infIuyen en eI incienenlo de Ia
peifoinance de esle lipo de sislenas son, eI aInacenanienlo de Ios iesuIlados piecaIcuIados,
vislas y vislas inleinedias, y Ia uliIizacin de esliucluias apiopiadas lanlo de dalos cono de
ndices.

Lxislen vaiias eslialegias de diseo que apunlan a nejoiai Ia peifoinance de esle lipo de
sislenas. La liiviaI y con Ia que se olliene eI nejoi iendinienlo es Ia naleiiaIizacin de lodas Ias
vislas, incIuyendo Ias inleinedias, junlo a vaiias esliucluias de ndices. Lslo inpIica diseai una
visla paia cada consuIla ns eI conjunlo de ndices asociado. Lsla eslialegia iequieie nucho
espacio de aInacenanienlo, nucho lienpo de caiga deI sislena y nuchos iecuisos de
adninisliacin y geslin de Ias esliucluias de dalos e ndices. Lslo hace que Ia eslialegia lenga
un coslo inpIenenlacin denasiado aIlo paia inpIenenlaise en Ia nayoia de Ios Dala
Waiehouse, nas aII de Ias venlajas ollenidas en Ia peifoinance.

LI piolIena que se pIanlea en Ia elapa de diseo de un sislena OLAI es eI de seIeccionai un
conjunlo de vislas a naleiiaIizai y un conjunlo de ndices a cieai, que nejoie lanlo Ios lienpos
de Ias opeiaciones de consuIlas cono de acluaIizacin, iespelando aIgunas iesliicciones,
piincipaInenle de espacio |Cupla97j.
V.1 Cnstns y OptImIzacInncs
AI lialajai en un piolIena de oplinizacin, Io piineio a deleininai son Ias nedidas o vaiialIes
solie Ias que se dele ieaIizai Ia nisna. Ln esle caso Ios lialajos de invesligacin ieaIizados hasla
eI nonenlo |Cupla97, Haiinaiayan97, Lalio97, eIIaliecheOO, Lzeife97, Yang97, Haiinaiayan96j
coinciden en que eI coslo de piocesai una consuIla Q liene ieIacin diiecla con eI nneio de
iegislios piocesados poi Ias consuIlas en Ios esquenas fuenles, solie ieIaciones en Ias que no se
consideia Ia exislencia de ndices. Ln caso de exislii ndices solie Ios aliilulos en Ios que se
ieaIiza Ias consuIlas, eI coslo eslaia dado poi una conslanle que dependeia deI lipo de ndice a
uliIizai. De naneia anIoga, aI veise Ia acluaIizacin de una visla cono Ia ejecucin de consuIlas
solie Ias lases de dalos fuenles, eI coslo de geneiacin deI iesuIlado nanlendi lanlien una
ieIacin diiecla con Ia canlidad de iegislios que conlenga. Ln eI caso de que Ias consuIlas a
ieaIizaise conlengan senlencias deI lipo GROUP 8Y, se dele consideiai Ia canlidad de iegislios
difeienles iespeclo a Ios vaIoies en Ios aliilulos que se encuenlian en Ia senlencia
13
|Haiinaiayan96, Cupla97j. La canlidad puede sei ollenida nedianle anIisis esladslico de Ios
lipos deI aliilulo consideiado.

Olio conponenle a definii en esle lipo de piolIenas es Ia funcin de oplinizacin. Lsla se define
cono Ia nejoia inlioducida poi Ia naleiiaIizacin de Ia visla nenos eI coslo de acluaIizacin de
Ia nisna |Yang97j. De esla naneia, si Cnain| es eI coslo asociado aI nanleninienlo y 8Q

eI
leneficio inlioducido a Ia consuIla Q, eI leneficio de naleiiaIizai Ia visla en eI esquena eslai
dada poi:
int mat Q ma
B B C =

8Q esla dada poi Ia ieduccin de Ia canlidad de iegislios que dele piocesai Ia consuIla diiecla o
indiieclanenle. LI leneficio puede veise afeclado no soIanenle poi Ias vislas que se consuIlan
diieclanenle sino lanlien poi lodas aqueIIas inpIicadas en eI pioceso. De esla naneia, si una
visla naleiiaIizada no ieduce Ia canlidad de iegislios con iespeclo a Ias vislas fuenles no dele
sei consideiada, ya que Io nico que agiega es un coslo, en esle caso de nanleninienlo, y no un
leneficio. Olio facloi inpIicado es eI espacio uliIizado lanlo paia naleiiaIizai Ia visla cono Ios
ndices |Haiinaiayan97, eIIaliecheOOj.

Olios lialajos consideian ns painelios paia Ia oplinizacin. Ioi ejenpIo |Lzeife97j consideia
ieIevanles Ia nenoiia uliIizada y eI leneficio en eI uso de Ia CIU, ya que eslos infIuyen en eI
lienpo de iespuesla de una consuIla y poi Io lanlo consideia que delen sei lonados en cuenla.
V.2 CaractcrIzacIn dc! Prnb!cma
AI esludiai eI piolIena de Ia seIeccin de vislas e ndices en un Dala Waiehouse, es inleiesanle
anaIizai a piioii cuaI es eI oiden de nagnilud deI piolIena que se pielende alacai.

Suponiendo que se lienen n ieIaciones a consideiai en eI piolIena, Ia canlidad de posilIes
conlinaciones que peinile deleininai Ias vislas que polenciaInenle pueden sei naleiiaIizadas,
es 2
n
. CuaIquiei sulconjunlo de polenciaIes vislas puede sei Ia posilIe soIucin, poi Io que eI
oiden deI piolIena es
( )
2
2
n
O |Lalio97j. ReaIizando un iazonanienlo anIogo paia eI conjunlo
de ndices se olliene que eI oiden deI piolIena lanlien es
( )
2
2
n
O .

Ln |Cupla97j se nueslia eI piolIena de Ia seIeccin de ndices cono una ieduccin deI
piolIena de culiinienlo nnino de un giafo
4
. Lsle piolIena es NI-ConpIelo |Aho83j. Ioi Io
lanlo, no exisle un aIgoiilno de oiden poIinnico que soIucione eI piolIena. Ioi esla iazn
geneiaInenle Ias piopueslas no luscan Ia soIucin plina sino una soIucin que sea ceicana a
esla. CIaio esl que aIgunas soIuciones se aceican ns que olias a Ia plina, leniendo cono
consecuencia que Ios aIgoiilnos lengan giados de ejecucin ns ceicanos aI deI piolIena
oiiginaI. Ioi Io lanlo dele enconliaise un equiIiliio enlie una soIucin aceplalIe y un lienpo de
ejecucin aceplalIe paia haIIai dicha soIucin.

Los aIgoiilnos que se esludiain peilenecen a Ia calegoia de aIgoiilnos grccdq (vido o
exhauslivo) |Aho83j, de inleIigencia ailificiaI o agenles disliiluidos.
V.3 MatcrIa!Izandn VIstas
La nayoia de Ios aIgoiilnos uliIizados paia iesoIvei esle piolIena peilenecen a Ia calegoia de
aIgoiilnos vidos. La difeiencia de Ias soIuciones piopueslas iadica en eI nodeIo con eI cuI se
iepiesenlan Ias inleiacciones enlie Ias dislinlas vislas finaIes e inleinedias.


4
Olio ejenpIo de una ieduccin a esle piolIena es eI piolIena deI agenle viajeio.
14
La Inea de invesligacin ns fueile en eI lena se lasa en eI esludio de Ias consuIlas ns
fiecuenles, que se nodeIan con aIgn lipo de giafo de dependencia que Iuego es esludiado cono
un piolIena conocido en eI iea de giafos. La apIicacin de Ios aIgoiilnos piopicios paia dichos
piolIenas ayuda a desaiioIIai una soIucin finaI.

Un enfoque en esla Inea es Ia geneiacin de esliucluias nuIlidinensionaIes de dependencia
IIanados |a||iccs |Haiinaiayan96j. Los |a||iccs son una caiacleiizacin de Ias dependencias enlie
Ias vislas cono se nueslia en Ia Iiguia 3. Dado un facloi de coslo asociado a cada una de Ias
dislinlas polenciaIes vislas, lasado en Ia canlidad de iegislios (a nayoi canlidad de iegislios
nayoi coslo de nanleninienlo y nayoi iendinienlo de Ias consuIlas que Ia uliIicen), se eslalIece
una ieIacin de dependencia enlie eIIas. La ieIacin de dependencia se lasa en eI cIcuIo deI
leneficio de agiegai una visla aI conjunlo a naleiiaIizai, Io que se iepiesenla cono 8(t,S). Lsla
nedida no soIo depende deI leneficio diieclo en Ia ejecucin de Ias consuIlas que se ieaIizan
solie Ia visla, sino que lanlien deI leneficio indiieclo de sei uliIizada cono fuenle inleinedia
poi olias vislas.

Solie eI |a||icc se define un aIgoiilno de lipo vido que agiega, en cada paso, Ia visla con nayoi
leneficio de lodas aqueIIas que an no peilenecen a Ia soIucin. La canlidad de pasos dele sei
eslinada a pailii de Ias posiliIidades de aInacenanienlo disponilIes paia ieaIizai Ias
naleiiaIizaciones, eI cIcuIo de esle vaIoi no se especifica en eI lialajo esludiado. Ioi olio Iado s
se eslalIece eI nnino plino deI aIgoiilno.

Ln |Haiinaiayan96j se denueslia que eI aIgoiilno piesenlado olliene un leneficio que es, cono
nnino, un 63 deI leneficio oplino enconliado poi eI aIgoiilno exhauslivo. LslalIece lanlien,
dos casos en Ios que se olliene una soIucin plina. Ln aqueIIos piolIenas en Ios que eI
leneficio de naleiiaIizai una visla es iguaI paia lodas Ias vislas candidalas y en aqueIIos en eI
que exisle una visla cuyo leneficio es nucho nayoi aI deI ieslo de Ias vislas.



Iiguia 3: |a||icc paia Ios aliilulos par|, supp|icr y
cus|cncr cono se especifica en |TICD95j.

Una adaplacin a Ios |a||iccs es nosliada en |Yang97j. AII se define una esliucluia IIanada
Mu||ip|c Vicu Prcccssing P|an (MVPP), un conjunlo de iloIes cuyos nodos pueden sei conunes.
Cada uno de Ios nodos puede sei, poi ejenpIo, eI jcin de dos lalIas o eI jcin de iesuIlados
anleiioies. Cada uno de Ios iloIes se coiiesponde con eI pIan de ejecucin de Ias consuIlas
|LInasii94j. Lslo inlioduce un canlio iespeclo a |Haiinaiayan97j, ya que en ese lialajo se
lonalan cono vislas posilIes lodas Ias conlinaciones de aliilulos que pudieian daise en eI
CROUI Y de una consuIla. Ln esle lialajo sin enlaigo se lona en cuenla soIo aqueIIas vislas
que pueden sei uliIizadas paia iespondei Ias consuIlas que eI diseadoi deI Dala Waiehouse
consideie peilinenle. Ioi Io lanlo, eI piolIena de naleiiaIizacin de vislas se divide en dos
elapas: un piinei paso que consisle en Ia geneiacin deI MVPP a pailii de Ias consuIlas
ieIevanles y en un segundo que consisle en Ia seIeccin de Ias vislas a pailii deI MVPP.
15

LI leneficio se caIcuIa de naneia diiecla cono se defini en Ia seccin Ccs|cs q Op|inizacicncs,
eI coslo de nanleninienlo de Ias posilIes vislas lanlien esl dado poi Ia canlidad de iegislios
que eslas posean. La difeiencia enlie eI leneficio de naleiiaIizai Ia consuIla y eI coslo de
nanleninienlo se Ie IIana peso de Ia visla. CeneiaInenle se oidenan Ias vislas segn su peso
de nayoi a nenoi, lonando Ias dislinlas vislas y iecaIcuIando eI leneficio lolaI lonando en
cuenla Ias vislas que, segn eI aIgoiilno, son paile de Ia soIucin. Si Ia visla nejoia aI
iendinienlo lolaI, esla es agiegada a Ia soIucin. Lslo, junlo con un aIgoiilno de geneiacin de
MVPP confoina eI nelodo piopueslo.

Si lien esle aIgoiilno es de oiden IineaI, no se indica que lan efeclivo es iespeclo a Ia soIucin
plina. Olio punlo que Ia piopuesla no lona en cuenla es eI espacio a uliIizaise. Ioi Io lanlo se
puede seIeccionai Ia naleiiaIizacin de una visla que de un luen iesuIlado (eI nejoi segn eI
aIgoiilno) en cuanlo a peifoinance peio no en cuanlo espacio consunido, olleniendo as una
soIucin que no sea oplina iespeclo a anlos painelios.

Ln |Cupla97j se eslalIecen Ias posilIes vislas a naleiiaIizaise de naneia siniIai a Ia de
|Haiinaiayan97j, sin enlaigo Ias dependencias se definen pailiendo de Ias consuIlas indicadas
poi eI diseadoi disninuyendo as Ia canlidad de vislas a sei consideiadas. LI nodeIo de coslo es
iguaI aI de |Yang97j, soIo que se pondeia con eI lanao que ocupa Ia visla. De esla naneia, eI
espacio de disco no soIo siive paia deducii cuando se dele delenei eI aIgoiilno vido, sino que
se uliIiza cono painelio paia Ia seIeccin de Ia pixina visla a naleiiaIizai. AqueIIa visla que
lenga un nejoi leneficio poi unidad de espacio uliIizado es agiegada a Ia soIucin.

Una vez ollenido eI conjunlo de vislas soIucin, se pueden ejeculai olios aIgoiilnos, lanlien
vidos, que lonen en cuenla soIanenle eI leneficio y no eI espacio de naneia de inleicanliai
vislas. La soIucin ollenida poi esle nelodo es aI nenos lan luena cono eI ollenido nedianle Ia
apIicacin deI piineio. CIolaInenle se aseguia que eI leneficio dado poi Ios iesuIlados de
|Yang97j es aI nenos un 63 deI ollenido con iesuIlados plinos.
V.4 Agrcgandn ndIccs
VISS son Ias sigIas en ingIes de Vicu, |ndcx and Spacc Sc|cc|icn. Ln esle caso eI piolIena de
seIeccin de vislas se exliende agiegando Ia seIeccin de ndices a cieai paia eI conjunlo de vislas
eIegidas.

La piineia eslialegia de iesoIucin de esle piolIena consisle en seIeccionai Ios ndices Iuego de
halei apIicado uno de Ios aIgoiilnos vislos en Ia seccin anleiioi paia eI cIcuIo deI conjunlo de
vislas a naleiiaIizai. LI inconvenienle que piesenla esla eslialegia es que puede descailaise una
visla que indexada coiieclanenle piovea una nejoia en eI iendinienlo, supeiioi que Ia dada poi
olia visla que no puede sei indexada. Lslo nueslia cono Ios aIgoiilnos delen consideiai Ias
vislas y Ios ndices de naneia sinuIlnea. |Haiinaiayan97j en su aIgoiilno n-grccdq enpIea esla
lecnica. Con un nodeIo de coslo siniIai aI uliIizado poi |Haiinaiayan96j se define un aIgoiilno
de lipo vido en eI que en cada paso se lona, o lien una visla con su conjunlo de ndices o lien
un ndice de una visla pievianenle seIeccionada. Lsla lsqueda se ieaIiza de naneia exhausliva
en cada uno de Ios pasos.

Ln cada ileiacin, paia eI conjunlo de eIenenlos seIeccionado, en sus vaiianles de ndice o visla-
ndices, se caIcuIa eI leneficio leniendo en cuenla eI espacio ocupado poi Ia naleiiaIizacin de
eslos. Con esle aIgoiilno se nejoia sensilIenenle eI lienpo de ejecucin de Ia seIeccin de Ia
soIucin. Se liene un aIgoiilno de oiden |n
r,
donde | es Ia canlidad de esliucluias en eI |a||icc, laI
cono se especificala en |Haiinaiayan96j, n es Ia canlidad de ndices y vislas que se eIigen paia
naleiiaIizai y r liene ieIacin diiecla con eI oiden de ejecucin y poi Io lanlo con Ia oplinaIidad
de Ia soIucin. Lslo liene ieIacin diiecla con Ia canlidad de ileiaciones que eI aIgoiilno IIeve a
calo. Segn |Haiinaiayan97j, eI leneficio aIcanzado poi eI aIgoiilno r-grccdq es aI nenos
( 1) /
1 1/
r r
e

veces eI aIcanzado poi Ia soIucin plina deI piolIena.
16

Ln eI nisno lialajo se inlioduce lanlien una nejoia aI aIgoiilno vislo anleiioinenle IIanada
|nncr-|ctc| a|gcri|nn, aIgoiilno lialado en |Cupla97j. La difeiencia iadica en que Ios conjunlos
que se lienen en cuenla paia Ia naleiiaIizacin no son eIegidos de lodas Ias naneias posilIes,
sino que se seIeccionan enpIeando aIgoiilnos vidos, seIeccionando piineio una visla y Iuego
sus ndices de foina de ollenei eI nejoi leneficio poi unidad de espacio a uliIizai. Lsle
aIgoiilno liene un nejoi oiden que eI r-grccdq (O(k
2
n
2
)), adens IIega a Ia cola infeiioi de O.63
iespeclo aI leneficio ollenido poi Ia soIucin plina deI piolIena.

Iueia de Ia calegoia de aIgoiilnos vidos se pueden enconliai vaiias piopueslas paia eI
lialanienlo de esle piolIena. Ln pailicuIai, |Lalio97j desciile Ia uliIizacin de un aIgoiilno A
*

uliIizado en eI canpo de Ia inleIigencia ailificiaI |NiIsson71j. LI aIgoiilno se lasa en lonai lodas
Ias posilIes esliucluias que puedan eslai en eI iesuIlado finaI y ievisai eI coslo. Ls nuy siniIai a
un aIgoiilno cono Ios vislos anleiioinenle, soIo que en esla ocasin se iecueidan aqueIIos casos
ya consideiados y no lonados en cuenla. Lslas vislas e ndices no son consideiadas en
posleiioies ileiaciones. La evaIuacin en eslos casos se ieaIiza nedianle eI coslo de
nanleninienlo y leneficio de una naneia siniIai a Ia que se uliIiza en Ia soIucin piopuesla en
|Yang97j. La canlidad de evaIuaciones ieaIizadas poi esle aIgoiilno puede sei hasla un 99
nenoi que Ia ieaIizada poi Ios aIgoiilnos vidos. Uno de Ios apoiles ns inpoilanles de esle
lialajo es una seiie de iegIas deducidas a pailii de ieileiadas ejecuciones deI aIgoiilno solie
dislinlos enloinos caiacleislicos. Lslo define una seiie de heuislicas que pueden sei uliIizadas
sin necesidad de ejeculai eI aIgoiilno.

Ioi Ilino, |eIIaliecheOOj eslalIece un nelodo en eI cuI se definen 2 agenles. Uno de eIIos,
IIanado ticu spq liene eI conelido de apiopiaise deI espacio disponilIe y dedicaiIo a
naleiiaIizai vislas. LI olio, IIanado indcx spq se encaiga de apiopiaise deI espacio paia uliIizaiIo
en Ia naleiiaIizacin de ndices. Lnlie anlos agenles se pueden quilai espacio de
aInacenanienlo sienpie y cuando eI SAC (s|ca| adnisicn ccn|rc|), Io peinila. Iaia eIIo se enpIea
un aIgoiilno lasado en un nodeIo de coslos que evaIa si paia Ia soIucin gIolaI es lueno o no.
Olio agenle, IIanado spq ccn|rc||cr, aseguia que soIo uno de Ios dos espas se ejecule a Ia vez. Lsle
pioceso se iepile hasla que eI SAC consideie que ya no se pueden ieaIizai ns pasajes de espacio
de un espa a olio. Los conponenles y sus inleiacciones se pueden vei en Ia figuia 4.


Iiguia 4: Conponenles de Ia soIucin lasada en agenles

Lo inleiesanle de esle enfoque es que eI ciileiio de seIeccin de Ias vislas e ndices, as cono eI
nodeIo de coslo uliIizado poi eI SAC, no se encuenlian especificados y podian, en piincipio, sei
cuaIquieia de Ios vislos hasla eI nonenlo. Lslo convieile Ia soIucin en una especie de
fianevoik, donde dislinlos aIgoiilnos podian sei uliIizados.
17
VI. Cach
AqueIIas consuIlas que a Ia hoia deI diseo se suponen sein Ias ns fiecuenles y de cIcuIo ns
cosloso pueden sei naleiiaIizadas, de naneia que no sea necesaiio iecaIcuIaiIas cada vez.

La naleiiaIizacin de vislas nejoia noloiianenle eI desenpeo de Ios sislenas de Dala
Waiehouse. La dificuIlad esl en deleininai Ia fiecuencia y eI coslo de Ias consuIlas. A piioii, eI
diseadoi puede suponei o eslinai Ia fiecuencia de cieilas consuIlas. Sin enlaigo eslos dalos
pueden canliai a Io Iaigo de Ia vida deI Dala Waiehouse. Lo ideaI seia ieaIizai Ia eslinacin deI
coslo y fiecuencia a nedida que Ias consuIlas se ieaIicen y eI sislena evoIucione. De esla foina
suigi Ia idea de uliIizai cache de iesuIlados en sislenas de Dala Waiehouse.

Ln eI cache se aInacenan Ios iesuIlados de Ias consuIlas paia que eslas sean uliIizadas poi olias
consuIlas. Un ejenpIo seia eI de un usuaiio que ieaIiza una consuIla poi Ias venlas en Ias
dislinlas liendas de una deleininada ciudad y que Iuego de esludiai eslas nedidas, liale de
conpaiai Ias venlas en Ia nisna ciudad conlia Ias venlas deI ieslo de Ias ciudades en una zona.
Ln esle caso se necesila eI iesuIlado de Ia consuIla anleiioi. LnpIeando eI cache, soIo es necesaiio
ieaIizai una sunaiizacin solie Ios dalos, conocido cono rc||-up, y no iecaIcuIai Ia consuIla a
pailii deI culo. De esla naneia, se puede vei eI V|S Prco|cn cono un piolIena esllico de
seIeccin de vislas a naleiiaIizai en eI cache.

Segn |Scheuinann96j exisle una seiie de caiacleislicas en Ios sislenas de Dala Waiehouse que
hacen especiaInenle aliaclivo eI uso de cache:
Ioco canlio en Ia infoinacin de oiigen: un nisno conjunlo de dalos en cache lendi
vaIidez nienlias no se ieaIice eI nanleninienlo deI Dala Waiehouse.
Tanao de Ios iesuIlados iespeclo a Ias ieIaciones oiigen: geneiaInenle Ios iesuIlados
sueIen sei pequeos, cono poi ejenpIo eI Iislado de venlas paia una seiie de liendas en
una ciudad. Sin enlaigo, paia IIegai a eslos iesuIlados, Ios cIcuIos pueden inpIicai
nuchos iegislios y cicIos de piocesadoi.
Lxislencia de palin de ocuiiencia de consuIlas: lpicanenle se ieaIiza un dri||-up o un
dri||-dcun solie una consuIla ya ieaIizada, poi ejenpIo.

Las dislinlas eslialegias de inpIenenlacin de cache puede cIasificaise segn Ia gianuIaiidad de
Ios eIenenlos a aInacenai. Una piineia apioxinacin a esa gianuIaiidad esla dada poi eI
lialajo de |Scheuinann96j. Ln esle lialajo eI ciileiio poi eI cuaI se decide si una visla puede o no
sei aInacenada en eI cache esl dado poi Ia vaIoiacin de un iesuIlado que es diieclanenle
piopoicionaI aI coslo de ollencin de Ia visla e inveisanenle piopoicionaI aI lanao de Ia
nisna. Ls decii, puede sei piefeiilIe naleiiaIizai eI iesuIlado de una consuIla coslosa de
pequeo lanao que una iespuesla de nayoi lanao a una consuIla que liene un coslo nenoi
de iecaIcuIo. Lsla ieIacin se pondeia adens poi su fiecuencia de ocuiiencia, Ia cuI es
caIcuIada lonando una venlana de K consuIlas deI hisloiiaI de consuIlas ieaIizadas. LI lialajo
caIcuIa nicanenle Ia fiecuencia paia consuIlas idenlicas, no olslanle es inpoilanle invesligai Ia
fiecuencia de ocuiiencia en eI caso de que Ias consuIlas sean equivaIenles, es decii, devueIven eI
nisno iesuIlado.

Los sislenas de cache se apoyan en dos aIgoiilnos que se delen inpIenenlai: Ia funcionaIidad
de agiega aI cache y Ia funcionaIidad de ieenpIazo. La piineia deleinina cuando un iesuIlado
dele sei agiegado aI cache haliendo espacio en eI nisno, Ia segunda deleinina, dado un cache
que esl ocupado, cuaIes son Ios iesuIlados acluaInenle en cache que se delen ieenpIazai y
cuando dele haceise. Ln esle caso se apiovecha eI hecho de lenei Ia fiecuencia de ejecucin de Ia
consuIla. De esla naneia, en eI ieenpIazo eI aIgoiilno |cas| Ncrna|izcd Ccs| Rcp|accncn| caIcuIa
eI leneficio cono
.
( )
i i
i
i
c
profit RS
s

=
18
siendo Ia fiecuencia de ocuiiencia de Ia consuIla consideiada, s una iefeiencia aI espacio
ocupado poi Ia soIucin y c eI coslo de Ia nisna (eI cuI puede sei caIcuIado en cuaIquieia de Ios
nodeIos de coslos vislos paia eI piolIena V|SS). Ln eI caso de |cas| Ncrna|izcd Ccs| Aggrcga|icn
se liene Io que se conoce con eI nonlie de c-prcfi|, cs|ina|cd prcfi|, y que se caIcuIa cono
( )
i
i
i
c
e profit RS
s
=
Ln eI caso de Ia opeiacin de ieenpIazo se oidena en foina descendenle eI conlenido deI cache
segn eI leneficio. Si se delen sacai n iesuIlados, sienpie Ios de nenoi leneficio, paia podei
agiegai eI iesuIlado de Ia consuIla acluaI, enlonces eI leneficio que se pieide aI eIininai eslos
eIenenlos deI cache dele sei nenoi aI ganado poi agiegai esle nuevo iesuIlado. De esla naneia,
se liala sienpie de naxinizai eI ccs| sating ra|ic
5
. Iaia eI caso de Ia opeiacin de agiegacin se
define un nnino leneficio. Si eI leneficio ollenido poi agiegai RSi aI cache soliepasa ese vaIoi,
enlonces se agiega.

La nayoi dificuIlad aI inpIenenlai eI esquena la|cnnan (nonlie dado aI adninisliadoi de
cache desaiioIIado en |Scheuinann96j) es eI nanleninienlo de Ios indicadoies de fiecuencia de
ocuiiencias de consuIlas. Un piolIena lpico es que Ia ocuiiencia de una consuIla no sea
consideiada una vez que eI iesuIlado de esla ha sido naleiiaIizado en eI cache. Lslo iepeicule en
Ios indicadoies de fiecuencia, haciendo que Ia nisna sea excIuida deI cache. Una vez fueia
vueIve a sei consideiada y posilIenenle ieingiesada aI cache. Lsle piolIena se conoce cono
rc|aincd rcfcrcncc infcrna|icn prco|cn (|ONeiI93j) y dele sei esludiado sienpie en eslos
aIgoiilnos ya que de olia foina se podia eslai inseilando y ieenpIazando peinanenlenenle un
nisno iesuIlado.

|Deshpande98j lusca aInacenai eIenenlos de nenoi gianuIaiidad en eI cache. Ln esle lialajo Ia
unidad de aInacenanienlo en eI cache es IIanada cnun|. Un cnun| es una agiupacin Igica de
dalos de un culo segn un conjunlo de dinensiones. Ln esle caso, se sueIe hacei un
agiupanienlo de Ias dinensiones siguiendo aIgn palin sennlico, poi ejenpIo agiupando en
un cnun| Ias dinensiones peilenecienles a una nisna jeiaiqua. De esla naneia, eslalIeciendo
cnun|s, Ias iespueslas se pueden dividii en un conjunlo finilo de agiupaciones. Todas Ias
agiupaciones que son iesuIlado de una consuIla sein nedidas poi su iendinienlo. Se aInacena
lodos Ios cnun|s de una iespuesla o ninguno.

A Ia hoia de evaIuai una consuIla no es necesaiio que sea iguaI a Ias que se encuenlian en eI
cache, sino que aIcanza con que aIgunos de Ios fiagnenlos de Ios iesuIlados aInacenados pueda
sei uliIizado paia su ejecucin. As pues, a Ia hoia de ejeculai una consuIla, Ia nisna se divide en
dos fiagnenlos: una sulconsuIla que puede sei ejeculada poi nedio de Ios cnun|s aInacenados
en eI cache y olia que puede sei iesueIla en lase a Ias ieIaciones que se encuenlian en eI Dala
Waiehouse. Iaia eslos Ilinos casos, se supone Ia exislencia de una inpIenenlacin deI
conceplo cnun| a niveI deI DMS sulyacenle. De olia naneia, eI cache no ayudaia en nada a
eslas consuIlas y soIo seiviian paia eI caso en que lodos Ios fiagnenlos se encuenlien
aInacenados.

Los conceplos de coslos y leneficios vislos en |Haiinaiayan96j son apIicados en esle caso. LI
nneio de cnun|s plino puede sei caIcuIado nedianle una heuislica. Aqu sucede Io nisno
que con Ia gianuIaiidad en su conjunlo: nuchos cnun|s conpionelen Ios lienpos de ejecucin
de lsqueda de coiiespondencia con Ias consuIlas, nienlias que pocos cnun|s aceica Ia soIucin
a Ia de ns aIla gianuIaiidad, es decii, Ia consuIla en su lolaIidad.


5
LI ccs| sating ra|ic se caIcuIa cono
.
.
i i
i
i i
i
c h
CSR
c r
=

donde ni es eI nneio de veces que Ia consuIla i


ha sido salisfecha poi eI conlenido deI cache y ri Ia canlidad lolaI de veces que Ia consuIla se ha
ieaIizado.
19
CuocS|ar |AIliechl98j liinda una soIucin ns fIexilIe. Ln esla soIucin, Ios fiagnenlos a sei
uliIizados paia eI aInacenanienlo son de lanao vaiialIe y se caIcuIan aI nonenlo de sei
aInacenados en eI cache. LI lanao de Ios fiagnenlos se deleinina leniendo en cuenla Ia
sennlica y eI Dala Waiehouse solie eI que funciona y son aInacenados en conjunlo paia una
consuIla.

LI leneficio que se caIcuIa paia Ios fiagnenlos inpIica Ia pailicipacin de ns de una neliica.
Ln pailicuIai se caIcuIan cualio neliicas que pueden lenei dislinlos pesos denlio deI aIgoiilno,
segn cono esle se configuie. De esla naneia se Ie puede dai nayoi o nenoi inpoilancia aI
conpoilanienlo deI cache segn aIgunos painelios independienles aI conlenido deI nisno.
VII. OptImIzacIn dc Cnnsu!tas
Si lien Ia naleiiaIizacin de vislas o eI uso de sislenas de cache dele sei lianspaienle paia Ios
usuaiios deI Dala Waiehouse, es posilIe que delan ieaIizaise canlios paia ollenei eI nxino
piovecho de Ia eslialegia seIeccionada. Lslo inpIica un pioceso de canlio de Ia consuIla oiiginaI
conocido cono qucrq rcuri||ing |Levy95j. Ln pailicuIai, esle piolIena se ieduce a Ia apIicacin
seiiaI de dos piolIenas : en piinei Iugai, esludiai cuaIes son Ios iesuIlados de vislas que lolaI o
paiciaInenle pueden sei uliIizados, en segundoIugai, nininizai Ia consuIla, es decii, eIininai
lodos aqueIIos eIenenlos de Ia nueva qucrq que son iedundanles, poi ejenpIo aliilulos
sennlicanenle equivaIenles que se iepilen. La conlinacin de anlos piolIenas se conoce con
eI nonlie de qucrq ccn|ainncn|. CuaIquieia de eslos piolIenas iesuIlan sei piolIenas NI-
conpIelos (siendoIo lanlien, en consecuencia, Ia conlinacin de anlos), si lien eI lialajo
nueslia un aIgoiilno IineaI que olliene luenos iesuIlados.

Una vaiianle de esle nelodo que lialaja solie eI caso geneiaI de qucrq rcuri||ing es eI lialajo
desciilo en |Dai96j. Ln eI se esludia eI caso pailicuIai de consuIlas en Ias que Ias vislas, nedianle
Ias cuaIes se lusca Ia soIucin, son iesuIlados de consuIlas que uliIizan agiegaciones. Ln esle
lialajo, Ios auloies especifican iegIas de uliIizacin de visla en Ia ieesciiluia de una consuIla, as
cono aIgoiilnos paia Ios dislinlos casos. Los aIgoiilnos son de aIlos giados de conpIejidad,
peio son poIinoniaIes.

Muchos de Ios lialajos vislos anleiioinenle, poi ejenpIo |AIliechl98j o |Deshpande98j, lonan
en cuenla Ios canlios que se delen ieaIizai en Ias consuIlas si se pielende uliIizai eI esquena de
naleiiaIizacin o cache. Ln pailicuIai, se naneja una seiie de iegIas heuislicas que peinile
deleininai Ia posiliIidad de uliIizai o no una visla en eI piocesanienlo de una consuIla. Ln
pailicuIai, en |Deshpande98j se desciilen Ias siguienles iegIas:
NiveI de agiegacin: Los iesuIlados que se encuenlian en cache pueden sei deI nisno
niveI de agiegacin o de un niveI infeiioi. De olia naneia, no se puede uliIizai esle
iesuIlado paia caIcuIai eI nuevo iesuIlado a devoIvei.
Lisla de pioyeccin: Los aliilulos uliIizados en Ia pioyeccin ieaIizada en Ia nueva
consuIla dele sei un sulconjunlo de Ios aliilulos uliIizados en Ia pioyeccin de Ia visla
aInacenada en eI cache.
Lisla de seIeccin: Los aliilulos que se encuenlian en eI grcup oq de Ia consuIla delen
coincidii exaclanenle. Ln caso de que Ios aliilulos no se encuenlien en eI grcup oq, no
lienen poique ieaIizaise una coiiespondencia exacla.

LI conjunlo de iegIas especificado en |Dai96j es nayoi y ns conpIejo y conpIelo.

Mas aII de que Ia nayoia de Ios lialajos en eI iea de oplinizacin de consuIlas se enfoquen
hacia a Ia naleiiaIizacin de vislas o lien en eI cache de iesuIlados, Ia apIicacin en cuaIquieia de
Ias dos calegoias es indislinla. Lslo delido a que cuaIquiei de Ios dos casos puede veise cono
una naleiiaIizacin de vislas.
2O
VIII. FragmcntacIn y DIstrIbucIn
Los sislenas OLAI poseen geneiaInenle lases de dalos de nayoi lanao que Ios sislenas
fuenles OLTI, eslo delido a Ios dalos hisliico, Ia des-noinaIizacin uliIizada en Ia
inpIenenlacin ieIacionaI y eI caIcuIo de aliilulos piincipaInenle deI lipo ncassurcs
|KinlaII96j.

Dado eI gian voIunen de infoinacin, Ia fiagnenlacin lanlo hoiizonlaI cono veilicaI peinile
ollenei iespueslas ns veIoces a Ias consuIlas que se ieaIizan solie eI Dala Waiehouse. Ls
peilinenle salei en que casos es convenienle una disliilucin de dalos enlie ns de un nodo en
una ied. AI iguaI que en Ias lases de dalos disliiluidas |Tanei91j, se puede pensai en disliiluii
Ios dislinlos fiagnenlos en vaiios nodos. Lslo peiniliia expIolai eI piincipio de IocaIidad de
dalos as cono Ia posiliIidad de enpIeai lecnicas de paiaIeIisno.
VIII.1 FragmcntacIn
VcrtIca!
Cuando en Ia Iileialuia exislenle se halIa deI piolIena de fiagnenlacin de dalos, se iefieie no
soIo a Ia divisin de una ieIacin, sino lanlien a Ia unin de ieIaciones. Iiagnenlai
veilicaInenle Ios dalos |Tanei91j es sunanenle leneficioso lanlo paia nanlenei acolado eI
lanao de Ias ieIaciones, cono paia podei paiaIeIizai eI acceso a eslas.

Ln Ios Dala Waiehouse, esla fiagnenlacin es an ns inpoilanle delido a Ia exislencia de una
opeiacin que es piopia de Ias apIicaciones deI lipo OLAI: Ios dri||-acrcss |AleIIoO2j. Lslas
opeiaciones invoIucian consuIlas de dalos de ns de un culo. Lslas podian halei sido
naleiiaIizados a vislas dislinlas, sin enlaigo, paia eslas opeiaciones Ia naleiiaIizacin
consideiada puede no sei Ia de nejoi iendinienlo (ninguno de Ios aIgoiilnos vislos consideia
esle lipo de consuIlas). Ls poi eIIo que eI conjunlo de vislas, lanlo piinaiias cono secundaiias,
deleian sei ievisadas.

|CoIfaieIIiO1j desciile un aIgoiilno paia Ia ieaIizacin de ievisiones cono Ias que se
desciilieion. asndose en un conjunlo de vislas naleiiaIizadas, haIIadas poi aIgn aIgoiilno de
Ios exislenles (eI lialajo se apoya en eI lialajo de |Haiinaiayan96j), esle aIgoiilno define un
pailicionanienlo lasado en eI conjunlo de consuIlas fiecuenles. Lsla pailicin no dele quedai
soIanenle en eI conjunlo de vislas finaIes a naleiiaIizai delido a Ia iedundancia de dalos que
exisle en esle enloino, sino que es necesaiio conocei lanlien solie que lalIas se lasa cada una
de Ias consuIlas. Lsle piolIena no exisle en una pailicin veilicaI ieaIizada solie una lase de
dalos liansaccionaI delido a que Ia iedundancia de dalos no exisle.

Iaia caIcuIai Ias fiagnenlaciones a ieaIizai, eI aIgoiilno se lasa en Ia geneiacin de una naliiz
de lies dinensiones: Ias posilIes pailiciones (vislas eslas cono un conjunlo de aliilulos), Ias
posilIes conlinaciones de nedidas que se apIican solie eslas pailiciones y poi Ilino Ias
consuIlas exislenles. Una leina con vaIoi 1 indica que Ia consuIla puede ejeculaise solie Ia
pailicin y nedidas en cueslin, en caso conliaiio su vaIoi sei O. La cieacin de una pailicin
liene asociada un coslo que se define cono Ia canlidad de pginas de disco a Ias que se dele
accedei. Lslo se caIcuIa leniendo en cuenla Ia canlidad de ieIaciones, Ia canlidad de iegislios
accedida y Ia canlidad de iegislios poi pgina de disco. Luego se dele deleininai que
pailiciones quedan y cuaIes no.

As cono eI piolIena de naleiiaIizacin de vislas e ndices, esle piolIena lanlien es NI-
conpIelo (esle piolIena se deiiva deI piolIena de Ia nochiIa deI lipo O-1 |Weiss95j). Ln esle
caso |CoIfaieIIiO1j no piopone un aIgoiilno vido paia Ia soIucin deI piolIena, sino que se
lasa en una lecnica de diseo de aIgoiilnos IIanada 8rancn-and-8rcund |Aho83j. Ln esle
enfoque, se coIocan Ias posilIes soIuciones cono hojas de un iloI hasla que eslas foinen un
suliloI con un coslo nayoi que eI nnino aIcanzado hasla eI nonenlo. De esla naneia, se
liene una canlidad de soIuciones a ievisai nucho nenoi que en Ia lsqueda exhausliva. Ln eI
21
peoi caso, se puede lenei eI nisno oiden que Ia lsqueda exhausliva (O(n!)), peio en eI caso
pionedio eI oiden es nucho nenoi.
HnrIznnta!
LI lialajo ns iepiesenlalivo iespeclo a Ia fiagnenlacin hoiizonlaI de Dala Waiehouse en
inpIenenlaciones ieIacionaIes es eI ieaIizado poi Noanan y aikei |Noanan99j. Ln esle lialajo,
Ia piopuesla se cenlia en eI pailicionanienlo hoiizonlaI de Ia lalIa de nedidas, dejando
invaiianle Ias ieIaciones de dinensin. La nolivacin esl dada poi Ia gian difeiencia de lanao
enlie Ia ieIacin de nedidas y Ias de dinensiones. De esla naneia, Ias ieIaciones de dinensin se
nanlendin inlaclas nienlias que se fiagnenla Ia de nedidas.

La fiagnenlacin se ieaIiza siguiendo eI enfoque de fragncn|acicn ncrizcn|a| indircc|a |Tanei91j
delido a que Ias iesliicciones solie Ias que se lasa eI enfoque dependein de Ias lalIas
asociadas, en pailicuIai de dinensin. No es liI ieaIizai una fiagnenlacin lasada en
iesliicciones solie Ios vaIoies de Ias nedidas, ya que, cono se vei en Ia pixina seccin,
geneiaInenle no liene senlido.

De esla naneia, eI lialajo especifica un aIgoiilno que se lasa en lies pasos:
Oplinizacin de Ios piedicados deiivados de Ias consuIlas: Los piedicados se ieaIizan
solie Ias dinensiones deI culo y poi Io lanlo solie Ias ieIaciones de dinensin
definidas. La idea es ieaIizai una noinaIizacin a niveI de Ia jeiaiqua solie Ia que se
define. Iaia eIIo se eIije Ia nayoi gianuIaiidad.
Ceneiacin de Ias pailiciones de Ias dinensiones: Luego de Ia geneiacin de nin|crns
|Tanei91j (desconposiciones nninas de Ios piedicados en foina conjunliva), es
posilIe ieaIizai Ia fiagnenlacin de Ias dislinlas dinensiones, lonando paia eIIo dalos
de Ias apIicaciones que se ejeculan solie Ias ieIaciones.
Ceneiacin de Ias pailiciones de Ia ieIacin de nedidas: Una vez que se liene Ia
fiagnenlacin de Ias dinensiones, se puede deducii cuaIes son Ios fiagnenlos
ieIacionados a Ia lalIa de nedidas.
LI lialajo ieaIiza lanlien eI esludio de Ia coiieclilud de Ios iesuIlados nedianle Ia denosliacin
de que Ias soIuciones cunpIiin con Ias piopiedades de conpIelilud, ieconsliuccin y no
soIapanienlo.
VIII.2 DIstrIbucIn
Una vez ieaIizadas Ias fiagnenlaciones se dele eIegii Ia ulicacin de Ios fiagnenlos. LI enfoque
liadicionaI conlenpIa piincipaInenle eI caso de un nico ieposiloiio de dalos en eI cuaI se liene
Ia lase de dalos que inpIenenla eI Dala Waiehouse. La uliIizacin de un Dala Waiehouse en
silios ienolos, sunado a Ia gian canlidad de dalos que Ias heiianienlas OLAI nanipuIan
cuesliona Ios leneficios de esla soIucin. IiincipaInenle cuando Ios enIaces que conunican Ios
silios con eI ieposiloiio son de escaso ancho de landa.

|Noanan99j eslalIece Ia disliilucin de Ios fiagnenlos de Ia lalIa de nedidas segn Ias
consuIlas que se ejeculen en Ios dislinlos Iugaies y que dan oiigen a Ios nin|crns que siiven de
inpu| aI aIgoiilno. Sin enlaigo, no se eslalIece si esla disliilucin se dele ieaIizai siguiendo un
palin esladslico iespeclo a Ia ocuiiencia de Ias consuIlas en Ios dislinlos silios. Las ieIaciones
de dinensiones se iepIican en lodos Ios silios. Lslo se lasa en Ia laja fiecuencia de ienovacin de
Ias dinensiones y Ia necesidad de acceso a Ios dalos en lodos Ios silios que acceden aI Dala
Waiehouse.

|CoIfaieIIiO1j no alaca eI piolIena de Ia disliilucin de Ias pailiciones veilicaIes. No olslanle, es
naluiaI pensai en un enfoque siniIai aI que se liene en |Noanan99j, solie lodo pensando en que
Ias pailiciones veilicaIes se despienden de un aIgoiilno que uliIiza consuIlas cono enliadas. Ln
esle caso aIgunas pailiciones pueden lenei que iepeliise en ns de un silio dependiendo de Ia
fiecuencia de opeiaciones deI lipo dri||-accrcss.
22
ArquItccturas DIstrIbuIdas
Independienlenenle de cno se disliiluyan Ios fiagnenlos, se dele eslalIecei una aiquilecluia
que peinila Ia visin lianspaienle deI Dala Waiehouse poi paile de cuaIquiei usuaiio.

La aiquilecluia que se nueslia en Ia figuia 5 se encuenlia desciipla en |Noanan99j.



Iiguia 5: Aiquilecluia paia Dala Waiehouse disliiludo

Lsla aiquilecluia se lasa fueilenenle en Ia aiquilecluia de lases de dalos disliiluidas visla en
|Tanei91j, que se lasa a su vez en eI nodeIo ANSI/SIARC |LInasii94j. Cada una de Ias cualio
capas que Ia conpone cunpIe una funcin:
Dala Inlegialion Layei: Ln esla capa se ieaIiza Ia inlegiacin de dalos de dislinlas
fuenles de dalos liansaccionaIes (OLTI).
Dala Slaging Layei: Lsla capa ieaIiza Ia unificacin en un nico esquena conocido cono
in|cgra|cd ccnccp|ua| scncna. Ls eI esquena que cuaIquieia de Ios usuaiios deI Dala
Waiehouse lendin disponilIe paia ieaIizai sus consuIlas.
Dala Disliilulion Layei: CunpIe con Ias funciones de fiagnenlacin, disliilucin y
nanleninienlo de Ios dalos de Ias lases que conlienen eI Dala Waiehouse en Ios
dislinlos nodos.
Disliiluled Dala Waiehouse Managei Layei: ReaIiza eI nanejo de Ios fiagnenlos IocaIes
y piovee una visla nica de Ios fiagnenlos aI usuaiio finaI.

Dele conlaise con una ied de inleiconexin enlie Ios dislinlos nodos paia Ia caiga, acluaIizacin
y consuIla de dalos que no se encuenlian en eI fiagnenlo IocaI deI Dala Waiehouse.
IX. Carga y MantcnImIcntn
LI pioceso de geneiacin de vislas eslalIece lanlien Ia naneia en que eslas delen caigaise, en eI
caso de un Dala Waiehouse ieIacionaI Ias consuIlas SQL que definen Ias vislas. Lxislen
piopueslas lasadas en eI diseo Igico deI Dala Waiehouse cono eI piesenlado en
|LaiiaagaO3j. Sin enlaigo, una vez que Ios piocesos de oplinizacin lasados en
naleiiaIizacin de vislas e ndices son ejeculados, eI esquena iesuIlanle puede sei lolaInenle
difeienle deI pIanificado en eI diseo Igico.

23
Teniendo Ias senlencias que definen Ias vislas a naleiiaIizai, es diiecla Ia naneia de ieaIizai Ia
caiga en eI Dala Waiehouse. Se ejeculan Ias dislinlas senlencias paia Ias ieIaciones de
sunaiizacin o vislas inleinedias, en eI oiden eslalIecido poi Ias piecedencias eslalIecidas en eI
aIgoiilno, poi ejenpIo a liaves deI |a||icc definido en |Haiinaiayan96j. Una vez ejeculado eI
pioceso, se liene eI Dala Waiehouse con Ios dalos naleiiaIizados en Ias dislinlas vislas. Lsle
pioceso sueIe ieaIizaise anles de que eI Dala Waiehouse quede disponilIe a Ias consuIlas
ieaIizadas poi Ios usuaiios o heiianienlas OLAI.

Iaia eI nanleninienlo de vislas Io ns conn es que eI conlenido deI Dala Waiehouse sea
lolaInenle iecaIcuIado en cada pioceso de caiga a pailii de Ios dalos de fuenle. Dependiendo deI
lipo de sislena exislen vaiianles cono Ias desciiplas en |Chaudhuii97j. De cuaIquiei foina,
lodas Ias lecnicas se lasan en lonai Ios dalos de Ias fuenles, sean eslos Ia lolaIidad o Ia poicin
de dalos nuevos, e inseilaiIos en Ias ieIaciones que inpIenenlan eI o Ios culos
nuIlidinensionaIes. Ln eslos peiodos de lienpo, eI Dala Waiehouse se encuenlia en eslado cff-
|inc, paia que eI usuaiio no pueda accedei a Ios dalos nienlias se ieaIiza Ia acluaIizacin y poi Io
lanlo no se lenga una visin inconsislenle de Ios nisnos.

Lsle enfoque puede sei apIicado en lases de dalos de pequeo o nediano poile o paia Ia caga
iniciaI. Iaia Dala Waiehouses de nayoi lanao o con necesidades de aIla disponiliIidad, que no
peinile lienpos cff-|inc, eslo no es Io ns apiopiado. De esla foina se alie una nueva iana de
invesligacin en Ia cuI hay dos enfoques. Ioi un Iado, piecaIcuIai Ias sunaiizaciones paia Iuego
inlegiaiIas aI Dala Waiehouse, nedianle un aIgoiilno que lona Ios dalos de naneia lolaInenle
incienenlaI. Ioi olio Iado, uliIizai lecnicas de aulo-nanleninienlo, sc|f-nain|cnaoi|i|q |Cupla95j.
IX.1 Carga InIcIa!
La caiga iniciaI eficienle |IenkxOO, HjaIlason97j es un lena ieIevanle cuando se liala de una
canlidad nuy giande de dalos, en especiaI solie una lalIa indexada. AI cieai un nuevo ndice es
desealIe piopoicionaiIo lan ipidanenle cono sea posilIe a Ios usuaiios y liindai Ia nejoi
peifoinance paia Ias consuIlas. LI pioceso de iniciacin y nanleninienlo de un Dala Waiehouse
es un pioceso cilico. LI gian voIunen de dalos inpIicado dicla Ia necesidad de un pioceso de
caiga de aIlo iendinienlo. La capacidad de aInacenai eficienlenenle conjunlos exlensos puede
lenei un efeclo dianlico en eI coslo lolaI asociado aI nanleninienlo de un Dala Waiehouses.

Vaiios lialajos consideian eI piolIena de caiga iniciaI en Ias esliucluias de ndice
nuIlidinensionaIes, cono |Caicia98j paia Ios R-Trccs, |HjaIlason97j paia Quad-Trccs y |IenkxOOj
paia U8-Trccs.
IX.2 Carga Incrcmcnta!
LI pioceso de caiga incienenlaI se difeiencia deI pioceso de caiga iniciaI ya que adens de cieai
pginas nuevas de dalos, cono Io hace eI pioceso de caiga iniciaI, acluaIiza Ias pginas
exislenles.
Dc!ta 5ummarIzatInn
Suponganos un Dala Waiehouse en donde se aInacena eI lolaI de venlas deI pioduclo A poi
IocaIidad. Cada venla que se ieaIice deI pioduclo A en Ia IocaIidad, se sunai aI vaIoi deI
iegislio que peilenezca aI pioduclo A y que peilenezca a Ia IocaIidad que se esludia. Lslo
funciona sin que se lenga que salei eI lolaI de Ia lalIa. SoIanenle eI nuevo vaIoi de venla y eI
vaIoi anleiioi son suficienles paia que un nuevo cIcuIo sea ieaIizado.

Ln esle piincipio se lasa |Munick97j paia ieaIizai Ia acluaIizacin de un Dala Waiehouse. LI
pioceso de nanleninienlo se divide en dos elapas: prcpagacicn y ac|ua|izacicn. LI lialajo se cenlia
en Ias ieIaciones de sunaiizacin, es decii solie Ias lalIas de nedidas, ns aII de que se
desciile lanlien un nelodo paia eI nanleninienlo de Ias ieIaciones de dinensin.

24
Ln Ia piineia elapa, se ieaIiza eI nanleninienlo de esliucluias auxiIiaies IIanadas sunnarq-dc||a
|ao|cs. Lxisle una poi cada visla que se encuenlia naleiiaIizada en eI Dala Waiehouse. Las
nisnas se geneian a pailii de lies vislas viiluaIes definidas poi cada una de Ias ieIaciones que se
encuenlian en Ias lases fuenle. Ln eIIas se guaidan Ios canlios ieaIizados y una nedida que
nanliene Ia ieIacin iespeclo a Ia sunaiizacin ieaIizada en Ia ieIacin deslino. De esla naneia
se liene Ia visla prcparc-inscr|icns paia Ias inseiciones y prcparc-dc|c|icns paia eI loiiado en Ias
ieIaciones de oiigen. Una leiceia visla ieaIiza Ia consoIidacin de anlas. Ioi ejenpIo, si en Ia
ieIacin deslino se liene cono nedida Ia suna de Ios vaIoies X (SUM(X)), enlonces se guaida X.
Ln Ia siguienle lalIa se pueden apieciai Ios napeos enlie Ias funciones de agiegacin de Ias
vislas deslino y Ias que guaidan Ias vislas viiluaIes.

Iiepaie-inseilions Iiepaie-deIelions
COUNT(*) 1 -1
COUNT(exp.) Cuando exp. Ls nuII O, sino 1 Cuando exp. Ls nuII O, sino -1
SUM(exp.) cxp. cxp.
MIN(exp.) cxp. cxp.
MAX(exp.) cxp. cxp.
TalIa 1: Mapeos de Ias funciones de agiegacin en |Munick97j

Agiegando Ios dalos aInacenados en Ias vislas prcparc-cnangcs, se liene Ias sunnarq-dc||a |ao|cs.
Ls inpoilanle olseivai, y esle es eI nayoi apoile de esle enfoque, que eI lialajo de caIcuIo ya
queda ieaIizado en gian paile en esla elapa de piopagacin. Todo eI lialajo hasla esle nonenlo
se ieaIiz sin lenei Ia necesidad de coIocai cff-|inc eI Dala Waiehouse, ya que Ios dalos de Ias
vislas naleiiaIizadas no han sido uliIizados.

Recien en Ia segunda elapa (ac|ua|izacicn) Ios dalos deI Dala Waiehouse son nodificados. Lslos
dalos son caIcuIados en lase a Ios dalos ya exislenles en Ia sunaiizacin y a Ios dalos que se
encuenlian en su sunnarq-dc||a |ao|c. Ioi ejenpIo, si eI dalo que se guaida en eI Dala Waiehouse
es un SUM(X), lasla con sunaiIe eI vaIoi que se encuenlia en su lalIa auxiIiai. Cada iegislio que
se encuenlie en Ias sunnarq-dc||a |ao|cs, inpIica iecaIcuIai eI vaIoi de a Io suno un iegislio en Ia
ieIacin deslino. Si aIguno de Ios ciuzanienlos no se encuenlia en eI Dala Waiehouse, voIviendo
aI ejenpIo anleiioi podia sei un pioduclo que es vendido poi piineia vez en una IocaIidad, se
inseila un nuevo iegislio. Si eI vaIoi de Ia sunaiizacin pasa a sei O, delido a que se loiiaion
aIgunos de Ios iegislios en Ias ieIaciones oiigen, enlonces puede oplaise poi eIininai eI iegislio
deI Dala Waiehouse.

Lsle enfoque funciona lanlo paia inseiciones cono paia loiiados en lalIas oigenes. Los nicos
casos en Ios cuaIes no es apIicalIe, Io que inpIica que eI iecaIcuIo deI vaIoi dele sei ieaIizado a
pailii de lodas Ia ieIacin fuenle, es cuando se lialaja con eIininaciones y Ia sunaiizacin es un
M|N o un MAX. Lslas funciones no son sc|f-nan|cinao|c, es decii, eI nuevo vaIoi se puede caIcuIai
nicanenle con eI canlio y con eI vaIoi anleiioi, iespeclo a Ios loiiados. Ioi ejenpIo, si eI vaIoi
nnino (nxino) caIcuIado hasla ahoia es seis y se eIinina un iegislio cuya piopiedad liene eI
vaIoi seis, no es posilIe deleininai si seis sigue siendo eI nnino (nxino) o no. Lslo deleinina
un caso en Ios cuaIes Ias sunnarq-dc||a |ao|cs no lienen nayoi uliIidad y eI cIcuIo dele ieaIizaise
desde Ias ieIaciones de oiigen.

Ln eI caso de que exisla ns de una visla naleiiaIizada, lanlo auxiIiaies cono finaIes, se puede
uliIizai Ia ieIacin de oiden dada poi |Haiinaiayan96j paia ieaIizai oidenadanenle eI pioceso
de piopagacin. Lslo hace an ns liI lanlo Ia inpIenenlacin de vislas auxiIiaies cono Ia
uliIizacin de sunnarq-dc||a |ao|cs paia eI nanleninienlo de Ias lalIas. La dificuIlad paia apIicai
esle nelodo es eI hecho de naleiiaIizai Ias sunnarq-dc||a |ao|cs. Lslo inpIica dupIicai eI espacio
necesaiio paia eI DMS. Ms aII de que eI espacio de Ias vislas se uliIice nienlias se desaiioIIen
Ias elapas deI aIgoiilno, esle dele eslai disponilIe y puede hacei que faIIe lodo eI pioceso en
caso de que no se cunpIa eI iequisilo.

25
Las nejoias esln dadas poi eI hecho de que Ios cIcuIos ns pesados deI nanleninienlo se
ieaIizan con eI Dala Waiehouse opeialIe y Ia elapa de ac|ua|izacicn en Ia cuI eI Dala Waiehouse
no eslaia disponilIe es lan Iaiga cono Ia canlidad de iegislios que se hayan canliado. Un
enfoque en donde eslo se conjugue con un luen apiovechanienlo deI espacio deleininaia un
esquena aIlanenle aceplalIe.
Autn-mantcnImIcntn
Todas Ias piopueslas que han sido lialadas hasla eI nonenlo se lasan en disponei de Ias
ieIaciones fuenles a Ia hoia de ieaIizai eI nanleninienlo de Ias lalIas. Iaia Ios casos en Ios que
no se puede o no se quieie accedei a Ias ieIaciones fuenles, poi ejenpIo, poi lenei aiquilecluias
disliiluidas, una aIleinaliva paia eI nanleninienlo de vislas naleiiaIizadas se IIana sc|f-
nain|cnancc |Cupla95j. Ln esle lialajo se define eI leinino paia aqueIIas vislas que pueden pasai
de un eslado a olio, sin lasaise en sus ieIaciones fuenles: soIanenle se lona en cuenla eI eslado
anleiioi de Ia visla y eI upda|c que se ieaIiz solie Ia ieIacin fuenle.

No lodas Ias vislas son aulo-nanlenilIes. Ls poi eso que |Huyn97j no soIanenle lasa su
aIgoiilno en esla piopiedad, sino que eslalIece lanlien un necanisno poi eI cuaI se deleinina
si una visla que ha sido naleiiaIizada es o no aulo-nanlenilIe. Lsle se lasa en piopiedades de
2 consuIlas IIanadas DIII e INCON. Lslas consuIlas, deiivadas de Ia consuIlas cuya apIicacin
solie Ias ieIaciones fuenles ieloina Ia visla naleiiaIizada, pueden apIicaise a un aIgoiilno que
deleinina nedianle Ia ieIacin definida en |Haiinaiayan96j
6
, en lienpo poIinnico si
DIIIINCON. Ln ese caso, se dice que Ia visla que se exanina es aulo-nanlenilIe.

LI lialajo eslalIece adens que independienlenenle de Ias ieIaciones que dieion oiigen a Ia
visla aulo-nanlenilIe, Ios canlios hechos solie esas ieIaciones van a IIevai Ia visla de una
siluacin eslalIe a olia siluacin eslalIe. Ln eslas posilIes ieIaciones, se encuenlian Ias que
definen Ia lase cannica de un conjunlo de vislas. Lsla lase se puede deducii de Ias consuIlas
que definen Ias vislas y de Ia visla naleiiaIizada, sin ncccsidad dc ccncccr |a fucn|c. Ioi Io lanlo,
una vez que se denosli que una visla es aulo-nanlenilIe, lasla con haIIai Ia lase cannica deI
conjunlo de vislas que se quieie nanlenei. De esla naneia, apIicando Ios canlios que se ieaIizan
a Ias lases de dalos fuenles lanlien a Ia lase de dalos cannica, se puede deducii un nuevo
eslado, que va a sei consislenle con eI eslado posleiioi de Ias vislas naleiiaIizadas. asla
enlonces con IIevai esos canlios de Ia lase cannica a Ias vislas deI Dala Waiehouse.

Cale Ia posiliIidad de que una visla no sea sc|f-nan|cinao|c, sino que necesile de cieilas ieIaciones
de Ia lase de dalos fuenle paia que se pueda ieaIizai su nanleninienlo. A esle lipo de vislas se
Ie IIana aulo-nanlenilIes geneiaIizadas. La soIucin, en un Dala Waiehouse, paia eslos casos
pasa poi naleiiaIizai Ias ieIaciones que hacen Ia visla aulo-nanlenilIe. De esla naneia se
consigue que eI nanleninienlo deI Dala Waiehouse se pueda ieaIizai sin lenei que ejeculai
opeiaciones solie Ias lase de dalos fuenle.

Lsle enfoque liene cono desvenlaja Io que paia eI enfoque |Munick97j eia una venlaja: eI Dala
Waiehouse liene que sei pueslo en eslado cff-|inc nienlias se IIevan a calo eslas opeiaciones. A
eslo dele sunaise que se delen inpIenenlai aIgunos necanisnos paia que eI noloi de lases de
dalos deI Dala Waiehouse pueda iecilii Ias consuIlas de Ios DMS fuenles. Sin enlaigo, eI
nanleninienlo seia nenoi que eI que se dela ieaIizai en eI caso oiiginaI. An ns, Ia
disponiliIidad de Ias lalIas, cono puede sucedei en eI caso de Ias aiquilecluias disliiluidas, no
afecla eI iendinienlo ni eI iesuIlado y poi Io lanlo eI Dala Waiehouse sienpie lendi Ias
acluaIizaciones que eI adninisliadoi/diseadoi ciea opoiluno.

6
La ieIacin se define en |Haiinaiayan96j de Ia siguienle naneia: Sea a y o Ios iesuIlados de
dos consuIlas qa y ql, se dice que qa ql sii a es un sulconjunlo de o.
26
X. DIscusIn
Ningn eIenenlo de diseo
7
de Ios desciiplos son poi si soIos, capaces de cunpIii con lodos Ios
piopsilos de un luen diseo fsico. Ioi esla iazn, geneiaInenle, se uliIizan en conjunlo

Ln geneiaI Ios lialajos conlinan Ia Inea piopuesla poi olios, cono poi ejenpIo Ias eslialegias
piopueslas en |CoIfaieIIiO1, Haiinaiayan96, Haiinaiayan97j, Io que peinile definii una
eslialegia gIolaI de diseo. Ln leininos geneiaIes, se podia idenlificai Ia siguienle secuencia de
pasos aI diseai fsicanenle un Dala Waiehouse:

SeIeccionai eI Mndc!n dc Datns
SeIeccionai una EstratcgIa dc CnmprcsIn
SeIeccionai Ias Estructuras dc ndIccs
ApIicai una EstratcgIa dc Rcsn!ucIn dc! "VI5 Prnb!cm" paia Ia seIeccin y
naleiiaIizacin de Ias vislas e ndices. ConpIenenlaiianenle se puede oplai poi una
EstratcgIa dc Cach
SeIeccionai un Mtndn dc OptImIzacIn dc Cnnsu!tas
SeIeccionai Ios Prnccsns dc Carga y MantcnImIcntn

Si lien en geneiaI esle es eI oiden de pasos seguido, exislen vaiianles lasadas en Ias iesliicciones
inpueslas aI diseadoi. Un ejenpIo de eslas iesliicciones es que eI lienpo en que eI Dala
Waiehouse se encuenlie off-Iine esle acolado. Lslo condiciona Ios piocesos de nanleninienlo,
que infIuyen a su vez en Ias esliucluias de dalos y espacio consunido. Olias iesliicciones
conunes vienen dadas poi eI lipo de uso deI Dala Waiehouse. Lslos ejenpIos confiinan Ia
exislencia de ieIaciones enlie Ios dislinlos eIenenlos de diseo, que en aIgunos casos se
conpIenenlan y en olios casos son excIuyenles. AIgunos de eslos aspeclos son disculidos en esla
seccin.
X.1 ROLAP vs. MOLAP
La eIeccin de un sislena ROLAI o MOLAI depende en gian nedida de Ia infiaesliucluia
disponilIe aI nonenlo de inpIenenlai eI OLAI. Mucho de Ios pioveedoies de lases de dalos
ieIacionaIes (poi ejenpIo ORACLL o IM) lienen nduIos que peinilen expandii su nanejadoi
ieIacionaI con funcionaIidades de anIisis nuIlidinensionaI. Lslo hace que Ias soIuciones ROLAI
sean efeclivas desde eI punlo de visla de Ios coslos.

Sin enlaigo, Ias caiacleislicas de Ias lases de dalos ieIacionaIes (en cuanlo a su aInacenanienlo
y Ios Ienguajes de nanipuIacin exislenles) hacen que Ias opeiaciones OLAI no lengan luen
desenpeo. Las inpIenenlaciones MOLAI son ns efeclivas desde eI punlo de visla de Ias
veIocidades de iespuesla. Cono conliapaile, sin eI uso de un nelodo de conpiesin de dalos, eI
espacio a uliIizaise puede sei inpoilanle.

Ln geneiaI oplai poi una eslialega deI lipo MOLAI sueIe sei Ia nejoi aIleinaliva, si lien nuchas
veces Ios iecuisos (en pailicuIai nonelaiio) no Io peinilen, leniendo que oplai poi una
eslialegia deI lipo ROLAI.
X.2 5c!cccIn dc Estructuras dc ndIccs
AI iguaI que en Ios sislenas OLTI, Ia eIeccin de Ias esliucluia de ndice a enpIeai depende de
vaiios facloies, en pailicuIai de Ios lipos de dalos a sei uliIizados y deI coeficienle coslo leneficio
(ya que sueIe exislii una penaIizacin giande en espacio).


7
Se enliende poi eIenenlo de diseo eslialegia de seIeccin de nodeIo de dalos y de ndices,
aIgoiilno de oplinizacin deI VIS IiolIen, enlie olios nonliados en eI piesenle lialajo.
27
LI lipo de dalos funciona cono un facloi excIuyenle a Ia hoia de uliIizai aIgunos lipos de ndices.
Ioi ejenpIo, lodos Ios ndices que se lasan en esliucluias de iloIes pueden sei apIicados solie
lipos de dalos oidenados. Iaia lipo de dalos no oidenado se dele definii una funcin de oiden,
Io que inpIica un coslo exlia. Olios lipos de ndices aceplan cuaIquiei lipo de dalos. Sin enlaigo
eI desenpeo de eslos sueIe sei nenoi, delido a Ia ejecucin de Ia funcin de hash necesaiia
paia calaIogai un dalo dado.

Olio punlo inpoilanle es eI coslo deI nanleninienlo de Ios ndices. Lsle punlo dele lonaise en
cuenla solie lodo en aqueIIos anlienles en Ios cuaIes Ia caiga deI Dala Waiehouse dele haceise
en fianjas hoiaiias acoladas. Nuevanenle se esl anle un piolIena de nejoia gIolaI de Ia
peifoinance deI sislena. Dele olleneise un plino a Ia ejecucin de consuIlas y aI
nanleninienlo deI sislena.

IinaInenle, eI espacio uliIizado es inpoilanle cono painelio de diseo de Dala Waiehouses.
Lsla caiacleislica deI ndice eIegido inpacla, poi ejenpIo, a Ia hoia de iesoIvei eI piolIena
VISS.

La lalIa 2 piesenla una conpaiacin enlie Ias piincipaIes caiacleislicas de Ios dislinlos ndices
piesenlados en Ia seccin IV. Lnlie Ias caiacleislicas iesaIlalIes, se encuenlian Ios coslos (lanlo
de nanleninienlo, cono de espacio ocupado), lipos de dalo solie Ios cuaIes se apIican (poi
ejenpIo si es necesaiio que Ios dalos puedan sei oidenados o no), esliucluia solie Ias cuaIes
pueden sei apIicados (MOLAI o ROLAI) y cuI es eI anlienle de uso ns apiopiado.

Tipo
Usn Estructura TIpn dc Datns Usn dc EspacIn Cnstn dc MantcnImIcntn
B
+
-Trcc
AiloIes TalIa de dinensiones ROLAI-MOLAI Oidenado
AIlo (vaiios niveIes de
iefeienciacin).
AIlo. Se dele ieesliucluiai anle dalos
inseilados
UB-Trcc AiloIes
VaIoies que pueden sei
divididos en iangos
ROLAI-MOLAI Oidenado
Medio (aInacena
nicanenle Ios Iniles de
Ios iangos)
Medio - AIlo (un nuevo vaIoi inseilado no
necesaiianenle inpIica ieesliucluiacin.
Ln caso de Inile de seccin Ia
ieesliucluiacin es giande)
R-Trcc AiloIes
VaIoies que pueden sei
divididos en iangos
ROLAI-MOLAI Oidenado
Medio (aInacena
nicanenle Ios Iniles de
Ios iangos)
Medio - AIlo (un nuevo vaIoi inseilado no
necesaiianenle inpIica ieesliucluiacin.
Ln caso de Inile de seccin Ia
ieesliucluiacin es giande)
X-Trcc AiloIes
Canlidad giandes de
dinensiones a indexai
ROLAI-MOLAI Oidenado
Medio (aInacena
nicanenle Ios Iniles de
Ios iangos)
Medio - AIlo (un nuevo vaIoi inseilado no
necesaiianenle inpIica ieesliucluiacin.
Ln caso de Inile de seccin Ia
ieesliucluiacin es giande)
DC-Trcc AiloIes
VaIoies que pueden sei
divididos en iangos
ROLAI-MOLAI Oidenado
Medio (aInacena
nicanenle Ios Iniles de
Ios iangos)
Medio - AIlo (un nuevo vaIoi inseilado no
necesaiianenle inpIica ieesliucluiacin.
Ln caso de Inile de seccin Ia
ieesliucluiacin es giande)
LIncar HashIng Hash TalIa de Dinensiones ROLAI CuaIquieia
ajo (SoIo se necesila un
aiiegIo de luckels y
punleios)
Medio (se dele haIIai eI luckel
coiiespondienle aI punleio y acluaIizaiIo o
agiegaiIo)
Budy Trcc Hash
VaIoies que pueden sei
divididos en iangos
ROLAI-MOLAI Oidenado
Medio (aInacena
nicanenle Ios Iniles de
Ios iangos)
Medio - AIlo (un nuevo vaIoi inseilado no
necesaiianenle inpIica ieesliucluiacin.
Ln caso de Inile de seccin Ia
ieesliucluiacin es giande)
BItmap Hash TalIa de Dinensiones ROLAI-MOLAI CuaIquieia
AIlo (vaiios niveIes de
iefeienciacin y cada hoja
conliene un aiigeIo de
lils).
Medio - AIlo (se dele nodificai eI aiiegIo
de lils. Ln caso de que eI dalo no exislieia
puede halei ieesliucluiacin)
BIt-s!Iccd Hash TalIa de dinensiones ROLAI-MOLAI Oidenado
Medio (aInacena
nicanenle Ios Iniles de
Ios slices )
Medio (Si canlia eI dalo puede eslai
denlio de un sIice (no hay canlio) o en un
Inile (se canlia dicho Inile)
k-d-trcc Hash - AiloIes TalIa de dinensiones ROLAI-MOLAI Oidenado
AIlo (exislen nuchas
deiefeienciaciones hasla
IIegai aI dalo)
ajo (eI iloI no se encuenlia laIanceado)
Quad-Trcc Hash-AiloI TalIa de dinensiones MOLAI Oidenado
AIlo (uliIiza culos
auxiIiaies paia eI
aInacenanienlo de Ios
dalos)
ajo (Canlios en Ios culos auxiIiaies o en
eI Inile iegisliado en eI sulculo)
Excc!! Hash-AiloI
VaIoies que pueden sei
divididos en iangos
ROLAI-MOLAI Oidenado
Medio (aInacena
nicanenle Ios Iniles de
Ios iangos)
Medio - AIlo (puede halei una
ieesliucluiacin delido a que Ias ceIdas
son de iguaI lanao).

TalIa 2:IiincipaIes caiacleislicas de Ios indices vislos en Ia seccin IV
X.3 Cach vs. MatcrIa!IzacIn dc VIstas
Se dele ieaIizai un anIisis deI uso deI Dala Waiehouse, de Ias caiacleislicas de esle y deI lipo
de consuIlas a iesoIvei paia decidii cuI es Ia eslialegia ns adecuada.

28
La naleiiaIizacin es ns eficienle a Ia hoia de ieaIizai consuIlas, ya que Ias vislas se
naleiiaIizan aI caigai eI Dala Waiehouse, peio cono eI conjunlo de vislas naleiiaIizadas es
esllico es necesaiio naleiiaIizai lodas Ias vislas usadas fiecuenlenenle junlo a sus ndices. Lslo
puede insunii nucho espacio en disco.

Ioi olio Iado eI enpIeo de cache ieduce eI espacio necesaiio delido a que eI conjunlo de vislas
naleiiaIizadas es dinnico. Sin enlaigo, Ia ejecucin de Ias opeiaciones de adninisliacin
insune lienpo aI iguaI que Ia cieacin de Ias vislas que no se encuenlian en eI cache.

Los coslos de nanejo deI adninisliadoi de cache se ven conpensados poi Ia nejoia de
iendinienlo de Ias consuIlas. |Deshpande98j nueslia iesuIlados de expeiinenlos donde se
olliene nejoias de un 6O en Ios lienpos de ejecucin de consuIlas. Mienlias eI esquena de
naleiiaIizacin de vislas desciilo en |Haiinaiayan96j nueslia nejoias que a Io suno IIegan a un
4O. Lslos iesuIlados se lasan en expeiiencias donde se enpIeaion fiecuencias no unifoines de
consuIlas, poi Io que es de espeiai que Ios iendinienlos de Ios enfoques de cache y
naleiiaIizacin no sean lan dispaies en un enliono noinaI de uso.
XI. Cnnc!usInncs
Lsle lialajo piesenla un eslado deI aile deI diseo fsico de sislenas OLAI, eI que iequieie
lecnicas conpIelanenle dislinlas aI de Ios sislenas OLTI. Dado eI gian voIunen de infoinacin
invoIuciado y Ias opeiaciones a Ias que esl oiienlado un sislena de esle lipo. Lxisle un gian
nneio de lialajos ieaIizados en esla iea, si lien Ia nayoia lialan eI lena en eI iea ieIacionaI,
en pailicuIai pioponen nuevas esliucluias de ndices y nuevos aIgoiilnos paia Ia iesoIucin deI
VIS IiolIen. Los lialajos ieaIizados solie diseo fsico MO|AP se lasan piincipaInenle en
esliucluias de dalos, nienlias que Ios ieaIizados solie RO|AP Io hacen en Ia adaplacin de
necanisnos exislenles paia lases de dalos ieIacionaIes. Lslo poi sei MOLAI un paiadigna
nuevo y especfico, nienlias que ROLAI se lasa en eI nodeIo ieIacionaI.

Ln geneiaI eI diseo eficienle de un sislena no puede invoIuciai elapas desconexas que
iesueIvan paile deI piolIena desconociendo Ios iequeiinienlos de Ios sulsiguienles pasos. LI
diseo fsico de Dala Waiehouse no es una excepcin poi Io que dele sei lialado cono un
pioceso gIolaI en donde Ios dislinlos conponenles, que hacen aI diseo fsico, se conjuguen de
naneia que se puedan cunpIii con Ios oljelivos paia Ios cuaIes eI Dala Waiehouse esl siendo
cieado. Si lien vaiios lialajos se lasan en olios pievios no se enconliaion lialajos solie
nelodoIogas gIolaIes de diseo.

Ties de Ios punlos que cenlian Ia alencin de Ias invesligaciones en esla iea son, Ia iesoIucin
deI VIS IiolIen, esliucluias eficienles de ndices y eI de nanleninienlo deI Dala Waiehouse.
Lslo delido aI gian voIunen de dalos invoIuciado, iequeiiise lienpos cuasi-inleiaclivos en aI
nonenlo de lialajai con sislenas de esle lipo y iequeiiise coilos pIazos en Ios que eI sislena
esle off-Iine.

Olio aspeclo a deslacai es eI lajo acopIanienlo exislenle enlie Ios lialajos ieaIizados solie
Diseo Isico y Diseo Lgico de un Dala Waiehouse. AIgunos aspeclos han sido lialados, cono
poi ejenpIo Ia caiga y nanleninienlo. Sin enlaigo, no se han enconliado lialajos que peinilan
seIeccionai, poi ejenpIo, Ia eslialegia de diseo fsico deI Igico (ieIacin cIaia a Ia hoia de
definii una nelodoIoga paia Ia soIucin deI V|SS) o viceveisa. Seia inleiesanle, poi Io lanlo,
Iogiai un nexo enlie eslos dos niveIes de diseo, de naneia que anlas ieas se eniiquezcan con
Ios avances de Ias olias.
29
RcfcrcncIas
[Abc!!n02] A. AleII, }. Sanos, I. SaIloi: 'On Rc|a|icnsnips Offcring Ncu Dri||-Acrcss
Pcssioi|i|ics', DOLAI' O2, Nov. 2OO2.
[Agrawa!95] R. AgiavaI, A. Cupla, S. Saiavagi: Mcdc|ing Mu||idincnsicna| Da|aoascs.,
TechnicaI Repoil, IM AInaden Reseaich Cenlei, 1995.
[Ahn83] A. Aho, }. Hopciofl, }. UIInan: '|s|ruc|uras dc Da|cs q A|gcri|ncs', Addison-
WesIey Ileioaneiicana, Lne. 1983.
[A!brccht98] }. AIliechl, A. auei, O. DeyeiIing, H. CnzeI, W. Hnnei, W. Lehnei, L.
SchIesingei: 'Managcncn| Of Mu||idincnsicna| Aggrcga|cs |cr |fficicn| On|inc
Ana|q|ica| Prcccssing", Iioceedings of lhe 1999 InleinalionaI Synposiun on
Dalalase Lngineeiing & AppIicalions, Iel. 1999.
[ARB] Ailoi Soflvaie Coipoialion, SunnyvaIe, CA. MuIlidinensionaI AnaIysis:
Conveiling Coipoiale Dala inlo Slialegic Infoinalion.
hllp://vvv.ailoisofl.con/.
[Barbara97] D. ailaia, M. SuIIivan: Quasi-Cuocs. A Spacc |fficicn| laq Tc Suppcr|
Apprcxina|c Mu||idincnsicna| Da|aoascs., TechnicaI Repoil, ISL Depl., Seplenlei
1997.
[Baycr97] R. ayei, V. MaikI: Tnc U8-Trcc. Pcrfcrnancc Of Mu||idincnsicna| Rangc
Qucrics., TechnicaI Repoil TUMI9814, Inslilul fui Infoinalik, TU Mnchen,
1997.
[Bc!!atrcchc00] L. eIIalieche, K. KaiIapaIen, M. Scheneidei: 'On |fficicn| S|cragc Spacc
Dis|riou|icn Ancng Ma|cria|izcd Vicus and |ndiccs in Da|a larcncusing
|ntircnncn|s", Iioceedings of lhe ninlh inleinalionaI confeience on Infoinalion
and knovIedge nanagenenl, Mai. 2OOO.
[Bcrchtn!d96] S. eichloId, D. A. Kein, H.I. KiiegeI: Tnc X-Trcc. An |ndcx S|ruc|urc fcr Hign-
Dincnsicna| Da|a., Iioc. 22lh Inl. Conf. on Veiy Laige Dala ases, onlay,
India, 1996, pp. 28-39.
[BO5] usiness Oljelcs, usiness Oljelcs SA, hllp://vvv.lusinessoljecls.con
[CGN] Cognos, Cognos Inc., hllp://vvv.cognos.con/
[ChaudhurI97] S. Chaudhuii, U. DayaI: 'An Otcrticu Of Da|a larcncusing And O|AP
Tccnnc|cgq', ACM SICMOD Recoid 26(1), Mai. 1997.
[Dar96] S. Dai, H. V. }agadish, A. Y. Levy, and D. Siivaslava: 'Ansucring SQ| Qucrics
li|n Aggrcga|icn Using Vicus.', In Iioc. of VLD, pages 318-329, Sel. 1996.
[Datta99] A. Dalla, K. Rananiilhan, H. Thonas: Curic. A Nctc| Sc|u|icn |cr |fficicn|
S|cragc And |ndcxing |n Da|a larcncuscs., Iioceedings on InleinalionaI
Confeience on VLDVn, Seplienlie 1999.
[DB2] D2 Waiehouse, IM Inc., hllp://vvv-
3O6.iln.con/soflvaie/dala/dl2/dalavaiehouse/
[Dcshpandc98] I. Deshpande, K. Ranasany, A. ShuIka, }. Naughlon: 'Cacning Mu||idincnsicna|
Qucrics Using Cnun|s', 27lh. InleinalionaI Confeience on lhe Managenenl of
Dala (SICMOD '98), SeallIe, USA, }un. 1998.
[E!masrI94] R. LInasii, S. Navalhe: '|undancn|a|s Of Da|aoasc Sqs|cns', Second Ldilion,
enjanin/Cunnings, 1994.
[Estcr01] M. Lslei, }. KohIhannei, H. KiiegeI: Tnc DC-Trcc. A |u||q Dqnanic |ndcx
S|ruc|urc fcr Da|a larcncuscs., Iioc. 16lh Inl. Conf. on Dala Lngineeiing (ICDL
2OOO), 2OOO
[EzcIfc97] C.I. Lzeife: 'A Unifcrn Apprcacn |cr Sc|cc|ing Vicus And |ndcxcs |n A Da|a
larcncusc',, Iioceedings of lhe 1997 InleinalionaI Dalalase Lngineeiing and
AppIicalions Synposiun (IDLAS), Ali. 1997.
[Fcnkx00] R. Ienkx, A. Kavakani, V. MaikIx, R. ayeix, S. Osaki: 8u|| |cading A Da|a
larcncusc 8ui|| Upcn A U8-Trcc., IDLAS Conf. 2OOO, Yokohana, }apan,2OOO
3O
[Furtadn00] I. Iuilado, H. Madeiia: |Ccnprcss. A Ncu Tccnniquc |cr Qucrio|c Ccnprcssicn Of
|ac|s And Da|acuocs., InleinalionaI Dalalase Lngineeiing and AppIicalions
Synposiun, IDLAS2OOO,Sep. 2OOO
[Gacdc98] V. Caede, O. Cnlhei: Mu||idincnsicna| Acccss Mc|ncds., ACM Conpuling
Suiveys, VoI. 3O, No. 2, 1998, pp. 17O-231.
[GarcIa98] Y. }. Caica, M. A. Lopez, S. T. Leuleneggei: A Grccdq A|gcri|nn |cr 8u|| |cading
R-Trccs., In ACM InleinalionaI Woikshop on Advances in Ceogiaphic
Infoinalion Syslens, pages 163-164, 1998.
[Gn!dstcIn98] }. CoIdslein, R. Ranakiishnan, U. Shafl: Ccnprcssing Rc|a|icns And |ndcxcs.,
Iioceedings of lhe 14lh. Inl. Conf. On Dala Lngineeiing, Ielieio 1998, IIoiida,
LL.UU..
[Gn!farc!!I01] R. CoffaieIIi, D. Maio, S Rilzzi: 'App|iqing Vcr|ica| |ragncn|a|icn Tccnniqucs |n
|cgica| Dcsign Of Mu||idincnsicna| Da|aoascs', Veiy Laige Dalalase (VLD)
confeience, May. 2OO1.
[Gn!farc!!I01b] M. CoIfaieIIi, S. Rizzi, . VidoIjak: Da|a larcncusc Dcsign |rcn XM| Scurccs,
Iioceedings of lhe 4lh ACM inleinalionaI voikshop on Dala vaiehousing and
OLAI, Novenlei 2OO1.
[Gray96] }. Ciay, A. osvoilh, A. Laynan, H. Iiiahesh: Da|a Cuoc. A Rc|a|icna|
Aggrcga|icn Opcra|cr Gcncra|izing Grcup-8q, Crcss-Tao, and Suo-Tc|a|s.,
Iioceedings of lhe 12lh InleinalionaI Confeience on Dala Lngineeiing, pages
152-159, 1996.
[Gupta95] A. Cupla, I. Munick: 'Main|cnancc cf Ma|cria|izcd Vicus. Prco|cns, Tccnnics And
App|ica|icn', ILLL Dala Lngineeiing uIIelin, SpeciaI Issue on MaleiiaIized Viev
& Dala Waiehousing, }un. 1995.
[Gupta97] H. Cupla: 'Sc|cc|icn Of Vicus Tc Ma|cria|izc |n A Da|a larcncusc', 6lh.
InleinalionaI Confeience on dalalase Theoiy (ICDT 97), Mai. 1997.
[HarInarayan96] V. Haiinaiayan, A. Rajaianan, }. UIInan: '|np|cncn|ing Da|a Cuocs |fficicn||q',
In ACM SICMOD InleinalionaI Confeience on .Managenenl of Dala, }un. 1996.
[HarInarayan97] H. Cupla, V. Haiinaiayan, A. Rajaianan, }. UIInan: '|ndcx Sc|cc|icn |cr O|AP',
In InleinalionaI Confeience on Dala Lngineeiing, uininghan, U.K, 1997.
[Hja!tasnn97] C. R. HjaIlason, H. Sanel, Y. }. Sussnann: Spccding Up 8u||-|cading Of
Quad|rccs, In ACM InleinalionaI Woikshop on Advances in Ceogiaphic
Infoinalion Syslens, pages 5O-53, 1997.
[Hmmcr03] W. Hnnei, A. auei, C. Haide: XM| And Arcni|cc|urc. Xcuoc. XM| |cr Da|a
larcncuscs, Iioceedings of lhe 6lh ACM inleinalionaI voikshop on Dala
vaiehousing and OLAI, 2OO3.
[Huyn97] N. Huyn: 'Mu||ip|c-Vicu Sc|f-Main|cnancc |n Da|a larcncusing |ntircnncn|s',
Iioc. 23id Inl. Conf. on Veiy Laige Dala ases, Alhens, Cieece, Mai. 1997.
[IRI] IRI Soflvaie, Infoinalion Resouices Inc., WaIlhan, MA. OLAI: Tuining
Coipoiale Dala inlo usiness InleIIigence. hllp://vvv.infoies.con/.
[I5F] O3 Soflvaie, Ideasofl, hllp://vvv.ideasofl.con.uy/
[KImba!!96] R. KinlaII: 'Tnc Da|a larcncusc Tcc||i|',, }ohn WiIey, 1996.
[LabIn97] W. Lalio, D, Quass, . AdeIleig: 'Pnqsica| Da|aoasc Dcsign |cr Da|a larcncuscs',
Iioceedings of lhe InleinalionaI Confeience on Dala Lngineeiing (ICDT 97), }un.
1997.
[Larraaga03] I. Laiiaaga: 'Carga Y Ac|ua|izacicn Dc Da|a larcncuscs A Par|ir Dc| Discnc |cgicc
Dc Su |squcna", Repoile Inleino deI giupo CSi,InCo, 2OO3
[Lcvy95] A. Levy, A. O. MendeIson, Y. Sagiv, and D. Siivaslava: 'Ansucring Qucrics Using
Vicus.', In Iioc. ACM IODS, pages 95-1O4, Mai. 1995.
[MIC] Micioslialegy Inc., Vienna, VA 22182. Tiue ReIalionaI OLAI.
hllp://vvv.nicioslialegy.con.
[M55] Miciosofl AnaIysis Seivices, SQL Seivei, Miciosofl Coipoialion.
hllp://vvv.niciosofl.con/sqI/anaIysisseivicesdefauIl.asp
[MumIck97] I. S. Munick, D. Quass, . S. Munick: 'Main|cnancc Of Da|a Cuocs And Sunnarq
Tao|cs |n A larcncusc', In Iioceedings of lhe ACM SICMOD InlenalionaI
Confeience on Managenenl of Dala, May. 1997.
31
[Nguycn01] T.. Nguyen, A.M. Tjoa, O. Mangisengi: Mc|aCuoc-X. An XM| Mc|ada|a
|cunda|icn |cr |n|crcpcraoi|i|q Scarcn Ancng lco larcncuscs., In: DMDW,
InleiIaken, SvilzeiIand, 2OO1
[NI!ssnn71] N. NiIson: 'Prco|cn Sc|ting |n Ar|ificia| |n|c||igcncc', McCiav-HiII, 1971.
[Nnaman99] A.Y. Noanan, K. aikei: 'Dis|riou|cd Da|a larcncusc Arcni|cc|urc And Dcsign',
ISCIS 99, Kusadasi, Tuiquia., }un. 1999.
[O'NcI!93] L. O'NeiI, I. O'NeiI, C. Weikun: 'Tnc |RU-K Pagc Rcp|accncn| A|gcri|nn |cr
Da|aoasc Dis| 8uffcring', Iioceedings of lhe ACM SICMOD InleinalionaI
Confeience on Managenenl of Dala, Ocl. 1993.
[O'NcI!95] I. ONeiI, C. Ciaefe: Mu||i-Tao|c ]cins Tnrcugn 8i|nappcd ]cin |ndiccs, SICMOD
Recoid 24(3), 1995, pp. 8-11.
[O'NcI!97] I. ONeiI, D. Quass: |nprctcd Qucrq Pcrfcrnancc li|n Varian| |ndiccs, Iioc.
ACM SICMOD Inl. Conf. on Managenenl of Dala, 1997, pp. 38-49.
[ORA] Waiehouse uiIdei, OiacIe Inc.,
hllp://vvv.oiacIe.con/lechnoIogy/pioducls/vaiehouse/index.hlnI
[RED] hllp://vvv-3O6.iln.con/soflvaie/dala/infoinix/iedliick/
[Rnussnpnu!ns97] N. RoussopouIos, Y. Kolidis, M. RoussopouIos: Cuoc|rcc. Organiza|icn Of And
8u|| |ncrcncn|a| Upda|cs On Tnc Da|a Cuoc, Iioc. ACM SICMOD Inl. Conf. on
Managenenl of Dala, 1997, pp. 89-99.
[5chcurmann96] I. Scheuinann, }. Shin, and R. VingiaIek: 'lATCHMAN. A Da|a larcncusc
|n|c||igcn| Cacnc Managcr.', In Iioc. of VLD, pages 51-62, Iel. 1996.
[5rIvastava02] }. Li, }. Siivaslava: |fficicn| Aggrcga|icn A|gcri|nns |cr Ccnprcsscd Da|a
larcncuscs., ILLL Tians. KnovI. Dala Lng. 14,2OO2
[Tamcr91] M. Tanei, I. VaIduiiez: 'Princip|cs Of Dis|riou|cd Da|aoasc Sqs|cns',, Iienlice
HaII, 1991.
[TPCD95] I. Raal, ediloi: 'TPC 8cncnnar| D (Dcsicicn Suppcr|)', Revision 1.O, Tiansacliojn
Iiocessing Ieifoinance CounciI, Ali. 1995.
[VIttcr99] }.S. Villei, M. Wang: Apprcxina|c Ccnpu|a|icn Of Mu||idincnsicna| Aggrcga|cs Of
Sparsc Da|a Using latc|c|s., 1999 Conf. On lhe Managenenl of Dala,
IhiIadeIphia, IA, USA, 1999.
[WcIss95] M.A. Weiss: '|s|ruc|uras Dc Da|cs Y A|gcri|ncs',, Adisson-WesIey
Ileioaneiicana., }uI. 1995.
[Yang97] }. Yang, K. KaiIapaIen, Q. Li: 'A|gcri|nns |cr Ma|cria|izcd Vicu Dcsign |n Da|a
larcncusing |ntircnncn|', Iioceedings of lhe InleinalionaI Confeience Veiy
Laige Dalalases (VLD), Ago. 1997.
[Zhugc95] Y. Zhuge, H. Caicia-MoIina, }. Hannei, }. Widon: Vicu Main|cnancc |n A
larcncusing |ntircnncn|, Iioceedings of lhe ACM SICMOD InleinalionaI
Confeience on Managenenl of Dala, pages 316-327, May 1995.

También podría gustarte