Está en la página 1de 2

La mInera de datos es un proceso que usa varIas herramIentas de anIIsIs de datos

para descubrIr patrones y reIacIones en Ios datos, que pueden ser usados para
reaIIzar predIccIones vIIdas.
Los pasos para realIzar este proceso son:
O uescrlblr los daLos
O onsLrulr un modelo predlcLlvo
O Ierlflcar el modelo
Es Importante comprender que la mIneria de datos es una herramIenta y no una varIta
mgIca. No elImIna la necesIdad de conocer el negocIo y los datos, al Igual que en el
ejemplo de la barcaza, se le pueden proveer los mejores mapas de navegacIon pero sI no
sabe las capacIdades de la embarcacIon es Improbable que pueda navegar
tranquIlamente. Por lo tanto, la mIneria de datos es un asIstente para el anlIsIs de
datos, sus relacIones y el descubrImIento de patrones.
9
es el acrnlmo en lngles de
procesam|ento ana||t|co en ||nea
(Oolloe Aoolytlcol ltocessloq%
C8!L1lIC
es aglllzar la consulLa de grandes
canLldades de daLos
uLlllza esLrucLuras mulLldlmenslonales
(o ubos CLA% que conLlenen daLos
resumldos de grandes 8ases de daLos
o SlsLemas 1ransacclonales (CL1%
A8A LLLC u1lLlZA
1lLnLn ALlAlCn Ln
en lnformes de negoclos de venLas
markeLlng lnformes de dlreccln
mlnerla de daLos y reas slmllares
1lCS uL uA1CS CLA
8CLA
MCLA
PCLA (Pybrld CLA%

|Ineria de datos y DLAP
Una de las preguntas ms comunes en el procesamIento de datos es la dIferencIa entre
DLAP y mIneria de datos. Podemos adelantar que son dos herramIentas dIferentes que se
complementan.
DLAP es parte de una gama de herramIentas de toma de decIsIones. Las consultas
tradIcIonales y los reportes descrIben lo que hay en la base de datos. DLAP va ms all,
es usado para responder porque cIertas cosas son cIertas. Un analIsta genera una serIe de
patrones y relacIones hIpottIcas usando consultas(querIes) para aprobarlos o
rechazarlos. DLAP es en esencIa un proceso deductIvo.
Pero, qu pasa cuando el numero de varIables por analIzar es por docenas o Incluso
cIentos: Se vuelve ms dIficIl el encontrar una buena hIpotesIs, analIzar la base de datos
con DLAP, verIfIcarla o desaprobarla.
La mIneria de datos es dIferente de DLAP porque en lugar de verIfIcar patrones
hIpottIcos, usa los mIsmos datos para descubrIr tales patrones. Es en esencIa un proceso
InductIvo.
|Ineria de datos exItosa.
Hay dos llaves para tener xIto con la mIneria de datos. La prImera es llegar a un modelo
precIso del problema que se est tratando de resolver. PosterIormente analIzaremos
conceptos como ClusterIng y AnlIsIs de FelacIones. La segunda es Interpretar y usar los
datos. Conoceremos varIos algorItmos como las Fedes Neuronales, Arboles 0e 0ecIsIon,
nduccIon 0e Feglas, K7ecIno Cercano, FegresIon LogistIca, AnlIsIs de 0IscrImInantes y
AlgorItmos CentIcos.

También podría gustarte