Está en la página 1de 4

Curso:

"Anlisis y Extraccin de Conocimiento


en Sistemas de Informacin:
Datawarehouse y Datamining"
Departamento de Sistemas Informticos y Computacin
Universidad Politcnica de Valencia

DURACIN: 30 horas: 12 horas tericas + 8 prcticas asistidas + 10 de


trabajo individual
FECHAS: Chihuahua (Instituto Tecnolgico de Chihuahua), Mxico, 911 de octubre de 2003. Similares cursos se han impartido en la
Universidad de El Salvador y en la UTFSM de Chile (www.mti.cl).
PROFESOR: JOS HERNNDEZ ORALLO
OBJETIVOS:
El objetivo fundamental de este curso es conocer la necesidad y conceptos
generales de la tecnologa de almacenes de datos y OLAP y saber aplicar las
tcnicas de minera de datos apropiadas para problemas concretos de
extraccin de conocimiento til para el anlisis o la toma de decisiones.
Entre los objetivos ms especficos, los alumnos sern capaces, al finalizar el
curso, de:
Reconocer el potencial y la problemtica del anlisis de sistemas de
informacin para la toma de decisiones.
Conocer las ventajas y casos donde es aconsejable recopilar
informacin interna y externa en un Almacn de Datos.
Conocer el modelo multidimensional de datos de los almacenes de
datos y los operadores de refinamiento asociados: drill, roll, slice &
dice, pivot.

Conocer la arquitectura y diferentes implementaciones (ROLAP,


MOLAP) de Almacenes de Datos.
Reconocer pautas para el diseo y mantenimiento de ADs.
Reconocer los beneficios de su uso sistemtico de tcnicas de
extraccin de conocimiento para la obtencin de modelos y patrones
predictivos o descriptivos.
Conocer las fases del Descubrimiento de Conocimiento de Bases de
Datos y la importancia de las mismas en el xito del proceso (en
especial las de limpieza y seleccin de datos).
Conocer las distintas tcnicas de aprendizaje automtico y estadsticas
utilizadas en minera de datos, su potencial, su coste computacional y
sus limitaciones de representacin y de inteligibilidad.
Elegir, para un problema concreto, qu tcnicas de minera de datos son
ms apropiadas.
Generar los modelos y patrones elegidos utilizando una herramienta o
paquete de minera de datos.
Evaluar la calidad de un modelo, utilizando tcnicas sencillas de
evaluacin (validacin cruzada).
Utilizar mtodos de combinacin de tcnicas (p.ej. voting) y de
reiteracin (p.ej. boosting).
Conocer la problemtica especial de la minera sobre la web
(documentos textuales e hipertextuales) y las tcnicas ms usuales.
Adems, y especialmente dirigido a los asistentes del mundo acadmico:
Conocer los problemas abiertos en la investigacin de almacenes de
datos y minera de datos.
Conocer los congresos y foros ms importantes, as como las redes,
recursos, etc., relacionados con ambas disciplinas.

DESCRIPCIN:

En este curso se presentar el problema del anlisis de sistemas de


informacin para la toma de decisiones y las herramientas genricas y las
tecnologas ms avanzadas para llevarlo a cabo.
En primer lugar, se presentan las tcnicas de Almacenes de Datos y
OLAP para facilitar el procesamiento analtico de apoyo a la toma de
decisiones estratgicas.
En segundo lugar, y con ms extensin, se present la necesidad del anlisis
inteligente y automtico de la informacin para el descubrimiento de
conocimiento til.
Para abordarlo, se introducir el rea de la Extraccin de Conocimiento a
partir de Bases de Datos (KDD), sus fases, en especial la de minera de
datos, y se presentarn las tcnicas de aprendizaje automtico ms habituales
en minera de datos. Se estudiar la idoneidad de cada una para diferentes
problemas.
El seminario intercala la presentacin de conocimientos tericos con la
aplicacin prctica de los mismos sobre un paquete de minera de datos (SPSS
Clementine).

Temario
PARTE I: INTRODUCCIN
1.1. Finalidades y Evolucin de los Sistemas de Informacin.
1.2. Herramientas para la Toma de Decisiones: diferencias e interrelacin.
1.3. Almacenes de Datos, OLAP y Minera de Datos: definicin e
interrelacin.
PARTE II: ALMACENES DE DATOS
2.1. Introduccin a los almacenes de datos: motivacin definicin y
caractersticas.
2.2. Arquitectura de un sistema de almacn de datos.
2.3. Explotacin de un almacn de datos: herramientas OLAP.
2.4. Sistemas ROLAP y MOLAP.
2.5. Carga y Mantenimiento de un Almacn de Datos.
2.6. Diseo de un almacn de datos.
2.7. Lneas de investigacin abiertas.
PARTE III: MINERA DE DATOS
3.1. Introduccin a la Minera de Datos (DM)
3.1.1. Motivacin
3.1.2. Problemas tipo y aplicaciones

3.1.3. Relacin de DM con otras disciplinas


3.2. El proceso de KDD
3.2.1. Las Fases del KDD
3.2.2. Tipologa de Tcnicas de Minera de Datos
3.2.3. Sistemas Comerciales
3.2.4. Visualizacin
3.3. Tcnicas de Minera de Datos
3.3.1. El Problema de la Extraccin Automtica de Conocimiento.
3.3.2. Evaluacin de Hiptesis
3.3.3. Tcnicas no supervisadas y descriptivas.
3.3.4. Tcnicas supervisadas y predictivas.
3.4. Web Mining
3.4.1. Los Problemas de la Informacin No Estructurada.
3.4.2. Extraccin de Conocimiento a partir de Documentos HTML y texto.
3.4.3. Extraccin de Informacin semi-estructurada (XML).
3.5. Lneas de Investigacin Abiertas

También podría gustarte