Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sistemas de Informacin-2003
Data Warehouse
Saturacin de informacin
Difcil de acceder
No selectiva
Sistemas de Informacin-2003
Data Warehouse
Data Warehouse
Orientacin al tema
Sistemas de Informacin-2003
Sistemas de Informacin-2003
Data Warehouse
Data Warehouse
Datos integrados:
Datos no voltiles:
Consecuencia de la historilizacin
Datos historiados
Infocentro:
Sistemas de Informacin-2003
Datos
REG5
REG5
P2
Datos: Representaciones
Jerrquicas
P2
Sistemas de Informacin-2003
P1
TR2
REG4
TR1
Sistemas de Informacin-2003
REG2 REG3
Regin
REG1
Estructura multidimensional
REG1
P1
REG2 REG3
Nivel de historial
TR1
REG4
TR2
Datos detallados
Producto Tr
im
est
re
Metadatos
Nivel de sntesis
Datos agregados
10
Tabla de dimensiones
Tabla de hechos
Agrupacin de datos
Ej.: Agrupar datos mensuales en trimestrales
Tipos de esquema
Esquema de estrella:
Divisin de datos
Esquema de copos
Tablas dimensinales organizadas jerrquicamente
Sistemas de Informacin-2003
11
Sistemas de Informacin-2003
12
Construccin de un Data
Warehouse
DW: Caractersticas
Salvado de datos limpios
OLAP
Extraccin
Preparacin (formateo y limpieza)
Carga
DATOS
Limpieza
Bases de Datos
Reformateo
MINERIA
DE DATOS
13
OLTP y OLAP
14
Transacciones predeterminadas
Utiliza pocas tablas
Sistemas de Informacin-2003
Sistemas de Informacin-2003
DSS
METADATOS
15
Sistemas de Informacin-2003
16
DW son multidimensionales
Vistas suelen ser relacionales
17
Errores a evitar
18
Implementacin: Dificultades
Sistemas de Informacin-2003
Alto coste
Urgente ayuda para la toma de decisiones
Data Mart
Cambio de necesidades
Nuevas fuentes de datos
Cambio de la capacidad
Cambio de tecnologa
Sistemas de Informacin-2003
20
Bibliografa
J.M. Franco. EDS-Institut Promthus, El
Data Warehouse. El Data Mining,
Eyrolles,1997.
Sistemas de Informacin-2003
Data Mining
21
Data Mining
22
Sistemas de Informacin-2003
Sistemas de Informacin-2003
23
Seleccin de datos
Limpieza de datos
Transformacin/Codificacin de datos
Minera de Datos
Presentacin visualizacin
Sistemas de Informacin-2003
24
Descubrir
Prediccin
Ej.: que compraran los clientes bajo determinados
descuentos
Reglas de asociacin
Patrones secuenciales
rboles de clasificacin
Identificacin
Ej.: secuencia de nucletidos presencia gen
Presentacin de Resultados
Clasificacin
Listas
Representaciones Grficas
Tablas resumen
Optimizacin
Sistemas de Informacin-2003
Conocimiento Descubierto
Sistemas de Informacin-2003
26
Tipos de reglas
X antecedente consecuente
Reglas de asociacin
Ej.: Compra bolso Compra zapatos
Jerarquas de clasificacin
Ej.: Clasificacin de los clientes de un banco
Patrones secuenciales
Ej.: Cmara digital Memorias MMC
Categorizacin y segmentacin
27
Sistemas de Informacin-2003
28
Clasificacin
Comienza con una muestra de datos de
clasificacin conocida
Los datos se dividen segn uno de sus atributos,
sucesivamente
Asociaciones: X Y
Correlaciones entre series
Sistemas de Informacin-2003
29
Asociaciones
Sistemas de Informacin-2003
30
Asociaciones negativas
Ej.: el 60% de los clientes que compran
patatas fritas no compran agua mineral
Si no combinacin de elementos
asociacin negativa
Sistemas de Informacin-2003
31
Sistemas de Informacin-2003
32
Otras Tcnicas
Regresin
Sistemas de Informacin-2003
Estadstica
Establecimiento de probabilidades
Redes neuronales
Entrenar la red
Reconocer los patrones segn el entrenamiento
Algoritmos genticos
33
Algoritmos probabilistas
Poblacin inicial
Sobreviven los mejores
Obtenemos datos en cada iteracin
Sistemas de Informacin-2003
Aplicaciones
34
Bibliografa
Marketing
Comportamiento del consumidor basado en patrones de
compra
Finanzas
Anlisis de rendimiento de operaciones
Solvencia de clientes
Valoracin de opciones de financiacin
Fabricacin
35
Sistemas de Informacin-2003
36
Sistemas de Informacin
Geogrfica
Jos Alberto Royo
joalroyo@unizar.es
Departamento de Informtica e Ingeniera de Sistemas
GIS: Categoras
Multidimensional (x,y,z,t,...)
Voluminosidad
Naturaleza inexacta (no hay representaciones
exactas de la Tierra)
Las preguntas combinan topologa, geografa y
otros atributos, con informacin aproximada
Combinan distintos contextos legales y
econmicos (varan de un pas a otro)
Variedad de datos
Representacin basada en campos
38
Informacin espacial
1. Aplicaciones Cartogrficas
Sistemas de Informacin-2003
39
Sistemas de Informacin-2003
40
10
Mapas
Estructuracin
Vectores (+verstil, -fcil de crear)
Interpretacin
Cierre de polgonos
Definicin, reduccin y mejora de detalles
Anlisis de proximidad
Clculo de zonas de inters
Otras funcionalidades
42
Extensibilidad
Sistemas de Informacin-2003
dnde estoy?
Problema debido a la variedad de tipos de datos
Visualizacin
1. Contorneado
Isolneas
2. Sombreado de montaas
3. Visualizaciones de perspectivas
Imgenes tridimensionales
Sistemas de Informacin-2003
43
Sistemas de Informacin-2003
44
11
Generacin de mapas
Seleccin de lugares
Creacin de planes de emergencia
Distribucin de datos
Separacin de datos espaciales y no espaciales
Versionado
Ej.: Qu pasa si construimos una autopista?
Estndares de Datos
Simulacin de transformaciones
medioambientales
Compartir de datos
Aplicaciones especficas
Sistemas de Informacin-2003
45
Sistemas de Informacin-2003
46
Bibliografa
Keith C. Clarke, Getting Started with
GIS, Prentice-Hall, 1997, ISBN 0-13-294786-2.
http://www.usgs.gov/research/gis/title.html
Sistemas de Informacin-2003
47
12
Por qu DW y DM?
Sistemas de Informacin-2003
Data Warehouse
Saturacin de informacin
Difcil de acceder
No selectiva
Sistemas de Informacin-2003
Data Warehouse
Data Warehouse
Orientacin al tema
Sistemas de Informacin-2003
Sistemas de Informacin-2003
Data Warehouse
Data Warehouse
Datos integrados:
Datos no voltiles:
Consecuencia de la historilizacin
Datos historiados
Infocentro:
Sistemas de Informacin-2003
Datos
REG5
REG5
P2
Datos: Representaciones
Jerrquicas
P2
Sistemas de Informacin-2003
P1
TR2
REG4
TR1
Sistemas de Informacin-2003
REG2 REG3
Regin
REG1
Estructura multidimensional
REG1
P1
REG2 REG3
Nivel de historial
TR1
REG4
TR2
Datos detallados
Producto Tr
im
est
re
Metadatos
Nivel de sntesis
Datos agregados
10
Tabla de dimensiones
Tabla de hechos
Agrupacin de datos
Ej.: Agrupar datos mensuales en trimestrales
Tipos de esquema
Esquema de estrella:
Divisin de datos
Esquema de copos
Tablas dimensinales organizadas jerrquicamente
Sistemas de Informacin-2003
11
Sistemas de Informacin-2003
12
Construccin de un Data
Warehouse
DW: Caractersticas
Salvado de datos limpios
OLAP
Extraccin
Preparacin (formateo y limpieza)
Carga
DATOS
Limpieza
Bases de Datos
Reformateo
MINERIA
DE DATOS
13
OLTP y OLAP
14
Transacciones predeterminadas
Utiliza pocas tablas
Sistemas de Informacin-2003
Sistemas de Informacin-2003
DSS
METADATOS
15
Sistemas de Informacin-2003
16
DW son multidimensionales
Vistas suelen ser relacionales
17
Errores a evitar
18
Implementacin: Dificultades
Sistemas de Informacin-2003
Alto coste
Urgente ayuda para la toma de decisiones
Data Mart
Cambio de necesidades
Nuevas fuentes de datos
Cambio de la capacidad
Cambio de tecnologa
Sistemas de Informacin-2003
20
Bibliografa
J.M. Franco. EDS-Institut Promthus, El
Data Warehouse. El Data Mining,
Eyrolles,1997.
Sistemas de Informacin-2003
Data Mining
21
Data Mining
22
Sistemas de Informacin-2003
Sistemas de Informacin-2003
23
Seleccin de datos
Limpieza de datos
Transformacin/Codificacin de datos
Minera de Datos
Presentacin visualizacin
Sistemas de Informacin-2003
24
Descubrir
Prediccin
Ej.: que compraran los clientes bajo determinados
descuentos
Reglas de asociacin
Patrones secuenciales
rboles de clasificacin
Identificacin
Ej.: secuencia de nucletidos presencia gen
Presentacin de Resultados
Clasificacin
Listas
Representaciones Grficas
Tablas resumen
Optimizacin
Sistemas de Informacin-2003
Conocimiento Descubierto
Sistemas de Informacin-2003
26
Tipos de reglas
X antecedente consecuente
Reglas de asociacin
Ej.: Compra bolso Compra zapatos
Jerarquas de clasificacin
Ej.: Clasificacin de los clientes de un banco
Patrones secuenciales
Ej.: Cmara digital Memorias MMC
Categorizacin y segmentacin
27
Sistemas de Informacin-2003
28
Clasificacin
Comienza con una muestra de datos de
clasificacin conocida
Los datos se dividen segn uno de sus atributos,
sucesivamente
Asociaciones: X Y
Correlaciones entre series
Sistemas de Informacin-2003
29
Asociaciones
Sistemas de Informacin-2003
30
Asociaciones negativas
Ej.: el 60% de los clientes que compran
patatas fritas no compran agua mineral
Si no combinacin de elementos
asociacin negativa
Sistemas de Informacin-2003
31
Sistemas de Informacin-2003
32
Otras Tcnicas
Regresin
Sistemas de Informacin-2003
Estadstica
Establecimiento de probabilidades
Redes neuronales
Entrenar la red
Reconocer los patrones segn el entrenamiento
Algoritmos genticos
33
Algoritmos probabilistas
Poblacin inicial
Sobreviven los mejores
Obtenemos datos en cada iteracin
Sistemas de Informacin-2003
Aplicaciones
34
Bibliografa
Marketing
Comportamiento del consumidor basado en patrones de
compra
Finanzas
Anlisis de rendimiento de operaciones
Solvencia de clientes
Valoracin de opciones de financiacin
Fabricacin
35
Sistemas de Informacin-2003
36
Sistemas de Informacin
Geogrfica
Jos Alberto Royo
joalroyo@unizar.es
Departamento de Informtica e Ingeniera de Sistemas
GIS: Categoras
Multidimensional (x,y,z,t,...)
Voluminosidad
Naturaleza inexacta (no hay representaciones
exactas de la Tierra)
Las preguntas combinan topologa, geografa y
otros atributos, con informacin aproximada
Combinan distintos contextos legales y
econmicos (varan de un pas a otro)
Variedad de datos
Representacin basada en campos
38
Informacin espacial
1. Aplicaciones Cartogrficas
Sistemas de Informacin-2003
39
Sistemas de Informacin-2003
40
10
Mapas
Estructuracin
Vectores (+verstil, -fcil de crear)
Interpretacin
Cierre de polgonos
Definicin, reduccin y mejora de detalles
Anlisis de proximidad
Clculo de zonas de inters
Otras funcionalidades
42
Extensibilidad
Sistemas de Informacin-2003
dnde estoy?
Problema debido a la variedad de tipos de datos
Visualizacin
1. Contorneado
Isolneas
2. Sombreado de montaas
3. Visualizaciones de perspectivas
Imgenes tridimensionales
Sistemas de Informacin-2003
43
Sistemas de Informacin-2003
44
11
Generacin de mapas
Seleccin de lugares
Creacin de planes de emergencia
Distribucin de datos
Separacin de datos espaciales y no espaciales
Versionado
Ej.: Qu pasa si construimos una autopista?
Estndares de Datos
Simulacin de transformaciones
medioambientales
Compartir de datos
Aplicaciones especficas
Sistemas de Informacin-2003
45
Sistemas de Informacin-2003
46
Bibliografa
Keith C. Clarke, Getting Started with
GIS, Prentice-Hall, 1997, ISBN 0-13-294786-2.
http://www.usgs.gov/research/gis/title.html
Sistemas de Informacin-2003
47
12