Está en la página 1de 25

Bases de datos

Conceptos de administración
de información
Ing. Eduardo Mauricio Campaña Ortega
Sílab
o
• 1. CONCEPTOS DE ADMINISTRACIÓN DE INFORMACIÓN
• 1.1 Almacenamiento y recuperación
• 1.2 Captura y representación
• 1.3 Búsqueda y recuperación

2
• 1.4 Análisis e indexamiento
• 1.5 Confiabilidad, seguridad, escalabilidad, eficiencia
Almacenamiento de
(Information
InformaciónStorage)
• El almacenamiento de la información se refiere a la
disposición persistente de datos que se conservan para
su acceso (de acuerdo a su propósito y vigencia),
generalmente desde los sistemas informáticos.
• El almacenamiento está relacionado con la disposición a
largo plazo, por tanto no se considera como
almacenamiento formal de datos, los mecanismos de
almacenamiento temporal en memoria principal (chips
de silicio de la RAM o memoria de acceso aleatorio).
• El almacenamiento externo se refiere al uso de
dispositivos de almacenamiento secundarios o auxiliares,
los cuales son capaces de conservar la información de
manera permanente.
Almacenamiento de
información
• La tecnología de almacenamiento actual utiliza
todo tipo de soportes. Por ejemplo, sistemas
WORM, bibliotecas de cintas y bibliotecas
virtuales.
• En los últimos años, los sistemas SAN y NAS han
demostrado su excelente fiabilidad.
Tecnologías de almacenamiento

• Las unidades SAN (Storage Network)


Area pueden ser rack (armarios) más
gestionan
cientos que
de discos duros, con más de 50 terabytes
de capacidad
• Las unidades NAS (Network Attached
Storage) son unidades independientes
que
sistemas cuentan con propios y
y de archivos
operativos discos duros que
gestionan los llevan
conectados.
Tecnologías de almacenamiento

• Los sistemas de discos duros SAN Serial ATA


(SATA) se están convirtiendo en una manera
rentable de disponer de gran capacidad de
almacenamiento.
• Otras tecnologías de almacenamiento, como
iSCSI, DAS (Direct Attached Storage), Near-Line
Storage (datos adjuntos en soportes extraíbles) y
CAS (Content Attached Storage), también
proporcionan disponibilidad.
Sistemas de almacenamiento de
Información
• Los sistemas que manejan datos, como Bases de
datos, Data-Warehouse, Meta-Datos, Data-
Mining, Cloud entre otros, son utilizados para
registrar datos, con una estructura lógica,
organizada y almacenada para su explotación.
• La explotación se refiere a almacenar, buscar,
recuperar y actualizar información.
Bases de Datos
(Databases)
• Es un conjunto de datos
relacionados coherentemente que almacenan
información.
• La información esta organizada y almacenada, para
su explotación.
• Los
los datos que puedan
usuarios necesitan, a través
buscar, de ylenguajes
recuperar
específicos
actualizar que permiten consultas
(expresión
formular lógica sobre la información).
• Las consultas permiten la identificación de un
subconjunto lógico de la base de datos, es decir, una
selección de registros que cumplen la condición
lógica.
Data
Warehouse
• Almacenamiento de grandes volúmenes de
datos (generalmente datos históricos).
• Se subdividen a veces en unidades lógicas más
pequeñas, Datamarts, dependientes de la lógica
de agrupación de los datos.
• Generalmente utilizadas para procesamiento
analítico de los datos (Sistemas de ayuda en la
decisión (DSS), Sistemas de información
ejecutiva (EIS) o herramientas para hacer
consulta o informes).
Data
Mining
• Data-Mining es un proceso para extraer
información útil a partir de grandes cantidades
de datos.
• Explotación del Data Warehouse.
• Transformar la información disponible en
conocimiento útil para el contexto.
Meta
Datos
• Sus funciones principales son la localización,
identificación y descripción de recursos, legibles
e interpretables a través de computador.
• Metadatos para la conservación, preservar los
recursos de información.
• Metadatos técnicos, sobre los
informar requerimientos hardware
técnicos del software o
• Metadatos de uso, informar sobre el nivel
de utilización, tipo de usuarios, etc.
Clou
d
• La nube es un avance en el suministro de
tecnología de la información y los servicios.
• Proporciona acceso bajo demanda a un conjunto
compartido de recursos informáticos, de forma
dinámica a escala.
• Ventajas en costes, rapidez y eficiencia.
• Función principal, almacenar datos de Base de
datos como servicio (DBaaS), específicamente en
torno a la información confidencial que se
almacena en la nube.
Sistemas de Recuperación de Información
(Information Retrieval System)
• Calvin N. Moores fue el primero en introducir el
término information retrieval, en el año 1950,
basado en organización; búsqueda y sistematización
y generación de técnicas. “La búsqueda de
información en un stock de documentos, efectuada
a partir de la especificación de un tema”.
• Jean Tague Sutcliffe identificó las variables que
definen a la recuperación de información como:
• Campo de estudio; colección de documentos o bases
de datos; representación de la información;
usuarios; consultas y frases u oraciones de búsqueda
o estrategia de búsqueda; intermediarios de
búsqueda; proceso de búsqueda y evaluación de la
búsqueda.
Sistemas de Recuperación
de Información
• Salton en 1983, define: “La recuperación de la
información tiene que ver con la representación,
almacenamiento, organización y acceso a los ítem de
información”. Indica que, en principio, no deben
existir limitaciones a la naturaleza del objeto
informativo
• Baeza-Yates incorpora la reflexión siguiente: “La
representación y organización debería proveer al
usuario un fácil acceso a la información en la que se
encuentre interesado. Desafortunadamente, la
caracterización de la necesidad informativa de un
usuario no es un problema sencillo de resolver”.
Sistemas de Recuperación
de Información
Recuperación de Recuperación de
datos información
Acierto Exacto Parcial, el mejor
Inferencia Algebraica Inductiva
Modelo Determinístico Posibilístico
Lenguaje de Fuertemente Estructurado o
consulta Estructurado Natural
Especificación Precisa Imprecisa
consulta
Error en la Sensible Insensible
respuesta
Sistemas de Recuperación
de Información
Necesidad de
Información
Base de Datos
Documentos
Relevantes

Recuperación
Documentos

Documentos
no Relevantes
Modelos de un
SRI
Modelo Descripción
Modelos clásicos Incluye los tres más comúnmente citados:
booleano, espacio vectorial y probabilístico.
Modelos Están basados en la Lógica Fuzzy.
alternativos
Basados en la Lógica Formal. La
Modelos lógicos recuperación de información es un proceso
inferencial.
Modelos basados Incluyen posibilidades de expansión del
en alcance de la búsqueda y hacen uso
la de retroalimentación por la
interactividad relevancia de los
documentos recuperados.
Modelos basados Bases de conocimiento, redes neuronales,
en la Inteligencia algoritmos genéticos y procesamiento
Evolución

• Almacenamientos estructurados, recuperación


estructurada.
• Recuperación de información en las bibliotecas
(semi-estructurada)
• World Wide Web: La evolución lógica de los SRI
ha sido hacia la web, donde han encontrado una
alta aplicación práctica y un aumento del
número de usuarios, especialmente en el campo
de los directorios y motores de búsqueda.
Captura y
representación
• La captura y representación de información constituyen parte
del procesamiento de datos.
• La captura se refiere a la obtención del dato.
• Un dato es un símbolo lingüístico o numérico o de índole
visual (pixel) o audible, que representa ya sea algo concreto
como abstracto.
• Datos + contexto, implica información.
• La captura implica técnicas eléctricas, electrónicas o
mecánicas usadas para manipular datos para el empleo
humano o de máquinas.
• Para la representación se definen formatos estandarizados
que permiten la interpretación de los símbolos que se
capturan.
Análisis de
datos
• El Análisis de Datos (Data Analysis) se refiere a la exploración
sistemática de volúmenes de datos en bruto (estructurados o no)
orientado a buscar comportamientos o información que pueda ser
deducida.
• Implica el proceso de inspeccionar, limpiar y transformar datos con el
objetivo de resaltar información útil, lo que sugiere conclusiones, y
apoyo a la toma de decisiones.
• El análisis de datos se distingue de la extracción de datos por su alcance,
su propósito y su enfoque sobre el análisis.
• Los extractores de datos clasifican inmensos conjuntos de datos usando
software sofisticado para identificar patrones no descubiertos y
establecer relaciones escondidas.
• El análisis de datos se centra en la inferencia, el proceso de derivar una
conclusión basándose solamente en lo que conoce el investigador.
• Fundamenta los Sistemas de información para la decisión, utilizados en
entornos empresariales.
• Se usa en las ciencias, para verificar o reprobar modelos o teorías
existentes.
Análisis de
datos
• El análisis de datos incluye por ejemplo, el procesamiento analítico
en línea (OLAP) hasta el análisis CRM en centros de llamadas.
• Los bancos y las compañías de tarjetas de crédito, por ejemplo,
analizan los retiros y los patrones de gasto para prevenir el fraude o
robo de identidad.
• Las compañías de comercio electrónico (Ecommerce) examinan el
tráfico en el sitio web o los patrones de navegación para determinar
qué clientes son más o menos propensos a comprar un cierto
producto o servicio, basándose en compras previas o patrones de
visualización.
• El análisis de datos moderno normalmente usa tableros de
información que se basan en flujos de datos en tiempo real.
• El llamado análisis en tiempo real implica análisis e informes
dinámicos basados en los datos que introducidos en un sistema un
minuto antes del tiempo actual de uso.
Análisis de
datos
• Análisis exploratorio de datos (EDA), donde se descubren
nuevas características en los datos,
• Análisis confirmatorio de datos (CDA), donde se prueba si las
hipótesis existentes son verdaderas o falsas.
• El análisis cuantitativo de datos (QDA) es usado en las ciencias
sociales para sacar conclusiones de datos no numéricos, como
palabras, fotografías o videos.
Indexamiento
• El indexamiento se refiere a ordenar una serie de datos o
informaciones de acuerdo a un criterio común a todos ellos,
para facilitar su consulta y análisis.
• Indexar datos almacenados depende de cuál es su estructura,
base de datos, datawarehouse, etc.
• El indexamiento en bases de datos produce información
estructurada de apoyo que permite el ordenamiento y la
localización directa de información.
• El indexamiento requiere de estructuras previamente
acordadas y de algoritmos que manejen dichas estructuras
para mantenerlas actualizadas, conforme la información sea
agregada, modificada o eliminada.
Indexamiento
• El índice de una base de datos es una estructura de datos que
mejora la velocidad de las operaciones, por medio de
identificador único de cada fila de una tabla, permitiendo un
rápido acceso a los registros de una tabla en una base de
datos.
• El índice tiene un funcionamiento similar al índice de un libro,
guardando parejas de elementos: el elemento que se desea
indexar y su posición en la base de datos. Para buscar un
elemento que esté indexado, sólo hay que buscar en el índice
dicho elemento para, una vez encontrado, devolver el registro
que se encuentre en la posición marcada por el índice.
• Los índices son construidos sobre árboles B, B+, B* o sobre
una mezcla de ellos, funciones de cálculo u otros métodos.
Confiabilidad, seguridad, escalabilidad y
eficiencia
• Respecto de las características de calidad que debe reunir el
entorno de soporte de la información almacenada.
• En el caso de las bases de datos, los DBMS (Data Base
Management System).
• Confiabilidad, soporte seguro de la información almacenada,
no susceptible a pérdidas por eventos no programados.
• Seguridad, acceso por perfiles a la información.
• Escalabilidad, crecimiento horizontal (incorporación de nuevas
tablas o nuevos campos en tablas) y vertical (volumen de
registros) de las bases de datos. También se refiere a la
escalabilidad del hardware de soporte.
• Eficiencia, respuesta exitosa ante la gestión de los datos
(tiempo, exactitud).

También podría gustarte