Está en la página 1de 29

PREGUNTAS DE REPASO TEMA N° 1

1. ¿ Que es sistemas de información?


R. Un sistema de información (SI) es un conjunto de elementos orientados al
tratamiento y administración de datos e información, organizados y listos para su
uso posterior, generados para cubrir una necesidad o un objetivo. Dichos elementos
formarán parte de alguna de las siguientes categorías:

 Personas;
 Actividades o técnicas de trabajo;
 Datos;
 Recursos materiales en general [(Papel, lápices, libros, carpetas, etc. Estas
actividades de recolección y procesamiento de información, eran actividades
manuales y solo con la llegada de la tecnología, (computadoras, Internet,
etc., se han convertido en sistemas con recursos informáticos y de
comunicación).

Todos estos elementos interactúan para procesar los datos (incluidos los procesos
manuales y automáticos) y dan lugar a información más elaborada, que se distribuye
de la manera más adecuada posible en una determinada organización, en función
de sus objetivos. Si bien la existencia de la mayor parte de sistemas de información
son de conocimiento público, recientemente se ha revelado que desde finales del
siglo XX diversos gobiernos han instaurado sistemas de información para el
espionaje de carácter secreto.

Habitualmente el término "sistema de información" se usa de manera errónea como


sinónimo de sistema de información informático, en parte porque en la mayoría de
los casos los recursos materiales de un sistema de información están constituidos
casi en su totalidad por sistemas informáticos. Estrictamente hablando, un sistema
de información no tiene por qué disponer de dichos recursos (aunque en la práctica
esto no suela ocurrir). Se podría decir entonces que los sistemas de información
informáticos son una subclase o un subconjunto de los sistemas de información en
general.

2. ¿ Cuáles son las características de sistemas de información?


R. Para habla de las características de los sistemas de información (de ahora en
demás SI), debemos definir que es un SI, y esos los podemos definir citando a
Andreu, Ricart y Valor (1991), en esta definición un SI queda definido como:
“conjunto formal de procesos que, operando sobre una colección de datos
estructurada de acuerdo a las necesidades de la empresa, recopila, elabora y
distribuyen selectivamente la información necesaria para la operación de dicha
empresa y para las actividades de dirección y control correspondientes, apoyando,
al menos en parte, los procesos de toma de decisiones necesarios para
desempeñar funciones de negocio de la empresa de acuerdo con su estrategia”. Un
SI tiene diversas características dependiendo de la perspectiva con la que se
observa, lo dividiremos en dos grupos (1) desde la naturaleza:

 Propósito u objetivo.
 Globalismo o totalidad.
 Entropía.
 Homeostasis.

Propósito u objetivo: todo sistema tiene uno o algunos propósitos. Los elementos (u
objetos), como también las relaciones, definen una distribución que trata siempre
de alcanzar un objetivo.

Globalismo o totalidad: un cambio en una de las unidades del sistema, con


probabilidad producirá cambios en las otras. El efecto total se presenta como un
ajuste a todo el sistema. Hay una relación de causa/efecto. De estos cambios y
ajustes, se derivan dos fenómenos: entropía y homeostasia.

Entropía: es la tendencia de los sistemas a desgastarse, a desintegrarse, para el


relajamiento de los estándares y un aumento de la aleatoriedad. La entropía
aumenta con el correr del tiempo. Si aumenta la información, disminuye la entropía,
pues la información es la base de la configuración y del orden. De aquí nace la
negentropía, o sea, la información como medio o instrumento de ordenación del
sistema.

Homeostasia: es el equilibrio dinámico entre las partes del sistema. Los sistemas
tienen una tendencia a adaptarse con el fin de alcanzar un equilibrio interno frente
a los cambios externos del entorno.

Una organización podrá ser entendida como un sistema o subsistema o un


supersistema, dependiendo del enfoque. El sistema total es aquel representado por
todos los componentes y relaciones necesarios para la realización de un objetivo,
dado un cierto número de restricciones. Los sistemas pueden operar, tanto en serie
como en paralelo.

3. ¿Cuáles son los elementos que conforman us sistema de información?


R. (1) Base de Datos: Es donde se almacena toda la información que se requiere
para la toma de decisiones. La información se organiza en registros específicos e
identificables.

(2) Transacciones: Corresponde a todos los elementos de interfaz que permiten al


usuario: consultar, agregar, modificar o eliminar un registro específico de
Información;
(3) Informes: Corresponden a todos los elementos de interfaz mediante los cuales
el usuario puede obtener uno o más registros y/o información de tipo estadístico
(contar, sumar) de acuerdo a criterios de búsqueda y selección definidos.

Los restantes elementos de un sistema de información son:

(4) Procesos: Corresponden a todos aquellos elementos que, de acuerdo a una


lógica predefinida, obtienen información de la base de datos y generan nuevos
registros de información. Los procesos sólo son controlados por el usuario (de ahi
que aparezca en línea de puntos);

(5) Usuario: Identifica a todas las personas que interactúan con el sistema, esto
incluye desde el máximo nivel ejecutivo que recibe los informes de estadísticas
procesadas, hasta el usuario operativo que se encarga de recolectar e ingresar la
información al sistema y

(6) Procedimientos Administrativos: Corresponde al conjunto de reglas y políticas


de la organización, que rigen el comportamiento de los usuarios frente al sistema.
Particularmente, debieran asegurar que nunca, bajo ninguna circunstancia un
usuario tenga acceso directo a la Base de Datos.

4. ¿A qué se denomina periféricos?


R. En informática, periférico es la denominación genérica para designar al aparato
o dispositivo auxiliar e independiente conectado a la unidad central de
procesamiento de una computadora.

Se consideran periféricos a las unidades o dispositivos de hardware a través de los


cuales la computadora se comunica con el exterior, y también a los sistemas que
almacenan o archivan la información, sirviendo de memoria auxiliar de la memoria
principal.

Se considera periférico al conjunto de dispositivos que sin pertenecer al núcleo


fundamental de la computadora, formado por la unidad central de procesamiento
(CPU) y la memoria central, permitan realizar operaciones de entrada/salida (E/S)
complementarias al proceso de datos que realiza la CPU. Estas tres unidades
básicas en un computador, CPU, memoria central y el subsistema de E/S, están
comunicadas entre sí por tres buses o canales de comunicación:

 Direcciones, para seleccionar la dirección del dato o del periférico al que se


quiere acceder.
 Control, básicamente para seleccionar la operación a realizar sobre el dato
(principalmente lectura, escritura o modificación).
 Datos, por donde circulan los datos.

5. ¿Cuáles son las funciones de los periféricos?


R. En informática, periférico es la denominación genérica para designar al aparato
o dispositivo auxiliar e independiente conectado a la unidad central de
procesamiento de una computadora.

Se consideran periféricos a las unidades o dispositivos de hardware a través de los


cuales la computadora se comunica con el exterior, y también a los sistemas que
almacenan o archivan la información, sirviendo de memoria auxiliar de la memoria
principal.

Se considera periférico al conjunto de dispositivos que sin pertenecer al núcleo


fundamental de la computadora, formado por la unidad central de procesamiento
(CPU) y la memoria central, permitan realizar operaciones de entrada/salida (E/S)
complementarias al proceso de datos que realiza la CPU. Estas tres unidades
básicas en un computador, CPU, memoria central y el subsistema de E/S, están
comunicadas entre sí por tres buses o canales de comunicación:

 Direcciones, para seleccionar la dirección del dato o del periférico al que se


quiere acceder.
 Control, básicamente para seleccionar la operación a realizar sobre el dato
(principalmente lectura, escritura o modificación).
 Datos, por donde circulan los datos.

6. ¿Cómo se define la localización de datos?


R. La localización (abreviada “l10n”) es el proceso de adaptar un proceso o servicio
a un lenguaje, cultura y aspecto local particular deseado. Idealmente, un producto
o un servicio se desarrolla para que la localización sea fácil de alcanzar – por
ejemplo, creando ilustraciones técnicas para manuales en los que el texto puede
ser cambiado fácilmente a otro idioma y permitiendo un espacio para expansión con
este propósito. Este proceso se denomina internacionalización (internationalization).
Un producto o servicio internacionalizado es, por lo tanto, más fácil de localizar. Este
proceso, de primero permitir que un producto sea localizado y luego localizarlo para
diferentes audiencias nacionales, es a veces conocido como globalización
(globalization).

Cuando se localiza un producto, además de la traducción idiomática del idioma, los


detalles como las zonas horarias, moneda, fiestas nacionales, sensibilidades
locales de colores, nombres de productos o servicios, roles de género y ejemplos
geográficos, deben ser todos considerados. Un servicio o producto localizado
exitosamente es aquel que parece haberse desarrollado en la cultura local.
La traducción del idioma, que es una gran parte de la localización, puede a veces
facilitarse con traducción automática (automatic language translation). Sin embargo,
usualmente requiere bastante trabajo adicional.

7. ¿Qué función cumple un SGBD?


R. CARACTERÍSTICAS DE LOS SGBD

Un sistema gestor de bases de datos o SGBD (aunque se suele utilizar más a


menudo las siglas DBMS procedentes del inglés, Data Base Management System)
es el software que permite a los usuarios procesar, describir, administrar y recuperar
los datos almacenados en una base de datos.

En estos Sistemas se proporciona un conjunto coordinado de programas,


procedimientos y lenguajes que permiten a los distintos usuarios realizar sus tareas
habituales con los datos, garantizando además la seguridad de los mismos.
DBMS

El éxito del SGBD reside en mantener la seguridad e integridad de los datos.


Lógicamente tiene que proporcionar herramientas a los distintos usuarios. Entre las
herramientas que proporciona están:

 Herramientas para la creación y especificación de los datos. Así como la


estructura de la base de datos.
 Herramientas para administrar y crear la estructura física requerida en las
unidades de almacenamiento.
 Herramientas para la manipulación de los datos de las bases de datos, para
añadir, modificar, suprimir o consultar datos.
 Herramientas de recuperación en caso de desastre
 Herramientas para la creación de copias de seguridad
 Herramientas para la gestión de la comunicación de la base de datos
 Herramientas para la creación de aplicaciones que utilicen esquemas
externos de los datos
 Herramientas de instalación de la base de datos
 Herramientas para la exportación e importación de datos

Los SGBD tienen que realizar tres tipos de funciones para ser considerados válidos.

1-Función de descripción o definición

Permite al diseñador de la base de datos crear las estructuras apropiadas para


integrar adecuadamente los datos. Este función es la que permite definir las tres
estructuras de la base de datos (relacionadas con sus tres esquemas).
♦ Estructura interna
♦ Estructura conceptual
♦ Estructura externa

Esta función se realiza mediante el lenguaje de descripción de datos o DDL.


Mediante ese lenguaje:
♦ Se definen las estructuras de datos
♦ Se definen las relaciones entre los datos
♦ Se definen las reglas que han de cumplir los datos

2-Función de manipulación

Permite modificar y utilizar los datos de la base de datos. Se realiza mediante el


lenguaje de modificación de datos o DML. Mediante ese lenguaje se puede:
♦ Añadir datos
♦ Eliminar datos
♦ Modificar datos
♦ Buscar datos

Actualmente se suele distinguir aparte la función de buscar datos en la base de


datos (función de consulta). Para lo cual se proporciona un lenguaje de consulta de
datos o DQL.

3-Función de control

Mediante esta función los administradores poseen mecanismos para proteger las
visiones de los datos permitidas a cada usuario, además de proporcionar elementos
de creación y modificación de esos usuarios.
Se suelen incluir aquí las tareas de copia de seguridad, carga de ficheros, auditoria,
protección ante ataques externos, configuración del sistema, etc.

El lenguaje que implementa esta función es el lenguaje de control de datos o DCL.

1. El proceso lanzado por el usuario llama al SGBD indicando la porción de la


base de datos que se desea tratar
2. El SGBD traduce la llamada a términos del esquema lógico de la base de
datos. Accede al esquema lógico comprobando derechos de acceso y la
traducción física (normalmente los metadatos se guardan una zona de
memoria global y no en el disco)
3. El SGBD obtiene el esquema físico
4. El SGBD traduce la llamada a los métodos de acceso del Sistema Operativo
que permiten acceder realmente a los datos requeridos
5. El Sistema Operativo accede a los datos tras traducir las órdenes dadas por
el SGBD
6. Los datos pasan del disco a una memoria intermedia o buffer. En ese buffer
se almacenarán los datos según se vayan recibiendo
7. Los datos pasan del buffer al área de trabajo del usuario (ATU) del proceso
del usuario. Los pasos 6 y 7 se repiten hasta que se envíe toda la información
al proceso de usuario.
8. En el caso de que haya errores en cualquier momento del proceso, el SGBD
devuelve indicadores en los que manifiesta si ha habido errores o
advertencias a tener en cuenta. Esto se indica al área de comunicaciones del
proceso de usuario. Si las indicaciones son satisfactorias, los datos de la ATU
serán utilizables por el proceso de usuario.

Estructuras operacionales

Actualmente casi todos los sistemas gestores de base de datos poseen también la
misma idea operacional (la misma forma de funcionar con el cliente) en la que se
entiende que la base de datos se almacena en un servidor y hay una serie de
clientes que pueden acceder a los datos del mismo. Las posibilidades son:

 Estructura Cliente-Servidor. Estructura clásica, la base de datos y su SGBD


están en un servidor al cual acceden los clientes. El cliente posee software
que permite al usuario enviar instrucciones al SGBD en el servidor y recibir
los resultados de estas instrucciones. Para ello el software cliente y el
servidor deben utilizar software de comunicaciones en red.
 Cliente multi-servidor. Ocurre cuando los clientes acceden a datos situados
en más de un servidor. También se conoce esta estructura como base de
datos distribuida. El cliente no sabe si los datos están en uno o más
servidores, ya que el resultado es el mismo independientemente de dónde
se almacenan los datos. En esta estructura hay un servidor de aplicaciones
que es el que recibe las peticiones y el encargado de traducirlas a los
distintos servidores de datos para obtener los resultados.
 Cliente-Servidor con facilidades de usuario-Servidor de base de datos. Se
trata de una forma de conexión por el que los clientes no conectan
directamente con la base de datos sino con un intermediario (normalmente
un Servidor Web) que tiene una mayor facilidad para comunicarse con los
usuarios.

Modelos de organización de la base de datos

Se distinguen principalmente estos tipos:

 jerárquico
 red
 relacional
 orientada a objeto

Modelo de jerárquico de datos:

Una clase de modelo lógico de bases de datos que tiene una estructura
arborescente. Un registro subdivide en segmentos que se interconectan en
relaciones padre e hijo y muchos más. Los primeros sistemas administradores de
bases de datos eran jerárquicos. Puede representar dos tipos de relaciones entre
los datos: relaciones de uno a uno y relaciones de uno a muchos

Modelo de datos en red:

Es una variación del modelo de datos jerárquico. De hecho las bases de datos
pueden traducirse de jerárquicas a en redes y viceversa con el objeto de optimizar
la velocidad y la conveniencia del procesamiento. Mientras que las estructuras
jerárquicas describen relaciones de muchos a muchos.

Modelo relacional de datos:

Es el más reciente de estos modelos, supera algunas de las limitaciones de los otros
dos anteriores. El modelo relacional de datos representa todos los datos en la base
de datos como sencillas tablas de dos dimensiones llamadas relaciones. Las tablas
son semejantes a los archivos planos, pero la información en más de un archivo
puede ser fácilmente extraída y combinada. Es el que estudiaremos con más
detalle.

Modelo orientado a objeto:

Las bases de datos orientadas a objetos, tienen una organización similar a la de los
árboles. Donde cada nodo del árbol representa un campo y cada árbol un registro,
cada tipo de nodo tiene un método distinto de búsqueda. Que es equivalente a decir
que todos los campos pueden ser utilizados como campos llave, pero complica el
diseño. Si la base de datos es demasiado grande, o tiene relaciones demasiado
complejas el grafo resultante se vuelve una maraña ininteligible.

8. ¿Defina un SQL?
R. SQL (Structured Query Language) es un lenguaje de programación estándar e
interactivo para la obtención de información desde una base de datos y para
actualizarla. Aunque SQL es a la vez un ANSI y una norma ISO, muchos productos
de bases de datos soportan SQL con extensiones propietarias al lenguaje estándar.
Las consultas toman la forma de un lenguaje de comandos que permite seleccionar,
insertar, actualizar, averiguar la ubicación de los datos, y más. También hay una
interfaz de programación.
9. ¿Qué es un esquema de base de datos?
R. Un esquema de base de datos representa la configuración lógica de todo o parte
de una base de datos relacional. Puede existir de dos formas: como representación
visual y como un conjunto de fórmulas conocidas como restricciones de integridad
que controlan una base de datos. Estas fórmulas se expresan en un lenguaje de
definición de datos, tal como SQL. Como parte de un diccionario de datos, un
esquema de base de datos indica cómo las entidades que conforman la base de
datos se relacionan entre sí, incluidas las tablas, las vistas, los procedimientos
almacenados y mucho más.

Típicamente, un diseñador de bases de datos crea un esquema de base de datos


para ayudar a los programadores cuyo software interactuará con la base. Al proceso
de crear un esquema de base de datos se le llama modelado de datos. Al seguir el
enfoque de tres esquemas para el diseño de bases de datos, este paso seguiría la
creación de un esquema conceptual. Los esquemas conceptuales se enfocan en
las necesidades informativas de una organización, más que en la estructura de una
base de datos.

Hay dos tipos principales de esquemas de bases de datos:

1. Un esquema lógico de base de datos expresa las restricciones lógicas que


se aplican a los datos almacenados. Puede definir las restricciones de
integridad, las vistas y las tablas.
2. Un esquema físico de base de datos dispone cómo se almacenan los datos
físicamente en un sistema de almacenamiento en términos de archivos e
índices.

En el nivel más básico, un esquema de base de datos indica qué tablas o relaciones
componen la base de datos, así como los campos incluidos en cada tabla. Por lo
tanto, los términos diagrama de esquema y diagrama de relaciones de entidades
con frecuencia son intercambiables.

El término "esquema de base de datos" puede referirse a una representación visual


de una base de datos, a un conjunto de reglas que rige una base de datos, o bien,
a todo el conjunto de objetos que pertenecen a un usuario en particular. Continúa
leyendo para saber más sobre los esquemas de bases de datos y cómo se usan
10 ¿Qué es un atributo derivado?
R. Agregación: Abstracción a través de la cual las relaciones se tratan como
entidades de nivel más alto.

Atributo derivado: Atributo cuyo valor puede derivarse de los valores de otros
atributos o entidades relacionados.

Atributos: Propiedades que posee cada miembro de un conjunto de entidades.

Atributos descriptivos: Propiedades que brindan datos o información extra, útil y/o
necesaria en la relación de entidades.
Atributos monovalorados y multivalorados: Los monovalorados sólo pueden
contener un valor, los multivalorados pueden contener múltiples valores.

Atributos simples y compuestos: Los simples no están divididos en subpartes, los


compuestos se pueden dividir en subpartes, es decir, en otros atributos.

Conjunto de entidades: Conjunto de entidades del mismo tipo que comparten las
mismas propiedades o atributos.

Conjunto de relaciones: Conjunto de asociaciones entre diferentes entidades del


mismo tipo.

 Conjunto de relaciones binario: Implica a 2 conjuntos de entidades.


 Conjunto de entidades recursivo: El mismo conjunto de entidades participa
en una relación más de una vez con diferentes papeles.

Conjunto de entidades débiles y fuertes: El conjunto de entidades débiles no tiene


suficientes atributos para formar una clave primaria, el conjunto de entidades fuertes
sí tiene una clave primaria. Un conjunto de entidades débiles no puede existir sin su
conjunto de entidades fuertes.

 Atributos discriminantes: Conjunto de atributos que permiten distinguir todas


aquellas entidades del conjunto de entidades débiles.
 Relaciones identificadoras: La relación que asocia el conjunto de entidades
débiles con el conjunto de entidades identificadoras.

Correspondencia de cardinalidad: Número de entidades a las que otra entidad se


puede asociar a través de un conjunto de relaciones. Relación uno-a-uno, uno-a-
varios, varios-a-uno, varios-a-varios.

Diagrama E-R: Estructura general que permite expresar gráficamente el esquema


de una empresa.

Dominio: Conjunto de valores permitidos para cada atributo.

Entidad: Objeto que existe y es distinguible de otros objetos.

Especialización y Generalización: Especialización es el proceso de designar


subgrupos dentro de un conjunto de entidades; Generalización es unir dos o más
conjuntos para producir un conjunto de entidades de más alto nivel.

 Superclase y Subclase: El conjunto de entidades de nivel más alto y más


bajo, respectivamente.
 Herencia de atributos: Los atributos de los conjuntos de entidades de nivel
más alto son heredados por los de nivel más bajo.
Grado de un conjunto de relaciones: Número de conjuntos de entidades en un
conjunto de relaciones.

Lenguaje de modelado unificado (UML): Es un lenguaje que proporciona un medio


gráfico de modelar varios componentes de un sistema de software. El componente
diagrama de clase de UML se basa en diagramas E-R. Sin embargo, hay algunas
diferencias entre ambos.

Modelo de datos entidad-relación: Herramienta gráfica para definir datos basada en


una percepción del mundo real consistente en un conjunto de objetos básicos
llamados entidaeds y en relaciones entre esos objetos.

Papel: Función que desempeña una entidad en una relación.

Participación: Asociación entre conjuntos de entidades.

 Participación total: Cada entidad de un conjunto de entidades participa al


menos en una relación del conjunto de relaciones.
 Participación parcial: Sólo algunas entidades de un conjunto de entidades
participan en relaciones del conjunto de relaciones.

Relación: Asociación entre diferentes entidades.

Superclave, clave candidata y clave primaria: La superclave es un conjunto de uno


o más atributo tomados colectivamente que permiten identificar unívocamente a una
entidad. De todos esos atributos se van descartando los que no sean necesarios
para esa identificación teniendo cada vez de estas una clave candidata. Así se
busca obtener la superclave mínima para finalmente llegar a la clave primaria del
conjunto de entidades.

Valor nulo: Es el valor que tendrá un atributo cuando una entidad no tiene un valor
para el atributo. Este valor nulo puede indicar «no aplicable», es decir, que el valor
no existe para la entidad. También puede designar que el valor de un atributo es
desconocido, que puede ser perdido (el valor existe pero no se tiene esa
información) o bien desconocido (no se conoce si el valor existe realmente o no).

11. ¿Qué es una base de datos relacional?


R. Una base de datos relacional es una colección de elementos de datos
organizados en un conjunto de tablas formalmente descritas desde la que se puede
acceder a los datos o volver a montarlos de muchas maneras diferentes sin tener
que reorganizar las tablas de la base. La base de datos relacional fue inventada por
E.F. Codd en IBM en 1970.
La interfaz estándar de programa de usuario y aplicación a una base de datos
relacional es el lenguaje de consultas estructuradas (SQL). Los comandos de SQL
se utilizan tanto para consultas interactivas para obtener información de una base
de datos relacional y para la recopilación de datos para los informes.

Además de ser relativamente fáciles de crear y acceder, una base de datos


relacional tiene la importante ventaja de ser fácil de extender. Después de la
creación original de una base de datos, una nueva categoría de datos se puede
añadir sin necesidad de que todas las aplicaciones existentes sean modificadas.

Una base de datos relacional es un conjunto de tablas que contienen datos provistos
en categorías predefinidas. Cada tabla (que a veces se llaman ‘relación’) contiene
una o más categorías de datos en columnas. Cada fila contiene una instancia única
de datos para las categorías definidas por las columnas. Por ejemplo, una base de
datos típica de ingreso de solicitudes de negocio incluiría una tabla que describiera
a un cliente con columnas para el nombre, dirección, número de teléfono, y así
sucesivamente. Otra tabla identificaría el pedido: producto, cliente, fecha, precio de
venta, y así sucesivamente. Un usuario de la base de datos podría obtener una vista
de la base de datos que se ajuste a sus necesidades. Por ejemplo, un gerente de
sucursal podría preferir una vista o informe sobre todos los clientes que han
comprado productos después de una fecha determinada. Un gerente de servicios
financieros en la misma empresa podría, desde las mismas tablas, obtener un
informe sobre las cuentas que deben ser pagadas.

Al crear una base de datos relacional, se puede definir el dominio de posibles


valores de una columna de datos y restricciones adicionales que pueden aplicarse
a ese valor de dato. Por ejemplo, un dominio de posibles clientes podría permitir un
máximo de diez posibles nombres de clientes pero estar compilado en una tabla
que permita que sólo tres de estos nombres de clientes puedan ser especificados.

La definición de una base de datos relacional resulta en una tabla de metadatos o


descripciones formales de las tablas, columnas, dominios y restricciones.

12. ¿Qué significa por E.A.R.?


R. Entidad-atributo-relacion
13. ¿un modelo de base de dato es?
R. Un modelo de base de datos (Data Información Estructurada) es un tipo de
modelo de datos que determina la estructura lógica de una base de datos y de
manera fundamental determina el modo de almacenar, organizar y manipular los
datos.

Entre los modelos lógicos comunes para bases de datos se encuentran:


 Modelo jerárquico
 Modelo en red
 Modelo relacional
 Modelo entidad–relación
 Modelo entidad–relación extendido
 Base de datos orientada a objetos
 Modelo documental
 Modelo entidad–atributo–valor
 Modelo en estrella

Los modelos físicos de datos incluyen:

 Índice invertido
 Fichero plano

Otros modelos lógicos pueden ser:

 Modelo asociativo
 Modelo multidimensional
 Modelo multivalor
 Modelo semántico
 Base de datos XML
 Grafo etiquetado

14. ¿Qué expresan las relaciones?


R. las relaciones expresan una base de datos, en primer lugar debe dividir la
información que desea almacenar como temas distintos y después indicar a visual
FoxPro como se relacionan estos temas para que pueda recuperar la información
correcta cuando sea necesario.

15. ¿Qué es un modelo de base de datos jerárquicos?


R. Una base de datos jerárquica es un tipo de sistema de gestión de bases de datos
que, como su nombre indica, almacena la información en una estructura jerárquica
que enlaza los registros en forma de estructura de árbol (similar a un árbol visto al
revés), en donde un nodo padre de información puede tener varios nodos hijo, y así
sucesivamente.

Esta relación jerárquica no es estrictamente obligatoria, de manera que pueden


establecerse relaciones entre nodos hermanos, y en este caso, la estructura en
forma de árbol se convierte en una estructura en forma de grafo dirigido (esta
variante se denomina Bases de datos de red).
16. ¿Qué es un modelo de base de, datos interactúa entre el diseñador, el
programador y usuario?
R. Usuarios normales. Son usuarios no sofisticados que interactúan con el sistema
mediante un programa de aplicación con una interfaz de formularios, donde puede
rellenar los campos apropiados del formulario. Estos usarios pueden también
simplemente leer informes generados de la base de datos.

Programadores de aplicaciones. Son profesionales informáticos que escriben los


programas de aplicación, utilizando herramientas para desarrollar interfaces de
usuario, como las herramientas de desarrollo rápido de aplicaciones (DRA), que
facilitan crear los formularios e informes sin escribir directamente el programa.

Usuarios sofisticados. Interactúan con el sistema sin programas escritos, usando el


lenguaje de consulta de base de datos para hacer sus consultas. Los analistas que
envían las consultas para explorar los datos en la base de datos entran en esta
categoría, usando ellos las herramientas de procesamiento analítico en línea
(OLAP, OnLine Analytical Processing), o herramientas de recopilación de datos.

Usuarios especializados. Son usuarios sofisticados que escriben aplicaciones de


bases de datos especializadas y adecuadas para el procesamiento de datos
tradicional. Entre estas aplicaciones están los sistemas de diseño asistido por
computadora, sistemas de base de conocimientos y sistemas expertos, sistemas
que almacenan datos de tipos de datos complejos (como gráficos y de audio) y
sistemas de modelado de entorno.

Administradores de la base de datos (ABD). Son las personas que tienen el control
central del SGBD. Entre las funciones del ABD se encuentran:

 Definición del esquema de la base de datos.


 Definición de la estructura y el método de acceso.
 Modificación del esquema y la organización física.
 Concensión de autorización para el acceso a los datos.
 Mantenimiento rutinario.

17. ¿Qué es un proceso de diseño de una base de datos?


R. Una base de datos correctamente diseñada le proporciona acceso a información
actualizada y precisa. Dado que un diseño correcto es esencial para lograr los
objetivos en trabajar con una base de datos, dedique tiempo necesaria para obtener
información sobre los principios de un buen diseño tenga sentido. Al final, que es
mucho más probable que acabe con una base de datos que satisfaga sus
necesidades y fácilmente puede acomodar el cambio.
En este artículo se proporciona instrucciones para planear una base de datos de
escritorio. Aprenderá cómo decidir qué información que necesita, cómo dividir la
información en las tablas y columnas adecuadas y las tablas se relacionan entre sí.
Debe leer este artículo antes de crear la primera base de datos de escritorio.

18. ¿Qué expresan los verbos?


R. El verbo es la parte de la oración o categoría léxica que expresa acción,
movimiento, existencia, consecución, condición o estado del sujeto. Sintácticamente
representa una predicación. En la oración, el verbo conjugado funciona como el
núcleo sintáctico del predicado (si el verbo está en una forma conjugada ocupará
en general la posición del núcleo del sintagma de tiempo, y si no de un sintagma
verbal ordinario).

Los verbos, según su valencia o gramática, pueden ser clasificados en intransitivos,


transitivos, ditransitivos, etc. Son transitivos cuando el verbo requiere más de un
argumento obligatorio. Los intransitivos tienen un solo argumento obligatorio.

19. ¿Qué es un modelo conceptual?


R. Conocido también como modelo de dominio el cual es la descripción de cómo se
relacionan los conceptos en un problema. El modelo conceptual sirve para
representar un problema de manera grafica a través de diagramas entidad relación,
diccionarios/glosarios y diagrama de clases, por ejemplo.

¿Para qué modelar?


Es importante para abstraer un problema e identificar como interactúa el sistema en
el cual se desenvuelve la solución. Al modelar un problema se identifica su
funcionamiento y es realizado para solucionar problemas.

¿Qué vamos a obtener simulando?


La simulación es la imitación del sistema en un ordenador, con esto se obtendrá el
comportamiento del sistema y se observara cómo reacciona con los parámetros de
entrada lo cual nos informará acerca de qué solución elegir para enfrentar de mejor
manera el problema.

20. ¿el proceso de diseño de base de datos es un proceso de:


Diseño físico y diccionario de datos, estudio piloto, conversión de datos, generación
de documentos, manuales de procedimientos.
21. ¿las técnicas mas empleadas para la creación de bases de datos
relacionales son:
Inventario de los datos existentes estructura de la información diccionarios de datos,
pruebas, ejemplos de macros, productos, programas de modelo y listado,
anotaciones y manuales de procedimiento.
22. ¿en que está basado el modelo relacional?
R. Concepto: El modelo relacional para la gestión de una base de datos es un
modelo de datos basado en la lógica de predicados y en la teoría de conjuntos. Es
el modelo más utilizado en la actualidad para modelar problemas reales y
administrar datos dinámicamente

• Tablas y tuplas: Tabla en las bases de datos, se refiere al tipo de modelado de


datos, donde se guardan los datos recogidos por un programa. Su estructura
general se asemeja a la vista general de un programa de Hoja de cálculo.

• Representación de tablas.

Las tablas se componen de dos estructuras:

Registro: Es cada una de las filas en que se divide la tabla. Cada registro contiene
datos de los mismos tipos que los demás registros. Ejemplo: en una tabla de
nombres y direcciones, cada fila contendrá un nombre y una dirección.
Campo: Es cada una de las columnas que forman la tabla. Contienen datos de tipo
diferente a los de otros campos. En el ejemplo anterior, un campo contendrá un tipo
de datos único, como una dirección, o un número de teléfono, un nombre, etc.

23. ¿Cuáles son los modelos lógicos comunes?


R. Un modelo de base de datos (Data Información Estructurada) es un tipo de
modelo de datos que determina la estructura lógica de una base de datos y de
manera fundamental determina el modo de almacenar, organizar y manipular los
datos.

Entre los modelos lógicos comunes para bases de datos se encuentran:

 Modelo jerárquico
 Modelo en red
 Modelo relacional
 Modelo entidad–relación
 Modelo entidad–relación extendido
 Base de datos orientada a objetos
 Modelo documental
 Modelo entidad–atributo–valor
 Modelo en estrella

Los modelos físicos de datos incluyen:

 Índice invertido
 Fichero plano

Otros modelos lógicos pueden ser:

 Modelo asociativo
 Modelo multidimensional
 Modelo multivalor
 Modelo semántico
 Base de datos XML
 Grafo etiquetado

24. ¿Qué es lo que determina el modelo de base de datos?


R. Este modelo define una base de datos como una colección de objetos, o
elementos de software reutilizables, con funciones y métodos relacionados. Hay
varios tipos de bases de datos orientadas a objetos:

Una base de datos multimedia incorpora elementos multimedia, tales como


imágenes, que no se podrían almacenar en una base de datos relacional.

Una base de datos de hipertexto permite que cualquier objeto se conecte a cualquier
otro objeto. Es útil para organizar lotes de datos disímiles, pero no es ideal para
análisis numérico.

El modelo de base de datos orientado a objetos es el mejor modelo conocido de


base de datos posrelacional ya que incorpora tablas, pero no se limita a ellas. A
dichos modelos también se los conoce como modelos de base de datos híbridos.
PREGUNTAS DE REPASO TEMA N° 2

1. ¿Qué es un modelo entidad-relacion?


R. Un modelo entidad-relación o diagrama entidad-relación (a veces denominado
por sus siglas en inglés, E-R Entity relationship; en español DER: "Diagrama de
Entidad-Relación") es una herramienta para el modelado de datos que permite
representar las entidades relevantes de un sistema de información así como sus
interrelaciones y propiedades. Esta concepción fue diseñada por Peter Chen.

El Modelo Entidad-Relación

1. Se elabora el diagrama (o diagramas) entidad-relación.


2. Se completa el modelo con listas de atributos y una descripción de otras
restricciones que no se pueden reflejar en el diagrama.

El modelado de datos no acaba con el uso de esta técnica. Son necesarias otras
técnicas para lograr un modelo directamente implementable en una base de datos.
Brevemente:

permite mostrar resultados entre otras entidades pertenecientes a las existentes de


manera que se encuentre la normatividad de archivos que se almacenarán.

 Transformación de relaciones múltiples en binarias.


 Normalización de una base de datos de relaciones (algunas relaciones
pueden transformarse en atributos y viceversa).
 Conversión en tablas (en caso de utilizar una base de datos relacional).

2. ¿Qué es la construcción de un modelo entidad relacion (E-R)?

R. Elementos del Modelo Entidad-Relación

 Entidades Son objetos distinguible del resto; pe en un sistema bancario, las


personas y las cuentas son entidades. Éstas pueden ser entes concretos,
como una persona o un avión, o abstractas, como un préstamo o una reserva.
Se representan por medio de un rectángulo.
 Atributos Con propiedades de las entidades. Se representan mediante un
círculo o elipse, cuando un atributo es identificativo de la entidad se subraya.
 Relación Describe la dependencia entre entidades o permite la asociación de
las mismas; pe tenemos 2 entidades CLIENTE y HABITACIÓN, una relación
sería que el cliente 'Pepito' tiene 'ocupada' la habitación '519'. Se representan
por medio de un verbo de acción dentro de un rombo que une entidades.

3. ¿Qué permite un modelo entidad relacion (E-R)?

R. Representa una “cosa”, "objeto" o "concepto" del mundo real con existencia
independiente, es decir, se diferencia únicamente de otro objeto o cosa, incluso
siendo del mismo tipo, o una misma entidad.

Algunos Ejemplos:

 Una persona. (Se diferencia de cualquier otra persona, incluso siendo


gemelos).
 Un automóvil. (Aunque sean de la misma marca, el mismo modelo,..., tendrán
atributos diferentes, por ejemplo, el número de chasis).
 Una casa (Aunque sea exactamente igual a otra, aún se diferenciará en su
dirección).

Una entidad puede ser un objeto con existencia física como: una persona, un
animal, una casa, etc. (entidad concreta); o un objeto con existencia conceptual
como: un puesto de trabajo, una asignatura de clases, un nombre, etc. (entidad
abstracta).

Una entidad está descrita y se representa por sus características o atributos. Por
ejemplo, la entidad Persona las características: Nombre, Apellido, Género, Estatura,
Peso, Fecha de nacimiento.

4. ¿Qué requisitos cumple el modelo E-R?


R. Dado un conjunto de relaciones en el que participan dos o más conjuntos de
entidades, la correspondencia de cardinalidad indica el número de entidades con
las que puede estar relacionada una entidad dada.

Dado un conjunto de relaciones binarias y los conjuntos de entidades A y B, la


correspondencia de cardinalidades puede ser:

 Uno a Uno: (1:1) Un registro de una entidad A se relaciona con solo un


registro en una entidad B. (ejemplo dos entidades, profesor y departamento,
con llaves primarias, código_profesor y jefe_depto respectivamente, un
profesor solo puede ser jefe de un departamento y un departamento solo
puede tener un jefe).

 Uno a Varios: (1:N) Un registro en una entidad en A se relaciona con cero o


muchos registros en una entidad B. Pero los registros de B solamente se
relacionan con un registro en A. (ejemplo: dos entidades, vendedor y ventas,
con llaves primarias, código_vendedor y venta, respectivamente, un
vendedor puede tener muchas ventas pero una venta solo puede tener un
vendedor).

 Varios a Uno: (N:1) Una entidad en A se relaciona exclusivamente con una


entidad en B. Pero una entidad en B se puede relacionar con 0 o muchas
entidades en A (ejemplo empleado-centro de trabajo).

 Varios a Varios: (N:M) Una entidad en A se puede relacionar con 0 o con


muchas entidades en B y viceversa (ejemplo asociaciones-ciudadanos,
donde muchos ciudadanos pueden pertenecer a una misma asociación, y
cada ciudadano puede pertenecer a muchas asociaciones distintas).

5. ¿en qué consiste la redundancia de datos?


R. En bases de datos o en ficheros, la redundancia hace referencia al
almacenamiento de los mismos datos varias veces en diferentes lugares. La
redundancia de datos puede provocar problemas como:

* Incremento del trabajo: como un mismo dato está almacenado en dos o más
lugares, esto hace que cuando se graben o actualicen los datos, deban hacerse en
todos los lugares a la vez.

* Desperdicio de espacio de almacenamiento: ya que los mismos datos están


almacenados en varios lugares distintos, ocupando así más bytes del medio de
almacenamiento. Este problema es más evidente en grandes bases de datos.

* Inconsistencia de datos: esto sucede cuando los datos redundantes no son iguales
entre sí. Esto puede suceder, por ejemplo, cuando se actualiza el dato en un lugar,
pero el dato duplicado en otro lugar no es actualizado.

Si una base de datos está bien diseñada, no debería haber redundancia de datos
(exceptuando la redundancia de datos controlada, que se emplea para mejorar el
rendimiento en las consultas a las bases de datos).
6. ¿en qué consiste precisión y consistencia en un modelo E-R?
R. En el desarrollo de las bases de datos existen varias modelos de datos a estudiar,
los modelos de datos son un conjunto de herramientas conceptuales usadas para
describir los datos, las relaciones, la semántica y las relaciones de consistencia.

El primer modelo a analizar en todo curso de base de datos es el modelo entidad-


relación, o modelo E-R, el cual esta basado en una percepción del mundo real en el
que representamos todos los elementos de la realidad a través de los siguientes
conceptos:

 Entidad
 Relación
 Atributo

7. ¿En qué consiste la disponibilidad en un modelo E-R?


R. Es un dato que se necesita pero que no puede ser accedido es un síntoma de
mala organización.
8. ¿a que conduce la duplicación de datos?

R. Limpieza De Datos

Al revisar la combinación de una o más listas o bases de datos, los duplicados son
un problema común, en este artículo se detallan los pasos necesarios para limpiar
correctamente el archivo. El propósito de eliminar los registros duplicados es la
limpieza de los datos subyacentes conjunto para lograr mejoras en la productividad,
ahorrar en los envíos de duplicados, y la satisfacción del cliente. La eliminación de
duplicados puede ser una tarea de mucho tiempo y propenso a errores que son la
razón por duplicado de eliminación de software es una herramienta esencial para la
administración de bases de datos. DataMatch es nuestro producto estrella para
eliminar los registros duplicados. Pruebe una versión de prueba gratuita hoy o siga
leyendo para obtener las mejores prácticas en combinación y limpieza de bases de
datos.

Combinando bases de datos

La fusión de diferentes bases de datos con fuentes diferentes (SQL Server,


MySQL,Excel, ODBC, etc) y combinar en una estructura común es el primer paso
en el proceso. Por lo general, los duplicados entre bases de datos, pero a veces se
duplican dentro de un solo archivo. DataMatchpuede importar, combinar, y exportar
a los formatos de las bases de datos más comunes. Además DataMatch puede
reconocer campos (columnas) similares de fuentes de datos diferentes entre sí
(¿Qué se puede personalizar y sobrescribir)
Duplicado

Un componente clave de la eliminación de duplicados es la definición de lo que es


un duplicado. Los siguientes mejores prácticas son fundamentales y están incluidos
en DataMatch.
> Identificación de la lógica difusa de los partidos por ciento entre los registros y el
establecimiento de límites mínimos partido por ciento por el campo
> Sigla de identificación de la aceptación (Match International Business Machines
IBM)
> Limpieza y normalización de datos antes de igualar (Calle de la calle, la
eliminación de la sintaxis innecesarias en números de teléfono, etc)
> Aplicación de las bibliotecas de la normalización, especialmente para los nombres
de pila (Jon, Jonathan y Juan, etc) DataMatch incluye más de 300.000 las reglas de
normalización de los nombres, direcciones, números de teléfono y nombres de
compañías.

9. ¿en que consiste la accesibilidad y oportunidad en un modelo E-R?


R. Se trata de una técnica cuyo objetivo es la representación y definición de todos
los datos que se introducen, almacenan, transforman y producen dentro de un
sistema de información, sin tener en cuenta las necesidades de la tecnologia ́
existente, ni otras restricciones.

Dado que el modelo de datos es un medio para comunicar el significado de los


datos, las relaciones entre ellos y las reglas de negocio de un sistema de
información, una organización puede obtener numerosos beneficios de la aplicación
de esta técnica, pues la definición de los datos y la manera en que éstos operan son
compartidos por todos los usuarios.

Las ventajas de realizar un modelo de datos son, entre otras:

 Comprensión de los datos de una organización y del funcionamiento de la


organización.
 Obtención de estructuras de datos independientes del entorno fiś ico.
 Control de los posibles errores desde el principio, o al menos, darse cuenta
de las deficiencias lo antes posible.
 Mejora del mantenimiento.

Aunque la estructura de datos puede ser cambiante y dinámica, normalmente es


mucho más estable que la estructura de procesos. Como resultado, una estructura
de datos estable e integrada proporciona datos consistentes que puedan ser
fácilmente accesibles según las necesidades de los usuarios, de manera que,
aunque se produzcan cambios organizativos, los datos permanecerán estables.
Este diagrama se centra en los datos, independientemente del procesamiento que
los transforma y sin entrar en consideraciones de eficiencia. Por ello, es
independiente del entorno fiś ico y debe ser una fiel representación del sistema de
información objeto del estudio, proporcionando a los usuarios toda la información
que necesiten y en la forma en que la necesiten.

10. ¿Cuáles son los tipos de anomalías de datos?


R. Al y como hemos visto para modelar un problema que pretendemos gestionar
con un SGBD relacional debemos: -Definir el diagrama E-R que represente el
problema de la manera más fiel posible -Pasar el diagrama E-R al esquema
relacional. El resultado será un conjunto de tabla + un conjunto de restricciones. Las
restricciones principales son: oClaves primarias oRestricciones de unicidad (para
las claves candidatas no primarias) oClaves ajenas oOtras: check, domain, etc.
Puede parecer que con esto hemos terminado nuestra tarea, pero no es así; falta
un punto fundamental: la normalización del esquema de bases de datos. Esta
normalización es necesaria porque de otra forma se producirían anomalías que
llevarán a una base de datos incoherente. Las anomalías se pueden controlar por
programación, pero nuestro objetivo es que con las restricciones que indicamos al
crear la tabla (en particular con las claves primarias, restricciones de unicidad y
claves ajenas) el sistema se encargue de forma automática de evitar ciertas
anomalías.
11. ¿Qué puede conducir un error de ingreso de datos?
R. La integración de datos es el proceso que permite combinar datos heterogéneos
de muchas fuentes diferentes en la forma y estructura de una única aplicación. Este
proceso de integración de datos facilita que diferentes tipos de datos, tales como
matrices de datos, documentos y tablas, sean fusionados por usuarios,
organizaciones y aplicaciones para un uso personal, de procesos de negocio o de
funciones.

La integración de datos soporta el procesamiento analítico de grandes conjuntos de


datos alineando, combinando y presentando cada conjunto de datos de
departamentos organizacionales y fuentes de datos remotas y externas, para
cumplir con los objetivos del integrador.

La integración de datos se implementa generalmente en un data warehouse


mediante software especializado que aloja grandes repositorios de datos de
recursos internos y externos. Los datos se extraen, se mezclan y se presentan de
forma unificada. Por ejemplo, el conjunto completo de datos de un usuario puede
incluir datos extraídos y combinados de marketing, ventas y operaciones, que se
combinan para formar un informe completo.

Un proyecto de integración de datos generalmente implica los siguientes pasos:

 Acceso a los datos desde todas las fuentes y localizaciones tanto si se trata
de locales, en la nube o de una combinación de ambos.
 Integración de datos de modo que los registros de una fuente de datos
mapean registros en otra. Por ejemplo, incluso si un conjunto de datos
utilizara “nombre, apellidos” y otro “nom, ape”, el conjunto integrado se
asegurará de que en ambos casos los datos van al lugar correcto. Se trata
de un tipo de preparación de datos esencial para que las analíticas y otras
aplicaciones sean capaces de utilizar los datos con éxito.
 Entrega de datos integrados al negocio justo en el momento en que la
empresa los necesita, ya sea por lotes, casi en tiempo real o en tiempo real.

12. ¿en qué consiste la inconsistencia en los datos?


R. Una base de datos está inconsistente si dos datos que deberían ser iguales no
lo son. Por ejemplo, un empleado aparece en una tabla como activo y en otra como
jubilado

Sólo se produce cuando existe redundancia de datos. La inconsistencia consiste en


que no todas las copias redundantes contienen la misma información. Así, si existen
diferentes modos de obtener la misma información, y esas formas pueden conducir
a datos almacenados en distintos sitios. El problema surge al modificar esa
información, si lo sólo cambiamos esos valores en algunos de los lugares en que se
guardan, las consultas que hagamos más tarde podrán dar como resultado
respuestas inconsistentes (es decir, diferentes). Puede darse el caso de que dos
aplicaciones diferentes proporcionen resultados distintos para el mismo dato.

13. ¿Qué es un atributo?


R. Antes de entrar de lleno en la definición del término atributo se hace necesario
descubrir su origen etimológico. En este caso, podemos exponer que se trata de
una palabra que deriva del latín, exactamente de “attributus” que procede del verbo
“attribuere”, que puede traducirse como “atribuir”. La primera acepción que
menciona el diccionario de la Real Academia Española (RAE) alude a las
propiedades, las características o las cualidades de algo.

Por ejemplo: “La playa es el atributo turístico más importante de esta región”, “Los
analistas afirman que el atributo clave de esta crisis económica es el déficit fiscal”,
“La empatía es un atributo del ser humano que nadie debe perder”.
De la misma manera, no podemos olvidar que esta palabra que nos ocupa es muy
importante dentro de la mitología. Y es que lo habitual es que cada uno de los dioses
se venga a representar con uno o varios objetos o elementos en alusión a su esencia
o papel. Buen ejemplo de esto lo podemos encontrar en la mitología griega:
-Zeus, el dios supremo, tiene como atributos el rayo y el cetro.
-Apolo, el dios del Sol, de la luz y de las artes, se identifica con el sol y la lira, entre
otros elementos.
-Poseidón, el dios del mar, tiene como atributo un tridente.
-Atenea, la diosa de la guerra, cuenta con varios atributos, entre los que está el
casco.
-Deméter, la diosa de la agricultura, se identifica con el atributo de las espigas.
-Hermes, el dios mensajero de los dioses, se asocia con el atributo de unas
sandalias aladas.

En el lenguaje coloquial, la noción suele utilizarse en plural con referencia a las


partes del cuerpo vinculadas a la sensualidad: “La modelo mostró sus atributos en
una osada sesión de fotos”, “El joven presumió sus atributos en la playa”, “En el
medio del concierto, el vestido de la cantante se rompió y dejó sus atributos al
descubierto”.

Exactamente, a nivel coloquial e incluso vulgar, se utiliza el término atributo con


cierta connotación sexual. En concreto, en algunos lugares del mundo se utiliza para
referirse al tamaño del miembro viral del varón. Así, se dice, por ejemplo, “Manuel
tenía un buen atributo”.

La idea de atributo también aparece en el terreno de la gramática. Se trata de la


función que los sintagmas –por lo general no verbales– desarrollan en la sintaxis
cuando son predicados de lo indicado a través de un segmento oracional o nominal.

Un atributo, en este sentido, es un constituyente sintáctico que permite la expresión


de alguna cualidad de un complemento, una preposición, un verbo sustantivado o
un sustantivo. En la oración “Juan está triste”, el atributo es “triste”.

14. ¿desde donde comienza el proceso de generación de la base de datos?


R. Los sistemas gestores de bases de datos son la herramienta más adecuada para
almacenar los datos en un sistema de información debido a sus características de
seguridad, recuperación ante fallos, gestión centralizada, estandarización del
lenguaje de consulta y funcionalidad avanzada. En este capítulo analizaremos
algunas ideas acerca de estos importantes componentes de los SIG en la actualidad
y veremos las principales alternativas existentes, al tiempo que estudiaremos los
fundamentos de bases de datos necesarios para comprender la forma en que los
datos espaciales se almacenan en las bases de datos actuales. Asimismo, y para
entender la situación presente y conocer las ventajas e inconvenientes de los
distintos métodos de almacenar la información en los SIG, veremos la evolución de
estos respecto a la arquitectura de almacenamiento de información.

Las bases de datos son un elemento fundamental en el entorno informático hoy en


día y tienen aplicación en la práctica totalidad de campos. Concebidas con un
propósito general, son de utilidad para toda disciplina o área de aplicación en la que
exista una necesidad de gestionar datos, tanto más cuanto más voluminosos sean
estos. En nuestro ámbito particular de los SIG, los datos son cada día más
voluminosos, debido no solo a una mayor cantidad de información, sino también a
una mayor precisión en esta, la cual implica un mayor volumen de datos. Además,
presentan otra serie de características (uso múltiple, necesidad de acceso eficiente
para análisis, necesidad de indexación, etc.), haciendo todas ellas que sea
recomendable el uso de bases de datos y tecnologías específicas para su manejo.

Pese a que, como veremos en este mismo capítulo, el uso de las bases de datos
en el ámbito SIG no ha sido siempre el actual, hoy en día representan una parte
clave para la gestión de los datos geográficos, en especial dentro del marco de
proyectos de cierta envergadura. Aunque la realidad es que todavía se efectúa
mucho trabajo SIG sin emplear bases de datos (y las aplicaciones SIG así lo
permiten, no siendo estrictamente necesario disponer de una base de datos para
almacenar la información), la naturaleza propia de los proyectos SIG y la progresiva
implantación de los SIG a niveles más allá del uso personal traen ambas consigo
un uso cada vez mayor de las bases de datos, y por tanto una mayor necesidad de
conocer el funcionamiento de estas.

Aunque las particularidades de los datos espaciales con los que trabajamos en un
SIG han hecho necesarias modificaciones y adaptaciones sobre el esquema de
trabajo de las bases de datos genéricas, en esencia los fundamentos de estas
siguen constituyendo el elemento primordial sobre el que la arquitectura de gestión
de datos espaciales se apoya, y es necesario conocerlos con cierto detalle. En esta
sección, veremos de forma introductoria esos fundamentos de bases de datos
genéricas, aplicables a cualquier otro ámbito además del de los SIG, para
posteriormente poder tratar el caso particular de los datos espaciales. Para el lector
interesado en profundizar en el tema, una referencia libre y en español con
información extensa y detallada sobre bases de datos genéricas es
[basesDatosUOC].

Entendemos como Base de Datos un conjunto de datos estructurado y almacenado


de forma sistemática con objeto de facilitar su posterior utilización. Una base de
datos puede, por tanto, constituirse con cualquier tipo de datos, incluyendo los de
tipo puramente espacial (geometrías, etc.) tales como los que se utilizan en un SIG,
así como, por supuesto, datos numéricos y alfanuméricos como los que constituyen
la componente temática de la información geoespacial. Los elementos clave de la
base de datos son esa estructuración y sistematicidad, pues ambas son las
responsables de las características que hacen de la base de datos un enfoque
superior a la hora de gestionar datos.
Podemos ver más claramente las implicaciones de utilizar una base de datos si
recurrimos al ejemplo que vimos en el primer capítulo de este libro, relativo a la
gestión forestal de un territorio. Para ello, consideremos que el número de usuarios
del SIG y de los datos asociados no se limita únicamente al gestor forestal que ha
de tomar decisiones o establecer planes de actuación, sino a muchos otros
profesionales que puedan ejercer su trabajo en ese mismo área o puedan emplear
total o parcialmente esos mismos datos.

Imaginemos, por ejemplo, el caso de un ingeniero encargado de planear la


instalación de un tendido eléctrico a través de nuestra zona forestal de ejemplo. Sin
duda, deberá emplear datos tales como Modelos Digitales de Elevaciones, capas
de zonas protegidas o capas de arbolado para establecer el trazado óptimo y
estimar costes de la línea, entre otras tareas. Si en una situación ideal este ingeniero
estaría en comunicación con el gestor forestal y ambos compartirían sus
conocimientos dentro de un equipo multidisciplinar, también en lo referente a los
datos debería existir una comunicación igual que implique, ente otras cosas, un uso
compartido y convenientemente coordinado de ellos. En otras palabras, los datos
también tienen ese carácter multidisciplinar y deben dejar de verse como algo propio
de un uso particular, para concebirse como un conjunto global del que se benefician
muy diversos usuarios.

Establecer un uso compartido de los datos en una situación como la anterior no


parece difícil, ya que simplemente se trata de dos profesionales que realizan tareas
relacionadas y que, de un modo u otro, van a tener un contacto directo. El gestor
forestal puede sencillamente dar una copia de sus datos al ingeniero y este podrá
trabajar después con ellos de forma independiente. Aunque los datos con que
trabajen son inicialmente los mismos, en realidad esta práctica da lugar son dos
copias aisladas que constituyen dos universos distintos.

La situación real, sin embargo, es habitualmente mucho más compleja, y utilizar un


esquema de colaboración como el anterior puede ser imposible, carecer por
completo de sentido, o tener un buen número de consecuencias negativas. A
medida que aumenta el número de usuarios, resulta menos recomendable que cada
uno trabaje con sus propios datos y se los hagan llegar entre ellos a medida que los
necesitan (una realidad que, desgraciadamente, se presenta con más frecuencia de
lo recomendable). No debe olvidarse que un conjunto más amplio de usuarios que
trabajan de esta forma y son ellos mismos quienes gestionan sus propios datos,
implica directamente un número también más elevado de aplicaciones informáticas
y de formatos de archivo, complicando enormemente el trabajo coordinado en
cuanto el equipo tiene un tamaño medio.

Es probable además que existan usuarios dentro de una misma organización (por
ejemplo, un organismo público) que aunque requieran para su trabajo datos
similares, no tengan contacto alguno entre sí. Aunque los usuarios sean
independientes, sus datos no lo han de ser necesariamente, y en una situación ideal
deberían acudir a un repositorio único de datos del que cada cual tomaría lo
necesario, en lugar de basar su trabajo en un conjunto de datos fragmentado y difícil
de gestionar.

Pensemos en un dato que pueda ser de interés a varios usuarios, como por ejemplo
una capa de vías de comunicación. A nuestro gestor forestal le será de interés para,
por ejemplo, saber qué medios de acceso existen en caso de tener que hacer frente
a un incendio. Lo más relevante de esas vías será su trazado, es decir su geometría,
y tal vez el tipo de vía de que se trata, para poder conocer la velocidad a la que se
pueden desplazar los medios de extinción. Otros usuarios, por su parte, pueden
necesitar parámetros distintos como el volumen de tráfico medio de cada vía. Si
todos ellos tienen una capa de vías con los parámetros asociados que necesitan
para su trabajo, nos encontramos con una innecesaria redundancia de la
componente espacial (las geometrías), y una dispersión de la componente temática,
que resultaría más conveniente mantenerla agrupada.

Pensemos ahora que el gestor forestal detecta un error en el trazado de una de las
vías y lo corrige. Esa corrección no estará disponible para los restantes usuarios,
que pueden a su vez efectuar modificaciones similares que no redundarán en una
mayor calidad de los datos con los que trabaja el gestor forestal, ya que, pese a
utilizar datos similares, trabaja con su propio conjunto de datos. Incluso si en algún
momento todos estos usuarios deciden poner en común sus datos y unirlos, esta
operación puede ser muy compleja o incluso, como sucede frecuentemente,
imposible de realizar. Por su parte, otros usuarios pueden añadir una nueva variable
temática, como por ejemplo un índice de siniestralidad de la vía, el cual, si bien tal
vez no resulte de utilidad inmediata para muchos usuarios, en un futuro sí pudiera
serlo. Una vez más, estos nuevos datos no quedan a disposición del resto de
usuarios, y en caso de serlo, no lo hacen en conjunto con datos similares, sino como
un dato aislado de los restantes.

En definitiva, es complejo gestionar de forma adecuada los datos en el momento en


que estos alcanzan un ámbito más allá de lo personal, y las prácticas más habituales
basadas en una gestión «manual» de un conjunto de ficheros no son una opción
adecuada. La solución para lograr esa necesaria gestión centralizada de los datos
son las bases de datos y también, como veremos más adelante, los sistemas
gestores de bases de datos, que representan la interfaz entre las bases de datos y
los distintos usuarios.

15. ¿el modelo E-R como describe los datos?


R. Un diagrama entidad-relación, también conocido como modelo entidad relación o
ERD, es un tipo de diagrama de flujo que ilustra cómo las "entidades", como
personas, objetos o conceptos, se relacionan entre sí dentro de un sistema. Los
diagramas ER se usan a menudo para diseñar o depurar bases de datos
relacionales en los campos de ingeniería de software, sistemas de información
empresarial, educación e investigación. También conocidos como los ERD o
modelos ER, emplean un conjunto definido de símbolos, tales como rectángulos,
diamantes, óvalos y líneas de conexión para representar la interconexión de
entidades, relaciones y sus atributos. Son un reflejo de la estructura gramatical y
emplean entidades como sustantivos y relaciones como verbos.
Los diagramas de ER se relacionan con los diagramas de estructura de datos
(DSD), que se centran en las relaciones de los elementos dentro de las entidades,
en lugar de las relaciones entre las entidades mismas. Los diagramas ER a menudo
se combinan con los diagramas de flujo de datos (DFD), que trazan el flujo de la
información para procesos o sistemas.

También podría gustarte