Está en la página 1de 7

6/9/2017 Cmo disear una base de datos para nuestro proyecto de investigacin

Men

Cmo disear una base de datos para nuestro


proyecto de investigacin
2 Diciembre, 2016 por Llus Codina

Actualizacin: Diciembre 2016. Nueva edicin ampliada, explicacin ms


detallada del modelo entidad-relacin, aplicacin a un caso y bibliografa
ampliada.

Bases de datos para dar soporte a una investigacin


Como parte de un proyecto de investigacin podemos necesitar manejar,
a la vez de forma dinmica(p.e., mediante bsquedas cruzadas) y
sistemtica (representando la informacin del mismo modo), la
informacinque hemos obtenido como parte de nuestros anlisis o los
que recopilamos de alguna fuente.

https://www.lluiscodina.com/como-disenar-una-base-de-datos-para-nuestro-proyecto-de-investigacion/ 1/22
6/9/2017 Cmo disear una base de datos para nuestro proyecto de investigacin

Un ejemplo tpico sera una investigacin que incluyera alguna clase de


Cookies y privacidad: Este sitio utiliza cookies.
anlisis
Para saber de
ms,contenido para
as com para saber elquitar
cmo cualo debemos tratar
bloquear esto, mira aqu:de forma
Nuestra sistemtica
poltica de cookies

centenares (o miles) de unidades de anlisis (noticias, fotografas, tweets,


Cerrar y aceptar
etc.).

Probablemente, para cada una de estas unidades tendremos


quecontemplar diversas propiedades y sus valores, generalmente en
forma de texto, como ttulo, palabras clave, categoras, etc., pero
posiblemente tambin con imgenes.

Cuando nos encontramos en esta situacin guardar los datos en un


procesador de textos o en una hoja de clculo, no resulta e ciente porque
ni su forma de representacin ni sus posibilidades de consulta y
explotacin son ptimas.

En tales casos, necesitamos utilizar un sistema de gestinbase de datos


(SGBD). El uso de estas herramientas es habitual para acadmicos, pero
en este caso no se trata de usar una para consultar una base de datos
desarrollada por terceros, como Web of Science o Scopus.

En este caso, se trata de usar un software con el que (1) tendremos que
disear una base de datos por nuestra cuentay (2) despus poblarla con
los contenidos que nos interesen y que tambin tendremos que entrar
nosotros mismos.

El SGDB Base forma parte del paquete o mtico Libre Of ce, de dominio pblico

En los dos paquetes o mticos ms importantes del mercado: Of ce de


Microsoft y LibreOf ce, disponemos de sistemas de gestin de bases de
datos. Aunque no sean los mejores sistemas para usos de tipo

https://www.lluiscodina.com/como-disenar-una-base-de-datos-para-nuestro-proyecto-de-investigacion/ 2/22
6/9/2017 Cmo disear una base de datos para nuestro proyecto de investigacin

documental si vamos a necesitar gestionar mucho texto, es casi seguro


que nos servirn para casi cualquier propsito, ya que estas soluciones
cada vez son ms verstiles. La cuestin es que, adems de ser muy
accesibles, disponen de buenas herramientas de desarrollo.

Otros programas de gestin de bases de datos, como FileMaker, en


cambio, disponen de mayores facilidades para gestionar tanto datos
numricos como textuales, y por tanto en teora sera la ms adecuada
para estas necesidades. El nico problema es que no est tan disponible
como las de tipo o mtico: necesitamos incorporar un paquete de
software nuevo, y no es de dominio pblico como LibreOf ce.

FileMaker es un SGBD de propsito general de tipo comercial.

Una vez elegidoel software, el menor de nuestros problemas ser


aprender a usarlo; la curva de aprendizaje puede ser ms o menos
complicada, pero con un poco de motivacin (y la impagable ayuda de los
numerosos tutoriales que pululan por Internet) al nal acabaremos
sabindolo hacer.

Porqu necesitamos desagregar la informacin


El verdadero problema consiste en saber cmo debemos articular la
informacin que queremos controlar (por ejemplo, noticias de prensa
para hacer un anlisis de contenidos) en las estructuras propias de una
base de datos, que son losregistros. Y tambin necesitaremos saberqu
campos deben tener los registrospara que despus podamos usar de
forma e ciente los datos que, probablemente, tanto nos habr costado
entrar.

https://www.lluiscodina.com/como-disenar-una-base-de-datos-para-nuestro-proyecto-de-investigacion/ 3/22
6/9/2017 Cmo disear una base de datos para nuestro proyecto de investigacin

Y no se trata de un caso benigno de prueba y error. Si no dedicamos un


tiempoal anlisis, antes de proceder ala carga de datos, descubriremos el
error(en una forma especialmente perversa de la Ley de Murphy) cuando
sea demasiado tarde. Esto puede equivaler a un desastre que, o
biencomprometala calidad o bien la completitud de los resultados que
podamos ofrecer (o nos obligue a repetirlo todo).

El motivo por el cual necesitamos saber desagregar la informacin es


doble: por un lado, sin tal desagregacin acabaremos entrando muchas
veces la misma informacin, lo que conduce a redundancias, y las
redundancias conducen a inconsistencias (sin contar el enorme fastidio
de entrar muchas veces la misma informacin).

El segundomotivo es que, cuanto ms articulada y ms detallada


tengamos la informacin, ms posibilidades tendremos luego de
explotacin, incluso de formas que tal vez no habamos pensado nunca.

Adicionalmente, a veces tenemos dudas, aparentemente irresolubles, de


tan bsicas que parecen: un determinado elemento, es una entidad en s
misma o es un atributo de una entidad? O bien, tal vez ese elemento no
es ni una cosa ni otra, sino un conjunto de valores?

La cuestin es que, para poder crear una base de datos primero


necesitamos disearlas dos estructuras en las que se representarla
informacin, a saber:

Registros:equivalentes a las las de una tabla, y corresponde a la idea


intuitiva de una entidad o cosa que queremos controlar en la base de
datos.
Campos:equivalentes a las columnas de una tabla, y corresponde a la
idea de aquellas propiedades o atributos que caracterizan a una
entidad.

Tal como hemos dicho, los registros y los campos los podemos ver como
tablas, o como chas. En este caso, la imagen que nos podemos hacer es
la tpica cha de un libro del catlogo de una biblioteca, ola cha de un
producto en una tienda electrnica o como la cha de una pelcula en

https://www.lluiscodina.com/como-disenar-una-base-de-datos-para-nuestro-proyecto-de-investigacion/ 4/22
6/9/2017 Cmo disear una base de datos para nuestro proyecto de investigacin

una base de datos de cinematografa. Pero en el modelo entidad-relacin


que vamos a usar aqu es costumbre hablar de tablas.

Lo que debemos tener en cuenta para lo que sigue es que entidad,


registro y tabla son equivalentes. As campo, atributo y columna lo son
tambin. Otra idea que necesitamos es la diferencia entre:

Tipo de entidad
Ocurrencia de entidad

El tipo de entidad se re ere a la clase general, y la ocurrencia al individuo


concreto. Por ejemplo, el tipo de entidad lmse re ere a la clase de
objetos audiovisuales que conocemos por tal nombre, y de los que se
producen varios cientos cada ao, mientras que 2001 es una ocurrencia o
individuo de tal clase, en concreto el lm que dirigi Kubrick en 1968.

La cuestin es que, hasta que no tengamos unos modelos de registro para


representar tipos de entidades con sus correspondientes campos bien
diseados, no podremos empezar a entrar datos con la seguridad de que
nuestrasdudas sobre el diseo de la base de datos han quedado bien
resueltas.

Diseo de una base de datos


La idea ms simple e importante a la vez cuando se trata de acertar con el
diseo de una base de datos es la siguiente: una base de datos es un
modelo de una parte del mundo real. Si la estructura de registros y
campos captura bien esa parte de la realidad que queremos representar,
en principio todo ir bien. Pero cmo podemos estar seguros de una
cosa as?

Afortunadamente,disponemos dedos instrumentos de validez


largamente demostrada para determinar exactamente qu registros
necesitamos y qu campos deben tener, y son los siguientes:

Modelo entidad-relacin
Diccionario de datos

https://www.lluiscodina.com/como-disenar-una-base-de-datos-para-nuestro-proyecto-de-investigacion/ 5/22
6/9/2017 Cmo disear una base de datos para nuestro proyecto de investigacin

Vamos a ver algo sobre estas dos herramientasen los apartados que
siguen.

Un ejemplo de modelado con un diagrama Entidad-


Relacin (sin indicar la cardinalidad, N:M)

El modelo entidad-relacin
El modelo entidad-relacines un procedimiento de anlisis y diseo
aparentementesencillo (aunque podemos complicarlo todo lo que
queramos) para determinar cul debe ser la estructura de una base de
datos en relacin con:

Entidades (tems o unidades) los elementos o cosas que se van a


representar en la misma. Sern modelos de registro y por tanto, tipos
de entidades, cuando diseemos la base de datos. En formato de tabla,
seran las las de la misma.
Propiedades (campos) de las entidades que se van a representar. Sern
los campos de cada registro. En formato tabla, seran las columnas de la
misma.
Relaciones entre las entidades de cara a la explotacin posterior de la
base de datos. En algunos casos, segn veremos se transforman en
modelos de registro o tablas para poder representar bien la relacin.

Repasemos esta relacin triple: (1) una entidad es (2) un tipo de registro
que a su vez se puede representar en (3) forma de tabla. Igualmente, este
triple lo volvemos a tener si consideramos que (1) una propiedad (2) es uno
de los campos del registro que a su vez (3) es una de las columnas en una
tabla.

Un cuarto elemento,con un papel aparentemente menor, pero


imprescindible a la hora de gestionar la base de datos y de poder
establecer las relaciones es la nocin de:
https://www.lluiscodina.com/como-disenar-una-base-de-datos-para-nuestro-proyecto-de-investigacion/ 6/22
6/9/2017 Cmo disear una base de datos para nuestro proyecto de investigacin

Campo clave o clave primaria.Es aquel atributo que sirve para


identi car de manera nica a cada entidad. Por ejemplo, en el caso de
ciudadanos mayores de edad de un pas sera el nmero de seguridad
social (o el DNI en Espaa).

Es cierto que, a veces, se necesita la combinacin de varios campos para


identi car una entidad de forma inequvoca, pero en estos casos siempre
podemos asignar nosotros un identi cador nico a cada entidad si
preferimos trabajar con un solo campo clave.

Un poco ms de teora nos ayudar a entender lo anterior: una base de


datos es una forma de representar cosas del mundo real. Por tanto, de
algn modo, una base de datos es un intento de modelar (representar)
una parte del mundo real en un sistema de informacin que es un
mundo simblico.

La virtud esperada de un modelo es que sea razonablemente el a


aquello que modela. Por esta misma razn, si el modelo es inadecuado, la
base de datos no funcionar bien.

Por ejemplo, una base de datos de noticias se supone que representa


eventos(p.e. un accidente, una crisis de gobierno, la revelacin de
determinadas informaciones, etc.) dados a conocer en medios de
comunicacin. Las entidades de esa base de datos son por tanto
lasnoticias y los medios que las publican. Si no conseguimos modelar
bien esas entidades y sus relaciones, la base de datos no funcionar bien.

Para representar de forma adecuada esas noticiasnecesitaremos


seleccionar propiedades o atributos de las mismas. Por ejemplo, ttulo,
fecha, fuente, temas, etc. El conjunto articulado de esas propiedades se
llama registro, y cada una de esas propiedades se llamacampo. As que
un registro est compuesto por campos, y cada noticia se representa en
un registro rellenando los campos correspondientes.

La otra entidad que deberemos representar en esa base de datos sern


cabeceras de diario o medios de comunicacin, tambin con sus
correspondientes campos o atributos.

https://www.lluiscodina.com/como-disenar-una-base-de-datos-para-nuestro-proyecto-de-investigacion/ 7/22

También podría gustarte