Está en la página 1de 25

LA BIOINFORMTICA COMO CONVERGENCIA DE LA

BIOTECNOLOGA Y LA INFORMTICA
Profesor Dr. D. Luis Joyanes Aguilar
Hace 50 aos, con la publicacin de la estructura de la doble hlice del ADN en la
revista Nature, se

iniciaba la biotecnologa moderna, caracterizada por la

emegencia

actividad

de

una

cientfica,

multidisciplinar,

integradora

muy

dependiente de los progresos tecnolgicos relacionados con la velocidad de


procesamiento reinformacin, de tal forma que el xito posterior de programas
como la secuenciacin de genomas no hubiera sido posible sin un avance parelelo
de nuestra capacidad para asimilar nuevos conocimientos 1. La conmemoracin del
50 aniversario de la citada publicacin

es un buen momento para el balance

histrico, as como la convergencia que se ha ido produciendo en este tiempo entre


dos ciencias ya maduras, biotecnologa e informtica. Esta convergencia hoy se
suele definir como bioinformtica y es el eje central de una nueva ciencia que
uniendo a las dos ya citadas permite aventurar una nueva revolucin del
pensamiento y del conocimiento cientfico, posibilitando nuevas oportunidades para
la mejora de la calidad de la vida. En esta ponencia se pretende dar una visin
tecnolgica y cientfica sobre como el crecimiento del campo de la biotecnologa que
ha ido enlazada como numerosos cientficos y personalidades de todo el mundo,
as lo certifican, al desarrollo en la dcada de los 70 y siguientes de la ingeniera
gentica, ha ido tambin en paralelo con el desarrollo de las innovaciones
producidas en el campo de las Tecnologas de la Informacin , y en particular, la
informtica. Esta convergencia est dando lugar a la bioinformtica.
Tambin se mostrarn datos para reflexionar sobre la importancia que para Espaa
puede tener el desarrollo y generacin de nuevas empresas dedicadas a la
biotecnologa, as como la necesaria inversin en I+D+I

en empresas no solo

biotecnolgicas, sino bioinformtica, y en la potenciacin de la docencia e


investigacin en las universidades, programas de postgrado fundamentalmente, en
estas reas tan innovadoras y de porvenir y beneficiosas para la Humanidad.

ASEBIO. Editorial en Boletn Perspectivas, Madrid: ASEBIO, N 30, Febrero, 2003, p. 1

1. ALGUNAS REFLEXIONES TERMINOLGICAS


El DRAE2 define a la biotecnologa con dos acepciones: (1) Empleo de clulas
vivas para la obtencin y mejora de productos tiles, como los alimentos y los
medicamentos, (2) Estudio cientfico de estos mtodos y sus aplicaciones. Sin
embargo no considera el trmino

bioinformtica que tambin tiene relacin

directa con la biotecnologa y que de hecho es una fusin de informtica y


biotecnologa, tal vez sera mejor decir, es una convergencia de la informtica y la
biotecnologa.
La prestigiosa enciclopedia Britnica3 define esta ciencia como: la aplicacin a
la industria de los avances realizados en las tcnicas e instrumentos de
investigacin de las ciencias biolgicas
En general, la biotecnologa constituye un rea de estudio y trabajo en la que
se aplican las propiedades de los seres vivos para producir bienes y servicios a
partir de tcnicas con diversos grados de complejidad4. La biotecnologa es una
tenociencia muy antigua, pues desde tiempos inmemoriales los seres humanos
han

utilizado,

por

ejemplo,

la

capacidad

de

los

micoroorganismos

para

transformar y conservar los alimentos. Sus aplicaciones en agricultura y, ms


recientemente, en gentica y salud, la han puesto en el punto de mira de la
sociedad por las esperanzas, pero tambin por la desconfianza, que despierta.
La biotecnologa no es nueva, sus orgenes se remontan a los albores de la
historia de la Humanidad. Nuestros ancestros primitivos iniciaron, hace miles de
aos durante la Edad de Piedra, la prctica de utilizar organismos vivos y sus
productos. Recordemos que la biotecnologa ha sido utilizada por el hombre desde
los comienzos de la historia en actividades tales como la preparacin del pan y de
bebidas alcohlicas o el mejoramiento de cultivos y de animales domsticos.
Procesos como la produccin de cerveza, vino, queso y yogurt implican el uso de
bacterias o levaduras con el fin de convertir un producto natural como la leche,
en un producto de fermentacin ms apetecible como el yogurt. En trminos
generales biotecnologa se puede definir como el uso de organismos vivos o de
2
3

En lnea, sitio Web de la Real Academia Espaola <http://www.rae.es>


Enciclopedia Britnica, < http://www.britannica.com/eb/article?eu=81422> [Consulta: 31: 03; 2003]

compuestos obtenidos de organismos vivos para obtener productos de valor para


el hombre.
La biotecnologa abarca desde la biotecnologa tradicional, muy conocida

establecida , y por tanto utilizada , como por ejemplo la fermentacin de


alimentos, hasta la biotecnologa moderna, basada en la utilizacin de las nuevas
tcnicas del DNA recombinate (ingeniera gentica), y los nuevos mtodos de
cultivo de clulas y tejidos.
El

vocabulario

de

la

biotecnologa

se

enriquece

continuamente.

Los

representantes de la industria europea afirman que existe la biotecnologa roja


(relacionada con la salud), la verde (la relacionada con la agricultura y
alimentacin) y la blanca (otras aplicaciones, entre ellas la bioinformtica). En
Biovision5, el foro bianual de ciencias de la vida y coincidiendo con la conclusin
del Proyecto Genoma Humano, nueve premios Novel analizaron el futuro de la
biologa molecular y en particular la biotecnologa.
2.

GENESIS DE LA BIOTECNOLOGA Y DE LA INFORMTICA

El crecimiento del campo de la biotecnologa est firmemente conectado al


desarrollo de la ingeniera gentica de los 70 (alteracin directa de material
gentico) as como a la desarrollo de la informtica y en particular la industria del
software
Solo quisiera hacer unas reseas histricas de la biotecnologa en paralelismo
con tecnologas de la informacin, que permiten apreciar como se la historia de
estos ltimos cincuenta aos han ido produciendo la convergencia de la
biotecnologa y la informtica, o dicho de otro modo la necesidad imperiosa que
han tenido ambas de ciencias de colaborar y trabajar en comn. Desde el punto
de vista de la biotecnologa, algunos hechos histricos a considerar son6:.

Emilio Muoz, Biotecnologa y sociedad. Encuentros y desencuentros, Madrid: Cambridge University Press, 2001, p.11
Biovision es un Foro sobre Ciencias de la Vida (The World Life Sciences Forum). El copresidente de Biovision es
Federico Mayor, ex Presidente de UNESCO y catedrtico de la Universidad de Granada.
<http:www.biovision.org> [Consulta: 18: 04: 2003]
6
Portaley.com, Biotecnologa, Glosario de trminos.
<http:www.portaley.com/biotecnologa/bio8.shtml> [Consulta: 31: 03: 2003]
5

1.000 a.C.: Los babilonios celebraban con ritos religiosos la polinizacin de


las palmeras.

1943: El ADN es identificado como la molcula gentica.

1953: El bioqumico americano James Watson y el biofsico Francis Crack


anuncian la estructura en doble hlice del ADN o cdigo gentico.

1956: Se identifican 23 pares de cromosomas en las clulas del cuerpo


humano

1972: Se crea la primera molcula de ADN recombinante en el laboratorio:


genes de una especie son introducidos de otras especies y funcionan
correctamente.

1981: Primer diagnstico prenatal de una enfermedad humana por medio


del anlisis del ADN

1983: Se inventa la tcnica PCR (reaccin en cadena de la polimerasa), que


permite copiar genes especficos con gran rapidez. Es una tcnica muy
poderosa para producir millones de copias de una regin especfica de ADN,
que permite analizarla tan rpido como se puede purificar una sustancia
qumica. PCR ha sido el instrumento esencial en el desarrollo de tcnicas de
diagnstico, medicina forense y la deteccin de genes asociados con errores
innatos del metabolismo.

1984: Creacin de las primeras plantas transgnicas

1994:

Se

comercializa

en

California

el

primer

vegetal

modificado

genticamente, un tomate, y se autoriza en Holanda la reproduccin del


primer toro transgnico.

1995: Se completan las primeras secuencias de genomas de bacterias

1996: Por primera vez se completa la secuencia del genoma de un


organismo eucaritico, la levadura de cerveza

1997: Investigadores, liderados por Ian Wilmut, clonan al primer mamfero,


la oveja Dolly.

2001: Se publica el mapa provisional del genoma humano

Los acontecimientos ms significativos e influyentes del mundo de la informtica


que estn marcando el desarrollo espectacular de las Tecnologas de la
Informacin y de las Comunicaciones, en lo relativo a innovaciones hardware y
software, en una analoga similar de importancia y de cronologa, podra ser7:

1943-1946: Comienza en 1943 la construccin del ordenador ENIAC, el


primer ordenador digital de la historia. En 1945, von Neumann, publica el
concepto de programa almacenado. En 1946, se presenta , ya terminado y
en funcionamiento, en la Universidad de Pensilvania, el ordenador ENIAC.
Este ao se considera por muchos historiadores informticos el comienzo de
la Historia de la Informtica.

1951-1954. En 1951, William Schockley, inventa el transistor de unin y


comienza la era de la Microelectrnica. En 1954, el Univac 1103A se
convierte en el primer ordenador comercial de la historia. En esa poca se
desarrolla el lenguaje de programacin cientfico por excelencia y que se
ha utilizado hasta nuestros das en los grandes laboratorios de investigacin
y universidades de todo el mundo. Este lenguaje es FORTRAN.

1971-1972. Se inventan los dos lenguajes ms influyentes en la educacin


de la informtica y en el desarrollo cientfico de las ltimas dcadas. Pascal
de la mano del profesor suizo Niklaus Wirtz y C de la mano del ingeniero de
Laboratorios Bell, en Estados Unidos, Dennis Ritchie.

1981. Se inventa y presenta el IBM PC, el primer ordenador personal de la


historia con gran capacidad de clculo y almacenamiento, y precursor de la
era digital

1983-1985. Se presentan los trabajos de Bjarne Stroustrup, ingeniero de la


ATT y el compilador del lenguaje de programacin C++, base del desarrollo
comercial e industrial de la programacin orientada a objetos, el paradigma
universal de programacin de las dos ltimas dcadas y de la actual en el
mundo de la ingeniera de software. En 1984, el novelista William Gibson

4 Luis Joyanes, Diez Aos de Sociedad de la Informacin (1993-2003): El destino de 60 aos de Historia de la
Informtica en Data.Ti, Barcelona: McEdiciones, Junio 2003 (aceptado y previsto el artculo para ese nmero)

publica la novela Neuromancer y en ella acua el trmino ciberespacio


fundamento conceptual de la Red Internet que tanto ayuda y ayudar al
pensamiento y trabajos cientficos.

1995. Se presenta por parte de Microsoft, el sistema operativo Windows 95,


nueva generacin de herramientas software precursora de las utilizadas en
esta dcada. Pero sobre todo se presenta en Sociedad Java, el lenguaje de
programacin por excelencia para aplicaciones y desarrollo en Internet, y
clave en I+D en el campo cientfico y tecnolgico.

1996. Se presenta la tarjeta de grficos 3D Blaster, cuya implantacin


facilitarn los desarrollos y presentaciones visuales en 3 dimensiones, eje
central de cualquier desarrollo cientfico en el campo de la biotecnologa,
para representar modelos y simulaciones reales de genes, cromosomas,
etc.

1997. Se comienzan a comercializar el DVD y se lanza Office 97, un


paquete

de

ofimtica

con

aplicaciones

integradas,

herramienta

indispensable en cualquier despacho, laboratorio de investigacin, docencia,


etc.

2001. En este ao y siguientes se consolidan estndares tales como USB


2.0 para conexin de perifricos a ordenadores, las consolas de juegos de
Microsoft, Sony y Sega, que facilitan los desarrollos espectaculares de
simulaciones grficas. Se implanta y desarrolla la telefona mvil con el uso
de mensajera instantnea, precursora de la mensajera multimedia que se
lanzar a finales de 2002. Comienza a aparecer el concepto de Servicios
Web, una innovacin tecnolgica que permitir transferir mediante Internet,
aplicaciones desarrolladas con diferentes plataformas hardware y software,
y que facilitar la interconexin de aplicaciones distintas realizadas por
fabricantes y proveedores de software de diferentes lugares y pases,
siguiendo las reglas de estandarizacin que se han consensuado por un
gran nmero de fabricantes importantes de software.

3. LAS BIOEMPRESAS
En la actualidad, unas 300 empresas se engloban bajo la denominacin
bioempresa. Se trata de un grupo de PYMES y no PYMES, dedicadas a la
biotecnologa, a realizar aplicaciones tecnolgicas utilizando organismos vivos o
derivados, Se dedican, por ejemplo, a sacar partido a esa reaccin en cadena que
le vali a su descubridor, Kary Mullis, el Premio Nobel en 1993, y que es un
proceso esencial para la secuenciacin del genoma humano.
La biotecnologa abarca la genmica, la protemica y la bioinformtica y se
desarolla en sectores de la salud humana y animal, la agroalimentacin y el
medioambiente. En realidad, de esas 300 bioempresas, el Informe Asebio 2002.
De las bioempresas salen vacunas, programas de ordenador que asimilan
informacin y extraen conclusiones o sustancias naturales sustitutivas de
compuestos qumicos.
Montar una bioempresa implica la confluencia de personas del mundo
empresarial y del mundo cientfico, combatir las restricciones administrativas y
legales, estar ojo avizor para defender la paternidad de las investigaciones y
transmitir al pblico una imagen de negocio tico y veraz son algunas de las
claves para sobrevivir a la aventura de montar una bioempresa. As lo describe la
Gua de creacin de bioempresas, editada por la Comunidad de Madrid y
elaborada por la Confederacin empresarial Independiente de Madrid (CEIM) en
colaboracin con Asebio.

Tabla 1. RADIOGRAFA DEL SECTOR DE LA BIOTECNOLOGA


EN ESPAA
(Informe Asebio)
2001

2002
Puras

Total

Biotecnolgicas
Nmero de empresas

226

119

Empleados total

24.808

8.829

Facturacin global

4.808

Localizacin

+300
24.200

1.650

Madrid/Barcelona
(agrupa al 46%)

sector

4.900
Madrid, Barcelona

y Valencia

Sectores
Salud humana y animal

34%

49%

Agroalimentacin

50%

37%

Medioambiente

16%

14%

Ranking a nivel europeo

1
2

Alemania

Francia

Espaa

Reino Unido

En resumen, de las 60 firmas de las 119 del sector biotecnolgico, hay firmas
tan conocidas como Zeltia, que cotiza en el Bies, o Puleva Biotech. El 40 % de
estas empresas se ha creado en los ltimos tres aos. Como afirm Fernando
Royo, presidente de la Asociacin Espaola de Bioempresas (Asebio):
padece

una

desconexin

entre

la

mentalidad

cientfica

la

Espaa

mentalidad

empresarial. Necesitamos bioemprendedores, personas capaces de transformar


sus ideas y los resultados de sus investigaciones en productos que se vendan.

3.1 El futuro
La industria biotecnolgica ser el sector ms importante del siglo XXI8
manifest Antoni Esteve, de Laboratorios Esteve, el pasado 6 de Marzo, en la
sede del Ministerio de Sanidad y Consumo en la firma del acuerdo por el que los
laboratorios Esteve se incorporan al Patronato de la Fundacin Genoma Espaa.
La importancia de esta tecnologa, cuyo valor de mercado en Europa se estima en
100 billones de euros para el ao 2005, promovieron la creacin de un organismo
que dinamizara las grandes posibilidades que la investigacin biotecnolgica tiene
en Espaa.
La biotecnologa es el sector que va a tener un mayor impacto econmico en el
futuro y dentro de l destaca el rea de la salud humana, que va a tener una
mayor

repercusin

econmica

social.

En

concreto,

todos

los

nuevos

conocimientos y tecnologas que se estn generando como consecuencia de la


secuenciacin del genoma humano y los avances de la protemica y genmica,
que nos permiten analizar todos los genes y proteinas de una clula o de un
tejido, en respuesta a una enfermedad o a un tratamiento mdico.
Es una autntica revolucin social y econmica y por lo tanto nuestro pas no
puede quedarse fuera.
A nivel mundial, como cifra orientativa para el ao 2015, diversos analistas
coinciden en sealar la cifra de 250.000 millones de euros para el sector
biotecnolgico que, a su vez,

dar empleo a tres millones de personas en el

mundo. Si estas cifras se cumplen, por otra parte apabullantes, habr que
reconvenir en que es un sector de alta prioridad.
Es la salud humana el destino final del producto biotecnolgico o va a tener
un mbito ms amplio? Hay otros genomas muy importantes adems del humano
como los genomas vegetales o los del resto de animales. Es un componente sobre
el que hay que pensar estratgicamente qu esfuerzo un pas realiza sobre uno u
otro. Hay empresas de biochips que son los que nos permiten analizar todos los
componentes de una clula en respuesta a un tratamiento. Empresas como IBM
tienen un rea de Ciencias de la Vida Life Sciences donde desarrolla hardware y

software bioinformtica y trata de aprender los procesos biolgicos para


aplicaciones informticas.
La biotecnologa ha comenzado a tener su peso especfico en Espaa como
negocio con un gran potencial de crecimiento pero es ahora cuando comenzar la
primera ronda de seleccin natural dentro del sector, segn manifiesta una de
las conclusiones del nuevo informe de la patronal Asociacin Espaola de
Bioempresas (Asebio) con datos a cierre de 2002. el informe, que se hizopblico
el 26 de Febrero pasado, en la primera las tres jornadas sobre el sector BioSpain
2003.
El estudio realizado por Genoma Espaa y OPTI (Observatorio de Prospectiva
Tecnolgica Industrial) , cuya presentacin oficial tuvo lugar el 27 de Febrero
pasado en BioSpain 2003, destaca la escasa presencia industrial que sufre la
biotecnologa

espaola,

que

alcanza

cotas

de

inexistencia

para

algunas

tecnologas en vas de desarrollo y limita su posicin competitiva. Por el contrario


el informe seala que nuestra mayor ventaja comparativa es el conocimiento
cientfico aunque ste se encuentra amenazado por un dficit de infraestructura
y equipamiento en red y por los insuficientes recursos econmicos. El informe
recoge el impacto que tendr la aplicacin de la biotecnologa en el sector
sanitario, lo que permite adelantar cmo sern las herramientas de la medicina
del futuro.
La prospectiva, basada en el anlisis de un panel de 12 personalidades de la
industria biotecnolgica espaola y en la respuesta de un cuestionario de 120
expertos de todo el pas, recoge cuatro grandes tendencias y 16 tecnologas
especficas que marcarn el desarrollo de las tcnicas mdicas.
3.2 Horizonte 2010
Los diagnsticos genticos, el desarrollo de frmacos ms baratos, las terapias
celulares, la ingeniera de tejidos o las terapias y vacunas gnicas sern las lneas
maestras de la medicina en el 2010, mientras que la bioinformtica, la produccin
y uso masivo de modelos de animales transgnicos y la automatizacin en la
8

Antoni Esteve, Director Comercial de Esteve, Suplemento Negocios, ABC, 16/3/2003, p.10.

separacin, identificacin o interaccin de protenas sern instrumentos bsicos


para la investigacin.
La gentica adaptada a los diagnsticos permitir que, dentro de unos aos,
los recin nacidos adems de tener su partida de nacimiento tendrn un CD con
la informacin sobre su genoma. Con este avance se conseguir el diagnstico
precoz de enfermedades en las que intervienen varios genes, como en el caso del
cncer.
4. BIOINFORMTICA
En los establecimientos de

ciencias de la vida (life-sciences) a lo largo del

mundo, la computacin se est uniendo con la biologa para crear un mercado de


bioinformtica que se espera valga casi 40 mil millones de dlares dentro de tres
aos.
La bioinformtica se considera como una rama de la informtica relativa a la
adquisicin, almacenamiento y anlisis de los datos biolgicos. Se ha pasado de
una aplicacin gris a convertirse en el eje del progreso de la biotecnologa. La
bioinformtica ofrece una eficiencia sin precedentes mediante el modelado
matemtico. En la bsqueda de nuevos medicamentos, se predicen nuevos
medios para examinar la biologa a travs de la minera de datos (data mining). Y
es el nico medio prctico. Y es el nico medio de manejar el inmenso volumen
de datos.
Bioinformtica: uso y organizacin de la informacin sobre bases de datos
biomoleculares especialmente relacionadas con datos de biologa molecular-,
obtencin de informacin til a partir de esas bases de datos y en la integracin
de informacin a partir de fuentes dispares. De un modo ms innovador, se
puede considera que la bioinformtica forma parte de la nueva biologa y busca
un sistema de computacin par ensamblar, anotar y analizar la informacin del
ADN, la estructuras de las protenas y otros datos biolgicos.
Los cambios efectuados por los ordenadores en la biologa se asemejan a los
de la industria de la aviacin y del automvil de hace una dcada, despus de la
llegada del potente software para CAD (computer-aided design) y CFD

(computatitonal fluid dynamics). En ambas industrias los ingenieros abrazaron las


nuevas herramientas de modelado computacional como un mtodo para de
diseo de productos ms rpidos ms baratos y ms precisos (exactos). De un
modo similar, las empresas de biotecnologa estn ahora buscando modelado de
ordenadores, minera de datos y la investigacin de alta capacidad

de

procesamiento para ayudarle a descubrir medicamentos de un modo ms


eficiente.
En el proceso, la biologa y ms especficamente, biofarmacia se ha
convertido en uno de los consumidores ms grandes de potencia de computacin,
solicitando petaflops (millares de trillones de operaciones de coma flotante por
segundo) de potencia de supercomputacin y terabytes (trillones de bytes) de
almacenamiento. La bioinformtica es realmente un espectrum de tecnologa,
cubriendo tales cosas como arquitectura de computadora (p.e. workstations,
servidores, supercomputadoras, y similares) , sistemas de almacenamiento y
gestin de datos, gestin del conocimiento y herramientas de colaboracin y el
equipo necesario de ciencias de la vida para manejar muestras biolgicas. En el
2001, las ventas mundiales de tales sistemas ascendieron a ms de 12 billones
de dlares (12.000 millones), segn IDC (Internacional Data Corporation), una
firma de investigacin de Framinghan, Massachussets. En el 2006, el mercado de
la bioinformtica se espera alcance un valor de 38 billones de dlares (38.000
millones).
Como

nos anunciaba el profesor Lacadena, en las Jornadas de la UPSA,

la

mayora de las grandes empresas de tecnologas de informacin (TI) han lanzado


en estos ltimos aos secciones o departamentos dedicadas a ciencias de la vida
y en particular a biotecnologa. IBM fue de las primeras en lanzar una divisin
dedicada a ciencias de la vida, al principio del 2000. Desde entonces, una gran
cantidad de firmas de TI han saltado al campo de la bioinformtica. Junto con
IBM, Sun Microsystems ha apostado por computacin y a la gestin de negocios.
Empresas

tales

como

EMC

Hewlett-Packard

se

han

centrado

en

el

almacenamiento de datos. Agilent, SAP y Siebel proporciona herramientas de

apoyo a la decisin. Incluso fabricantes de PCs bajo pedido han introducido la


lucha con clusters de mquinas baratas.
Con el objetivo de mejorar la posicin competitiva de la biotecnologa espaola
los expertos consultados en el estudio resaltan el carcter de urgencia, del
desarrollo de, entre otros, los biochips,

la bioinformtica, la ultrasecuenciacin

genmica, los laboratorios virtuales, la automatizacin en la separacin e


identificacin de protenas o la mejora de la cualificacin de los recursos humanos
tanto en el mbito investigador como el del sector empresarial.
Sin embargo, los conjuntos de datos de diferentes fuentes bioinformticas se
ofrecen, a veces, en formatos diferentes, haciendo ms difcil integrar y minarlos
en otras industrias, tales como ingeniera o finanzas, en donde existen los
estndares formales para intercambio de datos.
Para ayudar a resolver los problemas de la bioinformtica, las firmas de
medicamentos,

los

fabricantes

de

ordenadores

las

organizaciones

de

investigacin han organizado un cuerpo de estndares denominado Interoperable


Informatics Infrastructure Consortium. Mientras tanto, el Distributed Annotation
System, un estndar para describir la anotacin del genoma a travs de fuentes,
est ganando popularidad, Esta situacin hace ms fcil comparar datos del
genoma de grupos diferentes.
Tales estndares sern de una gran ayuda. Una de las herramientas ms
eficiente para pruebas de informacin es la integracin de datos y en
consecuencia herramientas de ese tipo. Pero es la minera de datos, sin embargo,
donde la bioinformtica tiene mayores expectativas de crecimiento y de ingresos.
La minera de datos que se aplic en sus orgenes a la banca, es hoy una tcnica
muy sofisticada para predicciones de todo tipo y toma de decisiones con todo
rigor y fiabilidad. Se trata de utilizar una variedad de algoritmos que se aplican
en almacenes de datos en bsqueda de patrones significativos y relaciones
entre los diferentes silos de informacin. La promesa de la bioinformtica es que
los datos del genoma pblico mezclado con datos de secuencias propietarias,
datos clnicos de esfuerzos de medicamentos anteriores y otros almacenes de

informacin puedan descubrir pistas sobre posibles candidatos

a futuros

medicamentos.
Al contrario que la banca, la bioinformtica ofrece grandes retos para la
minera de datos debido a la mayor complejidad de la informacin y procesos. En
este caso las tcnicas de modelado y visualizacin tienen gran aplicacin para
asimilar las operaciones de diversas funciones biolgicas y predecir el efecto o
estmulo de una determinada celda u rgano.
Oto aspecto importante a considerar es el anlisis computacional de
secuencias biolgicas que ha cambiado su carcter desde finales de los 80. La
secuenciacin de DNA ha conducido a un crecimiento exponencial de los datos.
La bioinformtica es una disciplina estratgica emergente en la frontera entre
la biologa y la informtica con gran impacto en la biotecnologa y en general en
la sociedad. Las grandes bases de datos de informacin biolgica crean retos y
oportunidades en minera de datos cada uno de los cuales requiere nuevas ideas.
5. LOS SISTEMAS DE MINERA DE DATOS (DataMining)
La minera de datos es el proceso automatizado de descubrir informacin
desconocida (oculta), de una forma que se pueda comprender, a partir de
grandes volmenes de datos y que sea de utilidad para toma de decisiones
crticas. As, los puntos crticos que definen un Sistema de Minera de Datos son:

ser capaz de descubrir informacin oculta

esa

informacin

debe

ser

de

gran

utilidad

para

tomar

decisiones

importantes

la informacin se obtiene de grandes volmenes de datos, donde hay


mucha informacin.

Ese conocimiento debe presentarse de una forma que se pueda entender


sin excesivo esfuerzo.

Estas nuevas tcnicas se apoyan principalmente en algoritmos matemticos, y en


consecuencia genticos, y en redes neuronales. La minera de datos, al contrario

que el anlisis de datos estadstico tradicional, tabaja sobre la totalidad de los


datos y no con una muestra por lo que los resultados tienen una fiabilidad muy
superior, lo que permite tomar decisiones con mucho menos riesgo de cometer
errores.
5.1 Sector farmacutico y qumico
Las tcnicas de mineras de datos tienen muchas aplicaciones en este campo:

Deteccin y prediccin de las propiedades de un nuevo frmaco

Ajuste de la dosificacin a las particularidades de cada paciente

Prediccin de los efectos secundarios e incompatibilidades de un frmaco

Anlisis inteligente de resultados en las diversas fases clnicas.

Estudio de nuevas asociaciones farmacolgicas

Anlisis de la sensibilidad de los parmetros.

5.2 Sector sanitario


Una vez que se ha construido el sistema de Almacn de Datos (Data Warehouse)
se trata de descubrir el conocimiento oculto en los datos y que aporta gran
informacin muy valiosa sobre las enfermedades y su tratamiento. Es muy
importante sealar que estos sistemas no utilizan la informacin reseada en la
documentacin cientfica, sino que aprenden de los datos que va registrando la
comunidad hospitalaria en el sistema del Almacn de Datos. De esta forma no se
est sujeto a estudios estadsticos incompletos o realizados sobre poblaciones
muy diferentes a los existentes en nuestro entorno. As, los resultados obtenidos
se pueden aplicar con una fiabilidad absoluta. Algunas aplicaciones de las
soluciones de Minera de Datos pueden ser estas9:

Descubrir distintos comportamientos de una misma patologa

Realizar pronsticos ajustados a cada paciente

Ana B. Douton Losada. La Gestin del Conocimiento aplicada al negocio. Madrid: Elite&Progress, 2002, pp. 120-123.

Predecir las patologas que pueden aparecer como complicacin de una


enfermedad dada

Encontrar la predisposicin a padecer determinadas enfermedades

Descubrir asociaciones entre patologas

Determinar el mejor tratamiento individualizado para cada paciente

Sistema de apoyo al diagnstico

Descubrir nuevas caractersticas de una patologa

Comparacin entre parmetros clnicos

Asi, por ejemplo en el caso de descubrir comportamientos de una misma


patologa, los sistemas de minera de datos pueden encontrar subgrupos, dentro
de una determinada patologa, que tienen caractersticas comunes dentro del
mismo subgrupo y diferentes entre los diversos subgrupos. Estas clasificaciones
las encuentra el sistema de manera automtica, o bien atendiendo a los criterios
que se le impongan y que se basan en relaciones que el sistema encuentra por s
mismo y que no tienen porqu atenerse a las clasificaciones clsicas realizadas
con inters acadmico, clnico o fisiopatolgico. Un ejemplo puede ser relativo a
datos sobre los casos de Mieloma mltiple que puede encontrar diversos subtipos
con diferentes pronsticos o lo que se debe aplicar un tratamiento diferenciado.
5.3 Herramientas para el trabajo
Tales estndares sern de gran ayuda. Una de las herramientas ms eficientes
para probar informacin de las respuestas es una de las ms mundanas:
integracin de datos. Empresas como IBM, Hewlett-Packar y Accelerys desarrollar
mtodos de tirar

datos juntos de diferentes micrroarrays y plataformas

informticas.
Es en la minera de datos, sin embargo, donde la bioinformtica tiene
esperanzas de mayores beneficios. La promesa de la bioinformtica es que los
datos pblicos del genoma, mezclados con datos de la secuencia propietaria, los
datos clnicos de esfuerzos mdicos anteriores y otros almacenes de informacin,

Al contrario que las aplicaciones de la banca, la bioinformtica ofrece grandes


retos para minera de datos debido la gran complejidad de la informacin y
procesos. Las tcnicas de modelado y visualizacin permitirn simular las
operaciones de diversas funciones biolgicas y predecir el efecto del estmulo en
una celda u rgano.
Las configuraciones hardware deben cumplir los retos de procesar las enormes
cantidades de datos. Ser necesario seleccionar cuales son las herramientas de
software y bases de datos son las ms eficientes.
Otra de las innovaciones tecnolgicas se refieren a soluciones bioinformticas,
As, por ejemplo, se

requieren software de bioinformtica adaptado a las

necesidades del usuario. El software de anlisis de secuencias biolgicas


(www.netid.com) desarrolla software de bioinformtica a medida y requiere
aplicaciones de minera de datos para biologa molecular computacional utilizando
tcnicas de aprendizaje de mquina y diseo de software orientada a objetos.
5.4 Hombre y superman
La biotecnologa puede transformar a la humanidad y aunque, ahora y por
tiempo, oga presentar problemas, pero a medio y largo plazo puede cambiar el
mundo. It has not escaped our notice that the specific pairing we have
postulated immediately suggests a posible copying mechanism for the genetic
material. Con estas irnicas palabras, James Watson y Francis Crick comenzaron
una revolucin biolgica. Su artculo sobre la estructura del DNA que justo hace
50 aos se public en Nature describa la famosa doble hlice, piedra angular de
estas Jornadas.
6. LA REVOLUCIN INFORMTICA EN LAS CIENCIAS DE LA VIDA
La investigacin en biotecnologa ha superado el escenario tradicional de los
laboratorios con microscopios, probetas y cultivos, y se ha convertido en una
disciplina que requiere una gran potencia de computacin. El genoma humano
solo se ha podido descifrar con ordenadores que permiten comparar y ensamblar
ingentes cantidades de datos. Se trata de pasar de la era de la genmica a la de

protemica,

con

ms

necesidad

de

potencia

de

clculo.

Se

requieren

supercomputadoras basadas en clculo masivamente paralelo.


La computacin y simulacin son los dos ejes de esta nueva biologa que
abarcan la ya citada bioinformtica como las simulaciones biomoleculares. Los
supercomputadores que requiere la biotecnologa y la bioinformtica no requieren
tareas intensas en ecuaciones sino ms bien en intercambio masivo de grandes
flujos de datos, por ejemplo, para la comparacin de genomas o la resolucin de
estructuras de protenas a partir de sus componentes bioquimicos.
Las necesidades de computacin van desde un teraflop (un billn de
operaciones por segundo) para tareas de secuenciacin e identificacin de genes,
a mil teraflops para desentraar respuestas celulares, pasando por el anlisis o
identificacin de dianas terapeticas. La estrategia de supercomputacin exige
capacidad de computo y facilidad de crecimiento de las mquinas que permita
acometer tareas con un flujo masivo de datos, como es el caso de tantos
programas de biologa.
IBM trabaja en el Blue Gene, un nuevo superordenador especficamente
concebido, para la investigacin biolgica. El futuro Red Storm, que se desarrolla
en el SNL en colaboracin con la empresa Cray (lder en supercomputadores), con
un presupuesto de 90 millones de euros y que debe estar lista en 2004 tendr
una potencia de 40 teraflops con una arquitectura masivamente paralelo. Otro
gran proyecto aplicado a las ciencias de la vida es Gris, n sistema en desarrollo
para anlisis de los datos que generarn los detectores del nuevo gran acelerador
de partculas LHC (del Laboratorio Europeo de Fsica de Partculas, CERN). El Gris
combina las bases de datos distribuidas y la computacin distribuida con lneas de
intercomunicacin con alta velocidad. La idea central entre otras tecnologas
utilizar P2P es poder utilizar centenares de ordenadores diferentes dispersos
en institutos y centros de investigacin de muchos pases en una misma tarea de
computo, de forma que cada uno almacena una parte del clculo.

El Blue Gene: El supercomputador para la nueva biologa


Blue Gene es un supercomputador que debe ser 500 veces ms potente que los
ordenadores ms rpidos actuales. IBM tiene previsto invertir 100 millones de
euros. Blue Gene har ms de mil billones de operaciones por segundo (un
petaflop) lo que significa mil veces ms potente que el Deep Blue que gan al
campen del mundo de ajedrez Gary Kasparov en 1997 y unos dos millones de
veces ms potente que los ordenadores personales actuales.
Desde el punto de vista tcnico, el sistema se compondr de 64 mdulos
unidos para lograr un rendimiento de 1 petaflop. Cada mdulo tendr 8 placas y
una potencia de 16 teraflop (un billn de operaciones por segundo). Cada placa
tendr 64 chips, cada uno con una potencia de 2 teraflop, y cada chip tendr 32
procesadores cada uno capaz de hacer mil millones de operaciones por segundo
(1 gigaflop).
Blue Gene estar listo en 2005 y se concibe como una supercomputadora
orientada a problemas de investigacin biolgica, sobre todo los mecanismos de
plegamiento de las protenas. Pretende avanzar en el estado del arte de la
simulacin biomolecular as como en el desarrollo de software para sistemas de
escala. En sntesis, se trata de disear un ordenador de cmputo masivamente
paralelo para biologa y , en consecuencia, para biotecnologa y bioinformtica.
7. CONCLUSIONES
La revolucin tecnolgica que nos afectar a todos directamente, mucho ms que
otras que se sucedieron en la Historia genera preguntas fundamentales acerca de
la naturaleza de la Ciencia, qu clases de tecnologas vamos a preemitir introducir
en el mercado y a beneficio de quienes y la influencia del comercio en los
desarrollos de las Ciencias Biolgicas e Informticas. La convergencia de ambas
ciencias en la Bioinformtica requiere de equipos multidisciplinares de bilogos
moleculares, farmacuticos, mdicos,.. junto con tecnlogos (especializados
fundamentalmente en tecnologas de gestin del conocimiento, minera de datos,
lenguajes avanzados de Internet, sistemas distribuidos de informacin y servicios
Web como elementos de integracin de aplicaciones en diferentes sistemas y

plataformas). Pero, es la sociedad, en general, la que debe participar en la


determinacin de su futuro. De ah la importancia de Jornadas como stas que
sirvan de foro de reflexin y pensamiento para afrontar los pros y contras de la
biotecnologa que permitan colaborar en un desarrollo social adecuado y
sostenible en beneficio de la Humanidad.
La informtica y , ms concretamente su rama de Bioinformtica, tiene ante s
un gran reto: la capacidad de almacenar y aumentar la velocidad de anlisis de
los gigantescos volmenes de datos que la industria est manejando desde que
se public en 2001 el mapa provisional del genoma humano. La definicin del
genoma

ha

sido

fundamental

para

el

desarrollo

de

nuevas

medicinas,

transgnicos, etc. pero ha puesto a disposicin de la industria un gran volumen


de datos. El problema es que la informacin, en las previsiones ms pesimistas,
se duplica cada seis meses. Esto hace que proyecto como Nanodrive que busca
dispositivos de nanotecnologa para almacenar grandes volmenes de datos en
pequeos microcircuitos sean uno de los proyectos tecnolgicos con mayor futuro
e impacto en el desarrollo de la biotecnologa en este siglo.
Empresas

informticas

como

IBM,

Seagate,

Hewlett-Packard,

Hitachi,

trabajan en proyectos de Memoria de Alta Densidad que redundar en pocos aos


en la expansin e implantacin a niveles populares de la biotecnologa.
La informtica puede proporcionar a la biotecnologa los siguientes beneficios
fundamentales: Capacidad de almacenamiento, Velocidad de proceso, Gran
capacidad de comunicacin (lneas de gran velocidad de transmisin de datos) y
posibilidad de realizar simulaciones complejas, Tcnicas de Minera de Datos
(para extraer conocimiento de grandes volmenes de datos, sobre todo la
informacin oculta y no obvia) Por el contrario la biotecnologa est
proporcionando a la informtica: mejores interfaces, desarrollo de la Realidad
Virtual, Mejorars en Inteligencia Artificial, Algoritmos genricos y Mejoras en
Redes Neuronales.

Probablemente y como pronostic Jos L. Jorcano, Director de Genoma


Espaa10 y tal como tambin anunci Riftkin en 1998, la industria biotecnolgica
ser el sector ms importante del siglo XXI pero el inmenso volumen de datos
que requerirn en su proceso exigir que en paralelo se desarrolle una industria
bioinformtica

y eso implica que las universidades y centros de investigacin,

deberemos comenzar preparar cursos, seminarios, jornadas, para el estudio de la


bioinformtica y comenzar cuanto antes lneas de investigacin especficas sobre
estas viejas y nuevas ciencias. La investigacin en nanotecnologa, chips
biolgicos, software para empresas de biotecnologa, tecnologas de gestin del
conocimiento en volmenes masivos de datos y comunicaciones en banda ancha
son, sin duda, los grandes campos de investigacin y desarrollo de esta dcada.
La biotecnologa, desde el punto de vista de mercado, es un sector atractivo y
de enorme potencial. Pero tambin de elevado riesgo para el inversor y alta
volatilidad. La epidemia de neumona atpica procedente de Asia y la guerra en
Irak han puesto an ms de moda la biotecnologa. Vase el caso de los
fabricantes de mascarillas y los fondos de inversin especializados en el mismo
sector. Prueba evidente de la madurez del sector es la existencia del ndice
Nasdaq Biotechnology, que agrupa a las 72 compaas ms importantes del
sector. En Espaa, la empresa representativa es Zeltia, en concreto, su filial
Pharmamar.
Como Geoffrey Carr seala en el ltimo suplemento publicado en The
Economist (29 de Marzo de 2003) la biotecnologa tiene sus problemas, pero a
largo plazo puede cambiar el mundo o mejor como resalta en

Man and

superman, el ttulo del artculo de cierre de dicho suplemento, La biotecnologa


puede transformar a la humanidad, siempre y cuando la humanidad desee ser
transformada.

10

Entrevista en suplemento Negocios, ABC, 16/0/2003, p. 10.

8. POST-CONCLUSIONES11
Cuando este artculo se haba concluido y antes de su revisin final, se public la
excelente noticia por toda la prensa mundial (semana del 14 de Abril de 2002)
que los cientficos haban completado la secuencia del genoma humano. El
borrador del genoma ha sido utilizado por cientficos de ms de 120 pases que
obtienen la informacin por Internet, ya que ha estado disponible desde su
presentacin en Junio de 2000. Cientficos de Estados Unidos, Francia, Alemania,
Japn, Gran Bretaa y China que constituyen el Consorcio Pblico del Genoma
Humano, dieron un comunicado conjunto el 13 de Abril en el que sealan que el
desciframiento completo del libro de instrucciones de la vida integrado por unos
treinta mil genes permitir avances revolucionarios en las ciencias de la vida y en
el bienestar de la Humanidad. Este enorme conocimiento es accesible a todo el
mundo, sin ninguna restriccin, en Internet. Precisamente la prensa mostraba
fotografa de los cientficos entregando el mapa del genoma en CD a sus Jefes de
Estado y Presidentes de Gobierno. En una de esas fotografas se poda apreciar
como el profesor japons Sakaki, miembro del Consocio, entregaba a su primer
ministro, el mapa del genoma en CD/DVD (a primera vista una docena de discos).
El 24 de Abril el NHGRI (Nacional Human Genome Research Institute) que
lidera el consorcio espera publicar en la prestigiosa revista Nature su visin de lo
que denomina la era del genoma coincidiendo con el 50 aniversario de la
publicacin en la misa revista de los descubrimientos de James Watson y Francis
Crack sobre el ADN. Los prximos meses y aos, la biotecnologa y la
bioinformtica tienen ante s un futuro espectacular, mxime si tenemos en
cuenta que la compaa privada Celera Genomitas, la competencia del Consorcio,
ofrecer una rueda de prensa, un da antes, para explicar sus resultados
trimestrales correspondientes a su actual ejercicio fiscal. Posiblemente ese da
tambin conoceremos nuevos avances en esta lucha por la redaccin casi final
del libro de la vida. La competencia cientfica de ambas instituciones no slo ha
permitido adelantar los trabajos de investigacin en dos aos antes de lo
11

Informacin amplia se puede encontrar en lnea (on line) en;


<www.ornl.gov/TechResources/Human_Genome

previsto, sino que con la ayuda de las potentes mquinas y herramientas


informticas existentes actualmente y las que se irn desarrollando, como se
coment anteriormente, permitirn que en un futuro, ya no lejano, el mapa
gentico permitir descubrir tratamientos para enfermedades hasta ahora
incurables, o tratar genes defectuosos.
En definitiva, coincidiendo con el 50 aniversario del descubrimiento del DNA, la
secuenciacin completa del genoma humano permitir avances revolucionarios en
las ciencias y servir como nuevo punto de partida de la biotecnologa y, por
ende, la bioinformtica. Como coment el da de su presentacin Cesar Nombela,
expresidente del CSIC, se abre una era de nuevos abordajes en el conocimiento
de la mayor parte de las enfermedades.
Por lo que se refiere al campo de la investigacin en Espaa esperemos que
las iniciativas individuales se conviertan en proyectos colectivos. Ana Pastor,
ministra de Salud y Consumo, ha escrito recientemente un artculo12 en el que
habla de las iniciativas colectivas que pretende poner en marcha el Gobierno: (1)
Dotar al Sistema Espaol de Ciencia y Tecnologa de instrumentos para financiar
proyectos de Genmica, Protemica y Bioinformtica a travs del Plan Nacional de
I+D+I; (2) Financiar proyectos de investigacin biomdica en red; (3) Fundar,
por parte de los ministerios de Sanidad y Consumo, y de Ciencia y Tecnologa,
Genoma Espaa como fundacin que tiene por objetivo la promocin de la
investigacin genmica, protemica y bioinformtica, mediante la integracin de
centros pblicos, hospitales y empresas en el desarrollo de proyectos de I+D+I y
la creacin de plataformas tecnolgicas al servicio de la comunidad. Es de esperar
que sus deseos se hagan realidad: las oportunidades abiertas por la
secuenciacin del genoma humano son de gran repercusin para la ciencia la
salud y la sociedad, y ante ello nuestra voluntad es poner en marcha los
mecanismos necesarios para que estos nuevos avances redunden en mejorar la

12

Ana Pastor, El proyecto Genoma Humano: Un hito histrico de la Humanidad en el Mundo, 18 de Abril de 2003, p. 25.
En este artculo adems de expresar sus esperanzas por la finalizacin del genoma humana, afirma que la voluntad del
Gobierno es poner en marcha los mecanismos para que este gran avance redunde en mejorar la salud de los ciudadanos. Por
lo que se refiere a nuestro campo de inters, es de agradecer los proyectos gubernamentales existentes y futuros, relativos a
Genmica, Protemica y Bioinformtica.

salud de los ciudadanos. Que as sea, y que nuestro pas y nuestra universidad lo
vean.
BIBLIOGRAFA
ATTWOOD, T. K. y PARRY-SMITH, D.J.: Introduccin a la Bioinformtica. Madrid:
Prentice-Hall, 2002
BALDI, Pierre y BRUNAK Soren: Bioinformatics: the Machine Learning Approach.
MIT Press, 2002.
BUSINESSWEEK. Life Sciences: Drugs, Health Care en Industry Outlook 2003,
BusinessWeek, January 13, 2003, pp. 95-99.
FUNDACIN CEFI: Informe General. Los retos de la biotecnologa Madrid:

CEFI,

1996.
MAYOR ZARAGOZA, F. y ALONSO BEDATE, C. (coords.): Gen-tica.
MUOZ, E., Biotecnologa y sociedad. Encuentros y desencuentros. Madrid:
Cambridge University Press, 2001.
MUOZ, E.: Biotecnologa, Industria y Sociedad. El caso espaol, Fundacin
CEFI, 1997.
LUJAN, J.L., MARTNEZ, F. y MORENO: L. La biotecnologa y los expertos.
Madrid: Fundacin CEFI (GABIOTEC), 1996.
MUNDO CIENTFICO: El ADN y los cientficos. N 244, Mayo 2003.
PASTOR, Ana: El proyecto genoma humano: Un hito histrico de la Humanidad
en

El Mundo, 18 de Abril de 2003, p. 25.

RED HERRING: Brieging: Biomedical Devices. N 122, February, 2002, Briefing:


Nanotechnology, n 123, March, 2003.(www.redherring.com).
RIFKIN, Jeremy: El siglo de la biotecnologa. Barcelona: Grijalbo/Mondadori, 1999
(Ttulo original: The Biotech Century: Harnessing the Gene and remaking
the

world, J.P. Tarcher/Putnam: New York, 1998).

SCIENTIFIC AMERICAN: 50 Years of the Double Helix. Volume 288, n 4. April


2003;

The

Nanodrive

(www.sciam.com)

Project,

Volume

288,

1,

January,

2003.

THE ECONOMIST: The Economist Technology Quartely en The Economist,


March,

15th 2003 y Decenber, 14th 2002.

THE ECONOMIST:

A survey of biotechnology en The Economist, March, 29th

2003.
REFERENCIAS WEB
Asebio (Asociacin Espaola de Bioempresas)
Asociacin de Semilleros Argentinos

www.asebio.com
www.porquebiotecnologia.com.ar

BioSpain (Foro de Biotecnologa, Febrero 2003)

www.biospain.com

Centro de Supercomputacin de San Diego (SDSC)

www.sdsc.edu

CERN

www.cern.ch

Departamento de Energa de EEUU

www.ornl.gov/TechResources/Human_Genome

Fundacin Genoma Espaa

www.gen-es.org

Instituto de Biotecnologa (U. de Granada)


NetGenics
Revista Bioinformatics World
Staden

www.ugr.es
www.netgeniscs.com
www.bioinformaticsworld.info

www.mrc-lmb.can.ac.uk/pubseq

SNL (Laboratorios Nacionales Sandia)


Tendencias globales al 2015

www.sandia.gov
www.cuestiones.ws.revista/n6/nov01-2015.htm

TIGR Center for the Advancement of Genomics (TCAG)

También podría gustarte