Está en la página 1de 123

BIOINFORMTICA,

la biologa por otros medios.

Alberto Labarga
Responsable de proyectos bioinformticos de Navarrabiomed
Fundacin Miguel Servet

Quines somos?
Navarrabiomed es la plataforma cientfica al servicio de todo aquel
profesional del Servicio Navarro de Salud que desee iniciar o consolidar
su carrera investigadora.
El centro, gestionado por
la
Fundacin
Miguel
Servet, se integra en el
recinto del Complejo
Hospitalario de Navarra lo
que permite una mayor
cercana con el entorno
clnico
y
asistencial
facilitando el desarrollo de
proyectos, ensayos y
tratamientos
experimentales.

reas
Neurociencias, Oncologa, Patologas de Grandes Sistemas y nuevos
desarrollos, Salud Mental y Vigilancia Epidemiolgica, Salud Pblica y
Servicios Sanitarios constituyen las las cinco reas de investigacin que
agrupan a un total de 27 grupos.

BIOINFORMTICA,
la biologa por otros medios.
BIOLOGA Y BIOINFORMTICA
Qu papel juega un informtico en un laboratorio
biomdico?

La vida puede verse como un proceso de almacenamiento y


transmisin de informacin biolgica.

El ADN es la molcula portadora de esta informacin.

Para entender la vida debemos identificar estas molculas y


descifrar el cdigo

We wish to propose a structure for the salt of desoxyribose


nucleic acid (DNA). This structure has novel features which are
of considerable biological interest

It has not escaped our attention that the specific pairing we


have postulated immediately suggests a possible copying
mechanism for the genetic material.

Cuando Perutz lleg a Cambridge la estructura molecular ms


grande que se haba resuelto era la del pigmento natural
ficocianina, de 58 tomos.

El tema escogido por Perutz para su tesis fue otra protena, la


hemoglobina, el transportador de oxgeno que da color rojo a
nuestra sangre.

La hemoglobina tiene

11.000

tomos.

Tard

23

aos.

Sanger determin la secuencia de los aminocidos de la insulina


en 1955. Al hacerlo, demostr que las protenas tienen
estructuras especficas.

Este resultado le vali su primer Premio Nobel de qumica en 1958

En 1955 Ochoa publica en Journal of the American Chemical


Society el descubrimiento de la polinucletido-fosforilasa

En 1959 recibe el premio Nobel junto a su discpulo Arthur


Kornberg.

Wilkins, Perutz, Crick, Steinbeck, Watson, Kendrew

En 1966 se presenta el cdigo gentico. Este cdigo asocia


a cada triplete de bases del ADN, llamado codn, un
aminocido concreto.

El primer Atlas of Protein Sequence and Structure, contena


informacin de 65 proteinas

papain

myoglobin

hemoglobin

carboxypeptidase A

ribonuclease

lactate dehydrogenase

En 1971 se crea el Protein Data Bank.


En 1974 tiene 12 estructuras

Frederick Sanger publica en 1975 un mtodo para la


"Secuenciacin del ADN mediante sntesis enzimtica".

El primer genoma de ADN completamente secuenciado fue


el del bacterifago X174, en 1977

5,386 bases

11 genes

En 1984 el DoE invita a 20 investigadores a Alta, Utah, para


discutir los efectos de la radiacin en el ADN.

Por la noche, entre cerveza y cerveza, alguien comenta,


por que no dedican el dinero a algo util, como secuenciar
el genoma humano?

Andre Marion y Sam Eletr de Hewlett Packard crean Applied


Biosystems En 1987 comercializan la primera mquina de
secuenciacin automatizada, el modelo ABI 370.

en

Ejercicio 1: Imagine varias copias


de un libro, cortadas en 10 millones
de trocitos cada una, de manera
que los trocitos se solapan.
Supongamos que 1 milln de
trocitos se han perdido, y que los
otros 9 millones estn manchados
de tinta.
Recupere el texto original.

1995.- El primer genoma completo de un organismo vivo,


Hemophilus influenzae. 1.8Mb, 3000 genes x 00

1996.- El genoma de la levadura (eukaryota). 12.000.000 de


bases y 6000 genes

1997.- El genoma de la bacteria E. Coli. 4.500.000 de bases


y 4600 genes

1998.- El genoma del gusano C. Elegans. 100.000.000 de


bases y 18.000 genes

1999.- Se consigue la secuencia completa del cromosoma 22.


49,000,000 bp. (slo 300 genes) (en realidad, 673)

2000.- La mosca de la fruta; 170 millones de nucleotidos y


13,000 genes

2000.- Arabidopsis thaliana. Tiene 100 millones de nucletidos, y


unos 20,000 genes

15 de Febrero de 2001: se publica el borrador de la


secuencia del genoma humano

3,000,830,137

bases

600.000x

11 aos

3,000,000,000 $

20,000 genes

What makes you


think you can do a
better job with life
and genetics than
God?

We have computers!

1953: IBM presenta su primera computadora electrnica


comercial, la IBM 701 con una memoria total de una memoria
total de 2048 palabras de 36 bits

1977: No hay necesidad de tener un ordenador en cada


casa", Ken Olsen, fundador de Digital Equipment

1981: IBM PC A Intel 8088 processor running at 4.77 MHz.


Basic in ROM. 16K RAM. MS-DOS 1.0

"Nadie va a necesitar ms de 640 Kb de memoria en su


ordenador personal"

En 1981 se crea EMBL Nucleotide Sequence Data Library.


Version 2 contenia 811 secuencias, cerca de un milln de
bases que fueron introducidas a mano.

S.F. Altschul, et al. (1990), "Basic Local Alignment Search


Tool," J. Molec. Biol., 215(3): 403-10, 1990. 15,306 citations

J. Thompson, T. Gibson, D. Higgins (1994), CLUSTAL W:


improving the sensitivity of progressive multiple sequence
alignment. Nuc. Acids. Res. 22, 4673 - 4680

http://www.flickr.com/photos/jpf/152611490/

Ley de Moore: el nmero de transistores en un chip se duplica


cada 18 meses

La capacidad de almacenamiento se duplica cada 2 aos

El ancho de banda se duplica cada 18 meses

una memoria principal de 100 Terabytes, una posibilidad de


almacenamiento en disco de 2 Petabytes y est conectado a un
sistema de almacenamiento de ficheros que supera los 11
Petabytes, 1.100 billones de operaciones cada segundo

30.000
genes

1500
genes

150
genes

50
elements

10
targets

Golub et. al. Science 286:531-537. (1999

16,000 cancer patients and


more than 25 cancer types

http://www.flickr.com/photos/nic221/391536867/

Y esto no ha hecho
ms que empezar!!

2002: mus musculus

2003: gallus gallus

2005: pan troglodytes

2006: opposum

2007: platypus

2008: mammoth

2008: homo neardenthalensis

2008: Watson personal genome

Roche / 454
Genome Sequencer FLX
100 Mb / run

Applied Biosystems
ABI 3730XL
1 Mb / day

Illumina / Solexa
Genetic Analyzer
2000 Mb / run

Applied Biosystems
SOLiD
3000 Mb / run

Google quiere almacenar tu genoma


Por 25 dlares al ao (20 euros), Google
Genomics guardar una copia de cualquier
genoma en la nube.
Google est presentado a hospitales y
universidades su nueva oferta: Tenis
genomas? Almacenadlos con nosotros.
Google Genomics podra tener ms
relevancia que estos otros proyectos de mayor
dificultad. Conectar y comparar miles de
genomas, y muy pronto millones, es lo que
impulsar los descubrimientos mdicos de la
prxima dcada. La cuestin sobre quin va a
almacenar los datos ya es un punto lgido de
competencia entre Amazon, Google, IBM y
Microsoft.
Hay cientficos que creen que los datos del genoma siguen siendo demasiado complejos
como para que Google pueda servir de ayuda. Pero otros creen que se avecina un gran
cambio. Cuando el experto en bioinformtica en Stanford (EEUU) Atul Butte asisti a la
presentacin que hizo Google de sus planes para este ao, coment que ahora entenda
"cmo se sintieron las agencias de viajes cuando descubrieron Expedia".

Maximilien Brice, CERN

Muchas gracias
por su atencin
Alberto Labarga
alberto.labarga.gutierrez@navarra.es
@alabarga
Quires conocer ms sobre nuestra actividad investigadora o estar al da de las novedades del
centro (cursos, seminarios, ofertas de empleo...)?
www.navarrabiomed.es

info.navarrabiomed@navarra.es