Está en la página 1de 6

GENMICA,

BIOINFORMTICA
y EVOLUCIN
Una alianza estratgica para la
biologa del nuevo siglo
Hernn Dopazo
Centro de Investigacin Prncipe Felipe, Valencia
Genmica, bioinformtica y biologa de sistemas son recientes ramas de la
biologa que se apoyan frmemente en la visin darwiniana de la evolucin,
al tiempo que arrojan nueva luz sobre ella.
88
C
uando entr en el estudio de Darwin, en la casa
de campo que habit con su familia durante cua-
renta aos en la pequea localidad de Downe, en
Kent, experiment solo una sensacin: admiracin. All
estaban todas sus cosas: su mesa de estudio, sus instru-
mentos, su viejo silln, el espejo, las fotografas de sus
amigos Charles Lyell y Joseph Hooker, sus libros. All
Darwin pens, planic y escribi la mayor parte de sus
trabajos, en especial el que consider ms importante, y
que cambiara el rumbo del conocimiento humano para
siempre: El origen de las especies. Esa habitacin fue centro
neurlgico de su actividad hasta el nal de sus das.
Cmo hubiera trabajado Darwin de haber tenido acceso
a internet, correo electrnico y una base de datos? Algunos
imaginan que hubiese sido aun ms innovador, pero, en mi
opinin, poco habra cambiado. Quiz no hubiera tardado
veinte aos en dar a conocer su idea ms original: el me-
canismo de seleccin natural como explicacin del origen
de las adaptaciones de los organismos a su ambiente. Pero
quiz hubiese necesitado un buen tiempo de todos modos,
porque las ideas requieren maduracin, independientemen-
te de la tecnologa de que disponga quien las concibe.
La tecnologa, sin embargo, impone tiempos al desarrollo
cientco y se convierte en directriz de gran parte del nue-
vo conocimiento. Las tcnicas moleculares que aprend hace
poco ms de veinte aos como estudiante de biologa estn
hoy obsoletas: lo ocurrido en esa disciplina en tan corto pe-
rodo provoca escalofros, concretamente, por el trnsito de
una produccin artesanal de datos genticos a una produc-
cin industrial de datos genmicos. Esa transformacin con-
virti a las investigaciones biolgicas en multidisciplinarias
y cambi el paisaje demogrco en nuestros laboratorios.
En la actualidad, los bilogos comparten sus mesadas con
matemticos, qumicos, fsicos e informticos.
Qu ensear hoy a los estudiantes? Dnde poner las
prioridades? La mejor imagen para representar la actual pro-
duccin de datos genmicos es la de un tsunami que empie-
za a tomar forma. Pero con tantos datos, se est generando
nuevo conocimiento? Ha llevado esta revolucin tecnolgi-
ca a nuevas teoras en algn campo de la biologa? S y no.
Las preguntas principales siguen siendo las mismas, pero
ha cambiado la dimensin de las respuestas. Cmo pasa-
mos de la constitucin gentica de individuo o su genotipo a
sus caractersticas individuales o su fenotipo? Cmo pasamos
de la informacin contenida en secuencias del ADN de un
genoma a la diversidad de formas, funciones y compor-
tamientos de los seres vivos? Cmo, dnde y por qu se
producen las fallas frecuentes que generan enfermedades?
Cul es la relacin de parentesco entre todos los seres vi-
vos? Es decir, cul es la forma nal del rbol de la vida?
Estas preguntas han estado desde siempre en la mente de
los bilogos, pero actualmente la mayora de las respuestas,
tanto en el campo de la siologa como en el de la evolucin,
estn en completa revisin. Constituyeron la exitosa biologa
del siglo XX, centrada en la accin individual de los genes.
A pesar de la reciente metamorfosis de la biologa, las nue-
vas respuestas a esas preguntas seguirn descansando en una
actualizada teora evolutiva, cuyos pilares construy Darwin
hace ciento cincuenta aos en aquel estudio de Downe.
La revolucin genmica
En 1974 Frederick Sanger (dos veces premio Nobel
de qumica, en 1958 y en 1980) cre un mtodo de
secuenciacin del cido desoxirribonucleico o ADN por
terminacin de cadenas. Su idea consisti en obtener todas las
secuencias posibles de una cadena de ADN con un nico
nucletido de diferencia, para luego leerlas e inferir la
secuencia completa de pares de bases de un gen.
Esta tcnica se aplic manualmente en los laborato-
rios durante toda la dcada del 1980. Dada su baja re-
solucin, afortunados eran aquellos que, repitiendo tres
veces el experimento, lograban leer con pocas dudas mil
pares de bases, es decir, un poco menos que el tamao
medio de un pequeo gen bacteriano.
En la siguiente dcada, los avances tcnicos automatiza-
ron el mtodo, redujeron los errores de lectura, permitie-
ron la produccin en paralelo, e imprimieron al costo de
secuenciacin una carrera descendente que an contina.
En 1998 un secuenciador automtico procesaba un milln
de pares de bases por da. Ese ao el consorcio pblico
del proyecto del genoma humano se pona como objetivo
secuenciar ochenta millones de ellas. Dos aos despus se
haba duplicado el rendimiento, y en 2001 se present p-
blicamente el primer esquema de nuestro genoma.
Esto no constituy ms que la punta del iceberg de una
nueva forma de hacer biologa, cuyo objetivo inmediato
fue la secuenciacin de todos los genes humanos (alrede-
dor de veintitrs mil), en especial aquellos asociados con
enfermedades, que constituyen perlas para la medicina. Si-
gui el estudio de su regulacin y expresin, para lo cual
no solo interesan los genes, sino sus secuencias regulado-
Estudio de Darwin en Down House, la casa de campo en la que vivi durante cuarenta
aos, situada en el condado de Kent, cerca de la localidad de Downe, unos 26km del
centro de Londres en direccin sudeste.
89 Volumen 19 nmero 113 octubre - noviembre 2009
ARTCULO
ras; los intermediarios o transcriptos de sus productos nales,
las protenas; las secuencias que separan un gen de otro, y
un conjunto de otros elementos, algunos repetidos desde
unas pocas decenas hasta miles de veces, que no hace mu-
cho formaban parte de lo completamente desconocido del
genoma de un organismo eucariota superior.
Para comprender nuestro genoma y experimentar con
l debemos entender nuestras diferencias con otras espe-
cies, como gusanos, moscas, peces, ratones y nuestros pa-
rientes primates ms cercanos, lo que llev a la genmica
comparativa. Esta revolucin no solo tiene consecuencias
para la medicina o la industria farmacutica sino, tambin,
para reas como agricultura, ganadera, piscicultura e in-
geniera forestal. Modica preguntas y mtodos en todos
los campos del conocimiento biolgico, desde la biologa
del desarrollo a la sistemtica, desde la microbiologa al
comportamiento, y desde la gentica de poblaciones a la
conservacin de especies. Institutos como el Sanger en In-
glaterra o empresas como Celera en los Estados Unidos son
en la actualidad centros robotizados dedicados a la genera-
cin masiva de datos genmicos.
Ante estas nuevas posibilidades, en un mar de A, C, T
y G como se simbolizan las cuatro bases de los cidos
nucleicos, cmo distinguir las partes que tienen alguna
funcin de las que no la tienen? Con qu herramien-
tas manejar y guardar esa enorme informacin? Cmo
hacer accesibles los datos a investigadores y a otros inte-
resados? Ya habr supuesto el lector que de eso se ocupa
la bioinformtica, a la que nos referiremos despus de
comentar brevemente la tecnologa de los chips de expresin.
Miles de experimentos en dos
centmetros cuadrados
La hibridacin de cidos nucleicos es una tcnica de laboratorio
usada por la biologa molecular que detecta la expresin de
un gen por medio de la concentracin del ARN mensajero
que da lugar a la produccin de una protena. La tcnica se
aplicaba manualmente durante las dcadas de 1980 y 1990.
Actualmente hay empresas que venden unas pequeas pla-
cas de vidrio o chips que concentran en poco ms de dos
centmetros cuadrados todos lo genes de un genoma, sea
humano, de ratn o de mosca.
La cuanticacin de ARN mensajero con estos chips de
ADN, llamados microarrays, permite medir la expresin
de todos los mensajeros de los genes de un genoma some-
tido a una o ms condiciones experimentales y compararlo
con un genoma de control. En un solo experimento pode-
mos obtener el transcriptoma (la totalidad de ARN mensajero
expresado en un genoma) de cualquier tipo de cncer, en
pacientes estraticados por edades, sexo y distintos trata-
mientos farmacolgicos. Podemos deducir cules genes son
responsables del crecimiento descontrolado de clulas, los
que provocan el rendimiento de aceites en una planta, los
responsables genticos de que una abeja reina sea diferente
de una obrera o lo que sucede durante la metamorfosis de
un insecto. Esta tecnologa de chips no solo se aplica al an-
lisis de la expresin de genes; tambin sirve para deducir
prdidas y ganancias de material gentico en distintas re-
giones cromosmicas, para la deteccin de mutaciones de
un solo nucletido en poblaciones, para la interaccin en-
tre protenas, etctera. Si bien las posibilidades de este tipo
de tecnologa son enormes, lo relevante en esta revolucin
tecnolgica es haber pasado del anlisis individual de unos
pocos genes al anlisis masivo de genes en paralelo.
Esta tecnologa ha robotizado los laboratorios gen-
micos y automatizado el trabajo tcnico. La toma de datos
est garantizada para un experimento genmico, por lo
que podemos responder de manera detallada a la pregunta
ms bsica de cualquier ciencia: en qu consiste el siste-
ma en estudio. Sabiendo qu hay, podemos concentrarnos
en formular hiptesis acerca de cualquier observacin,
para estar en condiciones de responder qu hacen y por
qu estn all sus elementos, es decir, encontrar las causas
prximas (siolgicas) y ltimas (evolutivas) del estudio
biolgico. Pero para responder estas preguntas debemos
ser conscientes del tipo de dato que hemos producido.
Por ejemplo, en el anlisis de un cncer de un ni-
co paciente con un chip de expresin se producen unas
25.000 las de datos por una decena de variables prima-
rias que, multiplicado por unas veinte rplicas de expe-
rimentos, arroja cinco millones de datos. Para el anlisis
de secuencias genmicas como para la lectura de experi-
mentos de microarrays, no alcanza con el manejo de una
planilla de clculo de tipo Excel.
Recuerdo que, ante la oferta de dedicarme a la genmica
y bioinformtica, pregunt a quien sera mi mentor durante
algunos aos si la bioinformtica no era una moda pasajera,
fomentada por colegas poco afectos a las labores experi-
mentales de laboratorios con tubos de ensayo, soluciones y
pipetas. A mis dudas sobre si desaparecera en poco tiempo,
me respondi sin vacilar que solo poda ir a ms. Tena ra-
zn: hoy no se puede hacer gentica, microbiologa, bio-
medicina o biologa evolutiva modernas sin conocimientos
de bioinformtica. La acumulacin de datos de secuencias
moleculares y la imperiosa necesidad de dar sentido a la
diversidad de informacin que comenz a generarse con las
nuevas tcnicas de secuenciacin de protenas y, despus,
de cidos nucleicos produjeron su nacimiento y alimentan
su desarrollo (vase el recuadro La bioinformtica).
Filogenmica: una visin
genmica del rbol de la vida
Las relaciones de parentesco entre humanos, moscas y
gusanos no segmentados o nematodos fueron denidas des-
90
de los inicios del siglo XX gracias a una caracterstica que
surgi durante la evolucin de los dos primeros grupos
de organismos y que no se ve en el tercero: el celoma. Este
es una cavidad embrionaria caracterstica de moluscos,
gusanos segmentados o anlidos, artrpodos y vertebra-
dos, que supuestamente habra surgido una nica vez en
el ancestro comn de todos estos organismos.
El estudio logentico o historia evolutiva molecular de
los organismos mencionados estableci una nueva clasi-
cacin, pues postul la existencia de los ecdisozoos (Ecdysozoa),
un grupo distinto que rene a moscas y gusanos, es decir, a
artrpodos y nematodos en una sola clase. La existencia de
los ecdisozoos, que forman uno de los grupos mayores del
mundo animal, postula la existencia de un ancestro comn
diferente entre estos organismos. En la vieja clasicacin los
humanos, lo mismo que los cerdos y las serpientes, estba-
mos ms cerca de las moscas y araas que de los gusanos no
segmentados. En la nueva clasicacin, con el grupo de ec-
disozoos quedamos a igual distancia de los insectos que de
cualquier gusano parsito nematodo. As, desde mediados
de la dcada de 1970, la informacin proporcionada por la
biologa molecular pas a dominar la sistemtica.
La nueva clasicacin fue inicialmente aceptada por
algunos y discutida por otros, segn qu genes utilizaran
para el anlisis. En 2003, cuando este autor comenz ac-
cidentalmente a analizar el problema, se contaba ya con
los genomas completos de los tres conjuntos de organis-
mos nombrados, as como de otros muchos que tienen
un lugar en el rbol de la vida, desde unicelulares como
el Plasmodium (el parsito causante de la malaria) hasta los
humanos. Ahora, gracias al soporte estadstico proporcio-
nado por ms de 11.000 secuencias de los genomas de
diferentes organismos, el grupo de los ecdisozoos qued
rmemente establecido. La logenmica, es decir, la his-
toria de la vida reconstruida sobre bases genmicas o de
miles de genes, aporta as una visin estadstica ms ro-
busta de las relaciones genealgicas entre las especies. Re-
quiere el manejo masivo de genes y la concatenacin de
miles de anlisis logenticos por medio de programas
informticos en lenguajes como Perl, Phyton o C++.
Seleccin natural y deteccin
genmica de enfermedades
En 2005 comenzamos a trabajar en la prediccin de en-
fermedades humanas mediante el anlisis evolutivo de pre-
siones selectivas en protenas, es decir, midiendo la fuerza
con que un aminocido es descartado de una poblacin. El
razonamiento que utilizamos se bas en el hecho de que,
del mismo modo que la seleccin natural puede mantener
el cambio adaptativo de la informacin gentica de una
protena, su trabajo frecuente es descartar mutaciones que
deterioran la informacin gentica transmitida de padres
a hijos, causa principal de que los hijos se parezcan a sus
padres. Esta forma de seleccin se conoce como seleccin pu-
ricadora, y es la ms frecuente en todas las especies.
En un primer estudio, trabajamos con la protena P53,
que tiene un importante cometido en el control del ciclo ce-
lular y, por lo tanto, es fundamental para evitar el crecimien-
to de la mayor parte de cnceres humanos. Establecimos que
por debajo de cierto umbral de presiones selectivas sobre
L
a bioinformtica utiliza algoritmos informticos y modelos
probabilsticos para dar sentido a los datos contenidos
en las bases de datos biolgicas. Entre las ms conocidas
podemos mencionar: (1) la de genes de enfermedades humanas
(http://www.ncbi.nlm.nih.gov/sites/entrez?db=OMIM); (2) la de
ontologas gnicas (http://www.geneontology.org/), que emplea
un vocabulario de trminos semijerrquicos organizados por
procesos biolgicos, componentes celulares y funciones biolgicas,
y (3) la de genomas completos (http://ensembl.org). Entre las
herramientas ms populares, estn las que buscan secuencias
parciales o completas (exones, motivos, genes o regiones
genmicas) en diferentes bases de datos (como http://blast.ncbi.
nlm.nih.gov/Blast.cgi). Entre los modelos probabilsticos estn
los ocultos de Markov, que sirven para buscar patrones defnidos
de secuencias. Tambin las regresiones logsticas, los modelos
basados en mxima verosimilitud y el clculo de probabilidades
bayesianas para el ajuste del modelo a los datos biolgicos.
El trabajo principal del bioinformtico es el manejo de la
informacin biolgica. Pero no alcanza con saber buscar datos en
un mar de letras y nmeros: se debe saber qu hacer con ellos, es
decir, formular hiptesis y ponerlas a prueba. El Departamento de
Bioinformtica y Genmica de la institucin en que se desempea el
autor en Valencia (http://bioinfo.cipf.es) ha desarrollado herramientas
que integran soluciones a problemas diversos. Por ejemplo, para el
anlisis funcional de genes (http://www.babelomics.org/), que permite
la caracterizacin funcional de experimentos de microarrays, y su
lectura (http:g/www.gepas.org). El programa que estudia la formacin
de redes mnimas de protenas (http://snow.bioinfo.cipf.es/cgi-bin/
snow.cgi), el que deduce estructuras terciarias de protenas por
comparacin con secuencias con otras especies (http://salilab.org/
modeller/), el que se encarga del anlisis de la evolucin molecular,
flogenia y adaptacin de las secuencias moleculares (http://www.
phylemon.org), y el que busca mutaciones funcionales en el genoma
humano y el de ratn (http://pupasuite.bioinfo.cipf.es/).
Estas herramientas y muchas otras son utilizadas en internet
por una amplia comunidad de investigadores alrededor del mundo
(http://bioinfo.cipf.es/toolsusage/). Las herramientas bioinformticas
representan en esta poca lo que fueron para la gentica las tcnicas
de biologa molecular en las dcadas de 1980 y 1990. Dado que no se
puede hacer un experimento si no se tiene una hiptesis de trabajo y
una defnicin explcita de cmo manejar los nmeros, resulta obvio
que los poseedores de este conocimiento sern jugadores clave en la
generacin de la biologa de este siglo.
LA BIOINFORMTICA
91 Volumen 19 nmero 113 octubre - noviembre 2009
ARTCULO
un aminocido, podamos distinguir residuos de protenas
asociados con diferentes frecuencias de cnceres, e identi-
camos los residuos de unas cuarenta protenas con mayor
probabilidad de asociacin con cnceres y enfermedades in-
munolgicas. Despus, trabajando en colaboracin con un
fsico, extendimos esos primeros anlisis a la construccin
de un sistema informtico que opera con los principios de
inteligencia articial y pudimos, primero, ampliar el mto-
do a todas las protenas de la base de datos UniProt (Universal
Protein Resource) y, luego, a todo el genoma humano. Final-
mente, aplicamos el mtodo en la publicacin del consorcio
que secuenci los genomas de todas las cepas de ratones de
laboratorio. En todo esto, la combinacin de conocimientos
en evolucin, genmica y bioinformtica result clave para
validar y predecir con xito enfermedades.
Qu nos hace humanos y no
chimpancs?
El sueo de conocer las diferencias genticas com-
pletas entre humanos y nuestros parientes vivientes ms
cercanos se hizo posible en 2005, cuando se public la
primera versin del genoma del chimpanc. Los bilo-
gos evolutivos de esta generacin tenemos la enorme
fortuna de poder responder cientcamente a uno de los
interrogantes que desde siempre ms han interesado a la
humanidad: qu nos hace humanos?
Con ese propsito abordamos un anlisis comparativo
de trece mil genes de cinco especies de mamferos. El traba-
jo consisti en el alineamiento automtico de esos genes, su
ajuste a modelos estadsticos y la estimacin de tasas o velo-
cidades de cambio evolutivo para cada uno de ellos en cada
una de las especies y en sus ancestros. Trabajamos en total
con unos noventa mil genes y unas cincuenta variables a las
que aplicamos diferentes pruebas para estimar si en el linaje
humano haba grupos de genes que cumplan funciones es-
peccas y estaban cambiando de manera adaptativa.
Los resultados de trabajos similares venan siendo poco
esclarecedores y el nuestro conrm lo mismo: que no
se han encontrado caractersticas genticas que nos hagan
distintos de un chimpanc. Sabemos algo ms despus
de nuestro estudio: que desde la separacin genealgica
de nuestro ancestro comn, los chimpancs cambiaron
su genoma de manera adaptativa o darwiniana en mayor
medida que los humanos. Asimismo, hay evidencia de que
los humanos experimentaron cambios adaptativos mucho
ms relevantes en protenas testiculares que cerebrales. Si
eso no resulta sorprendente, s lo es descubrir que el linaje
de chimpanc tuvo muchos ms cambios adaptativos en
sus protenas cerebrales que nuestro linaje.
El uso de casi cinco millones de datos genticos ofre-
ci perspectivas desconcertantes sobre lo ocurrido en los
ltimos cinco millones de aos de evolucin de nuestra
especie. Esos resultados, por n vericados de manera
completa, hicieron cambiar el rumbo de las investigacio-
nes hacia otras regiones del genoma. En 2007 se encontra-
ron las primeras diferencias de constitucin gentica entre
humanos y chimpancs en materia de cambio de dieta y
actividad cerebral, no en protenas sino en las regiones del
genoma que regulan la expresin de los genes.
M
argaret Oakley Dayhof (1925-1983), nacida en Filadelfa, escribi su tesis
doctoral en la Universidad de Columbia sobre la medicin de energas de
resonancia en compuestos orgnicos. Se vali de aplicaciones informticas que
usaban tarjetas perforadas. Qumica de profesin, se desempe en las universidades
Rockefeller, de Maryland y Georgetown. Invent el cdigo de aminocidos de una sola
letra y la matriz PAM para contabilizar el cambio evolutivo en secuencias de protenas.
Estos desarrollos la llevaron a construir el primer rbol flogentico por medio de
una computadora. Su Atlas de secuencias y estructuras de protenas, organizado por
familias gnicas, que le llev trece aos de trabajo desde 1965, fue su ms destacada
contribucin al desarrollo de la disciplina. El atlas dio origen a la base de datos PIR
(Protein Information Resource), hoy incluida en UniProt (http://www.uniprot.org/).
Walter Benson Goad (1925-2000), nacido en el estado norteamericano de Georgia,
fsico terico del laboratorio de Los lamos en Nuevo Mxico, desarroll el cdigo
informtico para la extraccin, almacenamiento y anlisis de secuencias de ADN, que
llev a conformar en 1982 la primera base de datos de nucletidos del mundo: Los Alamos
Sequence Data Bank, que se convertira en GenBank (http://www.ncbi.nlm.nih.gov/Genbank/
index.html). Junto con sus homlogas del Laboratorio Europeo de Biologa Molecular (http://
www.ebi.ac.uk/embl/) y la Base de datos de ADN del Japn (http://www.ddbj.nig.ac.jp/
index-e.html), actualizan su contenido diariamente y no han parado de crecer en forma
exponencial desde su creacin, con duplicacin de su contenido cada dieciocho meses.
PIONEROS DE LA BIOINFORMTICA
Representacin esquemtica de la estructura
tridimensional de la protena P53.
92
Del gen a la biologa de sistemas
Cabe preguntarse si los avances realizados en los l-
timos veinte aos en genmica y bioinformtica aplica-
das a la evolucin llevaron a la biologa a un estadio del
conocimiento proporcionado al esfuerzo invertido. Es
conveniente tener en cuenta que, en el estudio de la evo-
lucin y posiblemente en el resto de la biologa segui-
mos pensando y aplicando mtodos de la era pregen-
mica a los nuevos datos genmicos. Si antes aplicbamos
una prueba de seleccin a una decena de genes, ahora lo
hacemos a miles con la ayuda de la bioinformtica. Los
tres ejemplos anteriores muestran esa prctica.
Sin embargo, poco a poco va calando la idea de que
este enfoque no es suciente. Los datos genmicos mues-
tran un comportamiento de la naturaleza que no era evi-
dente cuando el anlisis abarcaba unos pocos genes. Aqu
es donde entra la biologa de sistemas, una nueva rama de
la biologa conocida desde hace tiempo tambin como
biologa integrativa o biologa holstica, que tom impulso con
la revolucin genmica. La disciplina, sin embargo, no
resulta de la mera negacin de la visin ms simplista o
reduccionista creada por razonar sobre pocos genes, sino
de considerar las caractersticas propias del sistema com-
plejo del que ahora tenemos datos.
Para dar un ejemplo, volvamos a la comparacin de ge-
nomas entre especies que cambian con relativa rapidez y
constituyen casos de adaptacin molecular. En ellas, el an-
lisis de los genes individuales con mtodos anteriores a la
era genmica impide conceder validez estadstica al hecho
de que hay, en cada especie, funciones diferentes asociadas
con el cambio adaptativo. Pero reconociendo que los genes
no son independientes, hemos sido capaces de encontrar
esas diferentes funciones. Los genes que se modican en
forma ms acelerada muestran caractersticas biolgicas
que no pueden ser explicadas considerndolos de manera
individual, como su localizacin en los cromosomas, ms
cercanos entre ellos, o la formacin de redes ms apreta-
das, que aquellos que se modican de manera ms lenta.
Es decir, existen propiedades biolgicas imposibles de ex-
plicar solo por la accin de genes individuales.
Conclusiones
He intentado en estas lneas resumir algunos de los
avances de las nuevas tecnologas genmicas. El sueo
de un conocimiento biolgico completo empez a rodar
con la miniaturizacin y paralelizacin de experimentos.
Esto habra sido imposible sin el simultneo desarrollo
de la bioinformtica. Mucho ha cambiado en la manera
de interpretar el comportamiento celular: pasamos de
una visin lineal de la informacin gentica al estudio
de cientos de genes que interactan en redes complejas
y dependen de mltiples variables. Por primera vez estas
pueden ser tomadas en conjunto para proporcionar una
explicacin ms satisfactoria del fenmeno biolgico.
Tenemos hoy un mejor conocimiento de la evolucin
que ayer. La teora neutralista de evolucin molecular sos-
tena que la velocidad de cambio de las protenas est nti-
mamente relacionada con su funcin. Hoy sabemos, gracias
a experimentos masivos de expresin, que las velocidades
de cambio de las protenas estn inversamente relacionadas
con la cantidad de ARN mensajero en sus clulas.
A mayor expresin, menor cambio evolutivo; a menor
concentracin de ARN mensajero en la clula, mayor can-
tidad de cambio por unidad de tiempo. A pesar de estos
detalles, la teora evolutiva contina siendo la que goza
de mayor credibilidad en toda la biologa, simplemente
porque ha sido la que ms batallas ha ganado durante ms
de un siglo de investigacin. Se cuentan por miles los ex-
perimentos realizados para refutar sus mltiples hiptesis.
Muchos de sus postulados sern modicados con el tiem-
po y la acumulacin de datos genmicos. Es lgico y fruc-
tfero que as sea. No obstante, los pilares de la evolucin
biolgica ya estn tan slidamente aanzados que habla-
mos crecientemente de la realidad de la evolucin y menos de
teora evolutiva. Son indicios que proporciona el lenguaje.
Para el futuro desarrollo de la biologa y la puesta a
prueba de sus hiptesis, desde la biologa celular a la eco-
loga del comportamiento, necesitamos investigadores con
caractersticas diferentes de los que hoy se forman en mu-
chas universidades del mundo. Deben poseer conocimien-
tos mnimos de informtica y no tan mnimos de estads-
tica, genmica y evolucin. Si queremos ser partcipes del
conocimiento biolgico futuro, no debemos dar la espalda
a esta nueva revolucin del conocimiento humano.CH
LECTURAS SUGERIDAS
HIGG PG & ATTWOOD TK, 2005, Bioinformatics and Molecular Evolution,
Blackwell Publishing, Oxford.
LESK AM, 2007, Introduction to Genomics, Oxford University Press.
LYNCH M, 2007, The Origins of Genome Architecture, Sinnauer.
PAGEL M & POMIANKOWSKI A (eds.), 2008, Evolutionary Genomics and
Proteomics, Sinnauer.
Hernn Dopazo
Doctor en ciencias biolgicas, Universidad Autnoma de Madrid.
Jefe de investigacin, Centro de Investigacin Prncipe Felipe, Espaa.
Profesor del Master de Bioinformtica, Universidad Complutense de Madrid.
Profesor del Master Genomes and Systems, Universidad Pompeu Fabra en Barcelona.
Secretario de la Sociedad Espaola de Biologa Evolutiva.
http://hdopazo.bioinfo.cipf.es
93 Volumen 19 nmero 113 octubre - noviembre 2009
ARTCULO

También podría gustarte