Está en la página 1de 47

ENCUESTA Y RESUMEN

La evolución darwiniana a la luz de la genómica.


RESUMEN La genómica comparativa y la biología de sistemas ofrecen oportunidades sin precedentes
para probar los principios centrales de la biología evolutiva formulados por Darwin en el Origen de las
especies en 1859 y expandidos en la Síntesis moderna 100 años después. Los estudios genómicos
evolutivos muestran que la selección natural es solo una de las fuerzas que dan forma a la evolución del
genoma y no es cuantitativamente dominante, mientras que los procesos no adaptativos son mucho
más prominentes de lo que se sospechaba anteriormente. Las principales contribuciones de la
transferencia horizontal de genes y los diversos elementos genéticos egoístas a la evolución del genoma
socavan el concepto del Árbol de la Vida. Una representación adecuada de la evolución requiere el
concepto más complejo de una red o "bosque" de la vida. No existe una tendencia consistente de
evolución hacia una mayor complejidad genómica, y cuando aumenta la complejidad, esto parece ser
una consecuencia no adaptativa de la evolución bajo una selección purificadora débil en lugar de una
adaptación. Se descubrieron varios universales de la evolución del genoma, incluidas las invariables
distribuciones de las tasas evolutivas entre los genes ortólogos de diversos genomas y los tamaños de
familias de genes parálogos, y la correlación negativa entre el nivel de expresión génica y la tasa de
evolución de la secuencia. Los modelos de evolución simples y no adaptativos explican algunos de estos
universales, lo que sugiere que una nueva síntesis de la biología evolutiva podría ser factible en un
futuro no tan remoto.

INTRODUCCIÓN

El libro de Charles Darwin Sobre el origen de las especies que apareció en Londres en 1859 (1) fue
el primer relato plausible y detallado de la evolución biológica publicado, junto con los breves
esbozos simultáneos e independientes de Darwin y Alfred Russell Wallace publicados el año
anterior (2 –3). Por supuesto, Darwin no descubrió la evolución y ni siquiera ofreció la primera
descripción coherente de la evolución; podría decirse que ese honor pertenece a Jean-Baptiste
Lamarck, cuya obra magna Philosophie Zoologique (4) se publicó, sin duda, en el año de
nacimiento de Darwin. Sin embargo, la imagen de la evolución de Lamarck se basó en un impulso
innato de los organismos en evolución hacia la perfección, una idea que no puede ser aceptable
para una mente racionalista. Además, Lamarck no proclamó el carácter universal de la evolución:
postuló múltiples actos de creación, aparentemente, uno para cada especie.

Darwin fue el primero en presentar una imagen racional, mecanicista y, posiblemente, magnífica
del origen de toda la diversidad de formas de vida "desde un comienzo tan simple",
probablemente, desde un único antepasado común (1). La visión de Darwin de la evolución de la
vida fue suficientemente completa y poderosa para ganar o, al menos, afectar profundamente a la
mente de la mayoría de los biólogos (y de los científicos en general, y del público educado en
general), de modo que toda la investigación en biología durante el último 150 años desarrollados
dentro del marco establecido por el Origen (incluso cuando se oponen a las ideas de Darwin). La
visión de Darwin carecía del fundamento esencial en la genética porque los mecanismos de la
herencia eran desconocidos en su época (el trabajo de Mendel pasó desapercibido, mientras que
las propias ideas de Darwin en esta área fueron menos productivas). La base genética de la
evolución se estableció después del redescubrimiento de las leyes de Mendel, con el desarrollo de
la genética de poblaciones en el primer tercio del siglo XX, principalmente, a través del trabajo
pionero de Fisher, Wright y Haldane (5–7). La nueva y avanzada comprensión de la evolución,
informada por el trabajo teórico y experimental en genética, se consolidó en la Síntesis Moderna
de la biología evolutiva, generalmente asociada con los nombres de Dobzhansky, Julius Huxley,
Mayr y Simpson (8–11). Aparentemente, la Síntesis Moderna (neoDarwinismo) adoptó su forma
madura durante la celebración del centenario de 1959 para el Origen en Chicago (12–14). Ahora,
50 años después de la consolidación de la Síntesis Moderna, la biología evolutiva sin duda se
enfrenta a un nuevo desafío importante y, al mismo tiempo, la perspectiva de un nuevo avance
conceptual (15). Si la síntesis moderna puede describirse sucintamente como darwinismo en la luz
de la genética (a menudo denominado neodarwinismo), entonces, la nueva etapa es la biología
evolutiva a la luz de la genómica. En este artículo, intento delinear los cambios a los principios
básicos de la biología evolutiva provocados por la genómica comparativa y funcional y sostengo
que, en muchos aspectos, la etapa genómica podría ser una desviación más radical del
neodarwinismo de lo que fue este último. del darwinismo clásico. Por supuesto, para hacerlo,
primero es necesario recapitular los conceptos principales de la evolución propuestos por Darwin
y enmendados por los arquitectos de la Síntesis Moderna. En el resto del artículo, vuelvo a cada
uno de estos puntos.

(i) La variación aleatoria no dirigida es el proceso principal que proporciona el material para la
evolución. Darwin fue el primero en permitir el azar como un factor importante en la historia de la
vida, y podría decirse que fue uno de sus mayores descubrimientos.

(ii) La evolución procede de la fijación de las raras variaciones beneficiosas y la eliminación de las
variaciones perjudiciales: este es el proceso de selección natural que, junto con la variación
aleatoria, es la principal fuerza motriz de la evolución según Darwin y la Síntesis Moderna. La
selección natural que es, obviamente, similar e inspirada por la "mano invisible" (del mercado) que
gobernaba la economía según Adam Smith, fue el primer mecanismo de evolución propuesto que
era simple, plausible y no requería ningún misterio. tendencias innatas. Como tal, esta fue la
segunda visión clave de Darwin. Los fundadores de la genética de poblaciones, en particular,
Sewall Wright, enfatizaron que el azar podría desempeñar un papel importante en la fijación de los
cambios durante la evolución, no solo en su aparición, a través del fenómeno de la deriva genética
que conlleva una fijación aleatoria de cambios neutros o incluso nocivos. La teoría de la población
genética indica que la deriva es particularmente importante en poblaciones pequeñas que
atraviesan cuellos de botella (6,16). Sin embargo, la Síntesis Moderna, en su forma "endurecida"
(13), efectivamente, rechazó la deriva como una fuerza evolutiva importante, y se adhirió a un
modelo de evolución puramente adaptacionista (17). Este modelo conduce inevitablemente al
concepto de "progreso", mejora gradual de "órganos" durante la evolución, una idea que Darwin
respaldó como una tendencia general, a pesar de su claro entendimiento de que los organismos
están menos que perfectamente adaptados, como lo demuestran los órganos rudimentarios. y a
pesar de su aborrecimiento de cualquier apariencia de un esfuerzo innato por la perfección de los
ilk lamarckianos.

(iii) Los cambios benéficos que son fi jados por la selección natural son “infinitamente pequeños”,
de modo que la evolución se produce a través de la acumulación gradual de estas pequeñas
modificaciones. Darwin insistió en el gradualismo estricto como un elemento esencial de su teoría:
«La selección natural puede actuar solo mediante la preservación y acumulación de
modificaciones hereditarias infinitamente pequeñas, cada beneficio para el ser conservado ... Si
pudiera demostrarse que existía algún órgano complejo, que no podría haber sido formada por
numerosas modificaciones sucesivas y leves, mi teoría se derrumbaría absolutamente. '[(1),
capítulo 6]. Incluso algunos contemporáneos de Darwin creían que era una restricción innecesaria
en la teoría. En particular, las primeras objeciones de Thomas Huxley son bien conocidas: incluso
antes de que la publicación de Origin Huxley escribiera a Darwin "Se ha cargado de una dificultad
innecesaria al adoptar Natura no facit saltum sin reservas" (18).

(iv) Un aspecto de la biología evolutiva clásica que se relaciona pero no es idéntico al gradualismo
de principios es el uniformismo (absorbido por Darwin de la geología de Lyell), es decir, la creencia
de que los procesos evolutivos se mantuvieron, esencialmente, los mismos a lo largo de la historia
de vida.

(v) La evolución de la vida se puede presentar como un "gran árbol", como se resume en la
ilustración única y famosa del Origen [(1), Capítulo 4].

(vi) Un corolario del concepto del árbol único de la vida (TOL) que, sin embargo, merece el estatus
de un principio separado: toda la diversidad existente de formas de vida evolucionó a partir de un
único ancestro común [o muy pocas formas ancestrales, bajo la cautelosa fórmula de Darwin (1),
capítulo 14] que mucho más tarde fue apodado el Último Ancestro (Celular) Universal Común
(LUCA) (19).

ENTRE LA SÍNTESIS MODERNA Y LA GENÓMICA EVOLUTIVA

Obviamente, los biólogos evolutivos no permanecieron inactivos durante el período de 40 años


que separó la consolidación de la Síntesis Moderna y la mayoría de edad de la genómica evolutiva;
A continuación, resumiré brevemente lo que parecen ser los avances clave (sin duda, este breve
resumen está incompleto y podría considerarse algo subjetivo).

Evolución molecular y filogenia.

La filogenia tradicional que desató el concepto de TOL de Darwin se basó en comparaciones de las
características diagnósticas de la morfología de los organismos, como, por ejemplo, la estructura
del esqueleto en animales y la arquitectura de las flores en plantas (20). La idea de que el sustrato
molecular real de la evolución que experimenta los cambios a los que se enfrenta la selección
natural (los genes, en pocas palabras) podría compararse con el propósito de las reconstrucciones
de la filogenia no entró en la mente de los biólogos evolutivos por la razón obvia de que (al lado de
) no se sabía nada sobre la naturaleza química de ese sustrato y la forma en que codificaba el
fenotipo de un organismo. Además, el paradigma adaptacionista de la biología evolutiva parecía
implicar que los genes, independientemente de su naturaleza molecular, no se conservarían bien
entre organismos distantes, dadas las principales diferencias fenotípicas entre ellos, como enfatizó
en particular Mayr, uno de los principales arquitectos de la Síntesis Moderna (21).

La idea de que la secuencia de bases de ADN podría emplearse para la reconstrucción evolutiva
parece haber sido expresada por primera vez en forma impresa por Crick, adecuadamente, en el
mismo artículo seminal donde formuló la hipótesis del adaptador (22). Los principios reales y la
primera implementación del análisis evolutivo molecular fueron dados unos años más tarde por
Zuckerkandl y Pauling, quienes falsificaron directamente la conjetura de Mayr al mostrar que las
secuencias de aminoácidos de varias proteínas disponibles en ese momento, como el citocromo c
y las globinas, Muy conservado incluso entre animales distantes (23,24). Zuckerkandl y Pauling
también propusieron el concepto de reloj molecular, una tasa de evolución relativamente
constante de la secuencia que predijeron que sería característica de cada proteína en ausencia de
cambio funcional. En los próximos años, principalmente, a través de los esfuerzos de Dayho y sus
colaboradores, se ha demostrado que la conservación de secuencias de proteínas se extiende a las
formas de vida más diversas, desde bacterias hasta mamíferos (25–27).

La fase inicial de la investigación de la evolución molecular culminó con el trabajo de Woese y


colaboradores que revelaron la conservación de las secuencias de ciertas moléculas, sobre todo, el
ARN ribosomal en todas las formas de vida celular y su idoneidad para el análisis filogenético (28).
El logro de la coronación en esta línea de estudio fue el descubrimiento completamente
inesperado del tercer dominio de la vida, archaea, que incluye organismos previamente agrupados
con bacterias pero que se muestran muy distintos por el análisis filogenético del ARNr (29,30).
Como resultado de estos estudios, se desarrolló una tendencia creciente a equiparar el árbol
filogenético del rRNA, con su estructura de tres dominios (31), con el "TOL" previsto por Darwin y,
en primer lugar, explicado por Haeckel (28,32,33). Sin embargo, incluso en la era pre-genómica,
quedó claro que no todos los árboles de genes codificadores de proteínas tienen la misma
topología que el árbol de ARNr; las causas de las discrepancias permanecieron turbias, pero se
pensó que involucraban la transferencia horizontal de genes (HGT) (34).

La teoría neutral y la selección purificadora.

Podría decirse que el avance conceptual más importante en biología evolutiva después de la
Síntesis Moderna fue la teoría neutral de la evolución molecular que generalmente se asocia con
el nombre de Kimura (35,36) aunque una teoría similar fue desarrollada de forma simultánea e
independiente por Jukes y King (37). ). Originalmente, la teoría neutral se derivó como un
desarrollo de las ideas genéticas de la población de Wright sobre la importancia de la deriva
genética en la evolución. Según la teoría neutral, una mayoría sustancial de las mutaciones que se
fijan en el curso de la evolución son selectivamente neutrales, de modo que la fijación se produce
a través de la deriva aleatoria. Un corolario de esta teoría es que las secuencias de genes
evolucionan aproximadamente en forma de reloj (en apoyo de la hipótesis del reloj molecular
original de Zuckerkandl y Pauling), mientras que las mutaciones bene fi ciosas episódicas sujetas a
selección natural son lo suficientemente raras como para que se las pueda descartar de forma
segura para una descripción cuantitativa del proceso evolutivo. Por supuesto, la teoría neutral no
debe tomarse para significar que la selección no es importante para la evolución. Lo que la teoría
sostiene en realidad es que el modo de selección dominante no es la selección darwiniana positiva
de mutaciones adaptativas, sino la selección estabilizadora o purificadora que elimina las
mutaciones deletéreas mientras permite la fijación de mutaciones neutrales por deriva (17).

Los estudios subsiguientes refinaron la teoría y la hicieron más realista en el sentido de que, para
ser corregidos, una mutación no necesita ser literalmente neutral, sino que solo debe ejercer un
efecto perjudicial que sea lo suficientemente pequeño como para escapar de la eliminación
eficiente mediante la purificación de la selección; La teoría (38). Las mutaciones que se "ven" al
purificar la selección como nocivas críticamente dependen del tamaño de las poblaciones
efectivas: en poblaciones pequeñas, la deriva puede arreglar incluso mutaciones con un efecto
deletéreo significativo (16). La principal prueba empírica de la teoría (casi) neutral proviene de las
mediciones de la constancia de las tasas evolutivas en las familias de genes. Aunque se observó
repetidamente que el reloj molecular está significativamente dispersado en exceso (39,40), tales
pruebas sugieren fuertemente que la fracción de mutaciones neutrales entre las fi jadas es, de
hecho, sustancial (36). La teoría (casi) neutral es una desviación importante del paradigma
seleccionista de Síntesis Moderna, ya que postula explícitamente que la mayoría de las mutaciones
fijadas durante la evolución no se ven afectadas por la selección darwiniana (positiva) (Darwin
parece haber presagiado el paradigma neutralista al señalar que selectivamente los caracteres
neutrales servirían mejor para propósitos de clasificación (1); sin embargo, no dio más detalles
sobre esta idea y no se ha convertido en parte de la Síntesis Moderna).

Es importante destacar que en las elaboraciones posteriores de la teoría neutral, Kimura y otros se
dieron cuenta de que las mutaciones que eran (casi) neutrales en el momento de la fijación no
eran indiferentes a la evolución. Por el contrario, tales mutaciones comprendieron el grupo de
variación que puede ser aprovechado por la selección natural en condiciones cambiadas, un
fenómeno que podría ser potencialmente importante para la macroevolución (17,41).

Genes egoístas, ADN basura y elementos móviles.

Aunque esto rara vez se estableció explícitamente, la genética clásica ciertamente implica que
(casi) todas las partes del genoma (todos los nucleótidos en términos moleculares más modernos)
tienen una función específica. Sin embargo, esta comprensión implícita se puso en duda en los
años 60 y 70 debido a la acumulación de datos sobre la falta de una correspondencia directa entre
la complejidad genómica y fenotípica de los organismos. Se demostró que los organismos de
aproximadamente la misma complejidad fenotípica a menudo tenían genomas que diferían en
tamaño y complejidad en órdenes de magnitud (la llamada paradoja del valor c) (42,43). Esta
paradoja fue resuelta conceptualmente por dos ideas fundamentales relacionadas, las de los
genes del ego y el ADN basura. El concepto del gen del ego fue desarrollado por primera vez por
Dawkins en su libro clásico del mismo nombre (44). Dawkins se dio cuenta, en una sorprendente
desviación del paradigma centrado en el organismo de la Síntesis Moderna, de que la selección
natural podía actuar no solo a nivel del organismo en su conjunto sino también a nivel de un gen
individual. Bajo una formulación algo provocativa de esta visión, el genoma y el organismo son,
simplemente, vehículos para la propagación de genes. Este concepto fue avanzado por Doolittle y
Sapienza (45), y por Orgel y Crick (46), quienes propusieron que gran parte del ADN genómico (al
menos, en organismos complejos) consistía en varias clases de repeticiones que se originan. a
partir de la replicación de elementos del mar (parásitos finales, según Orgel y Crick). En otras
palabras, desde el punto de vista del organismo, gran parte de su ADN genómico debe
considerarse basura. Esta visión del genoma difiere dramáticamente de la imagen implícita en el
paradigma seleccionista según el cual la mayoría, si no todos, los nucleótidos en el genoma se
verían afectados por la selección (purificadora o positiva) que actúa a nivel del organismo. Un
desarrollo importante relacionado conceptualmente fue el descubrimiento, primero en plantas
por McClintock en la década de 1940 (47), y posteriormente, en animales (48), de "genes
saltarines", más tarde conocidos como elementos móviles, es decir, elementos genéticos que eran
propensos. A menudo cambian su posición en el genoma. La demostración de la ubicuidad de los
elementos móviles sugería la imagen de genomas altamente dinámicos, genomas siempre
cambiantes incluso antes del advenimiento de la genómica moderna (49,50).

el potencial para desarrollar una nueva función (un fenómeno que luego se denomina
neofuncionalización). Claramente, la aparición de un nuevo gen como resultado de una
duplicación, y mucho menos la duplicación de una región genómica que incluye múltiples genes o
la duplicación del genoma completo, está lejos de ser cambios "infinitos", y si eventos tan grandes
son realmente importantes para la evolución, El paradigma gradualista entra en peligro.

Spandrels, exaptación, retoques y la deficiencia del paradigma panglossiano de la evolución

Gould y Lewontin montaron una crítica radical del programa adaptacionista de biología evolutiva
en el famoso documento "Spandrels of San Marco" (53). Gould y Lewontin describieron
sarcásticamente a la cosmovisión adaptacionista como el paradigma panglossiano, después del
famoso personaje de la Candide de Voltaire, quien insistió en que "todo fue mejor en el mejor de
los mundos" (incluso los desastres más grandes). Gould y Lewontin enfatizaron que, en lugar de
apresurarse a inventar "justamente" historias de adaptaciones plausibles, los biólogos evolutivos
deberían buscar explicaciones de las características observadas de la organización biológica bajo
un enfoque pluralista que tenga en cuenta no solo la selección sino también las restricciones
intrínsecas, la deriva aleatoria y otros factores. La metáfora de los spandrel sostiene que muchos
elementos funcionalmente importantes de la organización biológica no evolucionaron como
dispositivos específicos para realizar sus funciones actuales, sino que son productos de
restricciones arquitectónicas no adaptativas, como los spandrel que inevitablemente aparecen en
los arcos de las catedrales y otros edificios. Ser empleado para diversas funciones, como la
vivienda elementos clave de las imágenes que adornan la catedral. El proceso de utilización de
spandrels para funciones biológicas recibió el nombre de exaptación especial y fue propuesto por
Gould como una importante ruta de evolución (54).

En un desarrollo aún más temprano, relacionado conceptualmente, Jacob promovió la metáfora


de la evolución como retoques (55). El argumento de Jacob, basado, principalmente, en los
resultados del análisis comparativo de los mecanismos de desarrollo, de que la evolución no actuó
como ingeniero o diseñador, sino más bien como un manipulador que depende en gran medida de
las contingencias previas para resolver problemas pendientes y cuyas acciones, por lo tanto, son
Impredecible e inexplicable sin un conocimiento detallado de la evolución precedente.

La evolución en el mundo de los microbios y virus.

Quizás, el desarrollo en biología que tuvo el efecto más profundo en los cambios en nuestra
comprensión de la evolución fue la extensión de la investigación evolutiva en el ámbito de las
bacterias (y las arqueas) y los virus. El relato de la evolución de Darwin y todos los desarrollos en
biología evolutiva en las siguientes décadas trataron exclusivamente con animales y plantas, con
eucariotas (Protista) y bacterias (Monera) unicelulares colocadas nominalmente cerca de la raíz
del TOL por Haeckel y sus sucesores (56) . Aunque en la década de 1950, el análisis genético de
bacteriófagos y bacterias estaba muy avanzado, lo que hace evidente que estas formas de vida
tenían genomas en evolución (57), la Síntesis Moderna no notó estos desarrollos. Que las bacterias
(y mucho menos los virus) evolucionen bajo los mismos principios y por los mismos mecanismos
que los animales y las plantas, no es de ninguna manera evidente dadas todas sus sorprendentes
diferencias biológicas de organismos multicelulares, y específicamente, porque carecen de la
reproducción sexual regular y el aislamiento reproductivo. Eso es crucial para la especiación en
animales y plantas.

Efectivamente, los procariotas se hicieron "visibles" para los biólogos evolutivos en 1977, con el
innovador trabajo de Woese y sus colegas sobre la filogenia de ARNr que condujo a la
identificación de arqueas y los principales grupos de bacterias (28,29,58). Poco después, el campo
de la genómica comparativa y evolutiva nació a medida que se disponía de múltiples secuencias
genómicas completas de diversos virus pequeños. A pesar de la rápida evolución de la secuencia
que es característica de los virus, esta investigación genómica comparativa temprana tuvo éxito en
la delineación de conjuntos de genes que se conservan en grandes grupos de virus (59–62).
Además, se hizo evidente un principio general: mientras que algunos genes se conservaban a
través de una sorprendente variedad de virus, las arquitecturas genómicas, las estructuras
viriónicas y las características biológicas de los virus mostraban una plasticidad mucho mayor, por
lo que el intercambio de genes, incluso entre virus muy diferentes, surgió como una Factor
importante de la evolución (62).

Endosimbiosis

La hipótesis de que ciertos orgánulos de células eucarióticas, en particular, los cloroplastos de


plantas, evolucionaron a partir de bacterias, no es mucho más joven que el Origen: fue propuesta
por varios investigadores a finales del siglo XIX sobre la base de un estudio microscópico de células
vegetales que reveló Una notable similitud estructural entre cloroplastos y cianobacterias
(entonces conocida como alga azul-verde) y fue presentada de forma coherente por
Mereschkowsky a principios del siglo XX (63). Durante los dos primeros tercios del siglo XX, esta
hipótesis de endosimbiosis siguió siendo una especulación marginal. Sin embargo, esta percepción
cambió poco después de la aparición de la publicación seminal de Sagan (Margulis) en 1967, que
resumió los datos disponibles en ese momento sobre la similitud entre ciertas orgánulos y
bacterias, en particular, el sorprendente descubrimiento de genomas organelares, y llegó a la
conclusión de que No solo los cloroplastos, sino también las mitocondrias evolucionaron a partir
de bacterias endosimbióticas (64). El trabajo posterior, en particular, el análisis filogenético de
ambos genes contenidos en el genoma mitocondrial y los genes que codifican proteínas que
funcionan en la mitocondria y aparentemente se transfirieron de la mitocondria al genoma
nuclear convirtieron la hipótesis de la endosimbiosis en un hecho bien establecido (65). Además,
estos estudios filogenéticos demostraron convincentemente el origen de las mitocondrias de un
grupo particular de bacterias, las a-proteobacterias (66,67). El principal papel evolutivo asignado a
eventos efectivamente únicos como la endosimbiosis es, por supuesto, incompatible con el
gradualismo y el uniformismo.

BIOLOGIA EVOLUTIVA EN LA ERA DE LA GENOMIA

El tesoro de los datos genómicos, metagenómicos y postgenómicos. Se establecieron los principios


fundamentales de la evolución molecular y se hicieron muchas observaciones específicas de gran
importancia e impacto en los fundamentos del neodarwinismo en la era pre-genómica, basada en
el ARNr. La filogenia es el principal caso en cuestión. Sin embargo, el advenimiento de la
secuenciación completa del genoma cambió cualitativamente toda la empresa de la biología
evolutiva. La importancia de cantidades masivas de secuencias para la comparación es obvia
porque este material permite a los investigadores investigar mecanismos y eventos específicos de
evolución con el rigor estadístico necesario y revelar tendencias evolutivas incluso sutiles. Además,
vale la pena enfatizar que las colecciones de diversos genomas completos son enormemente útiles
más allá de la gran cantidad de datos de secuencia. De hecho, solo comparando genomas
completos, es posible desambiguar claramente la relación ortóloga (descendencia común de un
solo gen ancestral) y paráloga (duplicación de genes) entre los genes; para demostrar de manera
convincente la ausencia de un gen en particular en un genoma, y para identificar eventos de
pérdida de genes; para realizar una comparación completa de las organizaciones del genoma y
reconstruir los eventos de reorganización del genoma (68–71). Además, para el máximo beneficio
de la biología evolutiva, es crucial muestrear el espacio del genoma tanto profundamente (es
decir, obtener secuencias genómicas de múltiples representantes estrechamente relacionados del
mismo taxón) y en general (obtener secuencias representativas para tantos taxones diversos como
posible). Los genomas separados por diferentes distancias evolutivas son más adecuados para
diferentes tareas, por ejemplo, para revelar el alcance de la conservación de un gen particular o
para intentar la reconstrucción de eventos evolutivos mayores, se deben comparar genomas
relacionados de manera distante, mientras que para la caracterización cuantitativa del El proceso
de selección afecta a los genomas y es indispensable contar con conjuntos de genomas
estrechamente relacionados (72–75). La colección de genomas completamente secuenciados que
está disponible en el 200 aniversario de Darwin consta de miles de genomas virales, cerca de 1000
genomas de bacterias y arqueas, y cerca de 100 genomas eucariotas (76,77). Aunque,
ciertamente, no todos los taxones importantes están representados adecuadamente, esta
colección en rápido crecimiento satisface cada vez más las demandas de investigación tanto
microevolutiva como macroevolutiva.

Complementario a los avances de la genómica tradicional es la acumulación más reciente de datos


metagenómicos extensos. Aunque la metagenómica generalmente no produce genomas
completos, proporciona información invaluable sobre la diversidad de la vida en diversos entornos
(78,79)

Más allá de la genómica y la metagenómica, uno de los distintivos de la primera década del nuevo
milenio es el progreso de la investigación en genómica funcional y biología de sistemas. Estos
campos ahora producen datos genómicos de alta calidad sobre la expresión de genes,
interacciones genéticas y proteína-proteína, localización de proteínas dentro de las células y más,
abriendo nuevas dimensiones del análisis evolutivo, lo que a veces se llama Biología de Sistemas
Evolutivos (80–82). Este nuevo campo de investigación tiene el potencial de proporcionar
información sobre las conexiones de todo el genoma entre la evolución de la secuencia y otras
variables, como la tasa de expresión, y para iluminar los componentes selectivos y neutros de la
evolución de estos aspectos del funcionamiento del genoma.

A continuación, intento sintetizar brevemente las ideas principales de la genómica evolutiva, con
énfasis en las formas en que estos nuevos hallazgos afectan los principios centrales de la biología
evolutiva, en particular, con respecto a las contribuciones relativas de los procesos aleatorios
selectivos y neutrales.

La conservación evolutiva de secuencias de genes y estructuras frente a la fluidez de la


composición de genes y la arquitectura del genoma

Una observación fundamental apoyada por todo el cuerpo de evidencia acumulada por la
genómica evolutiva es que las secuencias y estructuras de los genes que codifican proteínas y ARN
estructurales están, en general, altamente conservadas a través de vastos tramos evolutivos. Con
la presente colección de genomas secuenciados, se encuentran ortólogos en taxones distantes
para la mayoría sustancial de las proteínas codificadas en cada genoma (83). Por ejemplo, la
secuenciación reciente del genoma de animales primitivos, la anémona de mar y Trichoplax, reveló
una conservación extensa del repertorio genético en comparación con los mamíferos o aves, con
la implicación de que la vida útil característica de un gen animal incluye (al menos) cientos de
millones de años ( 84–86). Los resultados de un extenso análisis comparativo de genomas de
plantas, hongos y procariotas son totalmente compatibles con esta conclusión (87,83). Además,
las reconstrucciones evolutivas profundas sugieren que los antepasados de cientos de genes
existentes ya estaban presentes en LUCA (88-92). Las reconstrucciones conservadoras de los
conjuntos de genes de los ancestros comunes de los dos dominios de procariotas, bacterias y
arqueas, parecen indicar que estas formas ancestrales que, probablemente, existieron hace más
de 3 mil millones de años, eran comparables en complejidad genética, al menos, a la Más simple
de los procariontes de vida libre modernos (88,93). Desde una perspectiva de la biología evolutiva,
parece que las secuencias de muchos genes que codifican las funciones celulares centrales,
especialmente la traducción, la transcripción, la replicación y las vías metabólicas centrales, están
sujetas a una fuerte selección purificadora que se mantuvo durante largos intervalos de tiempo,
en muchas ocasiones, A lo largo de los 3.500 millones de años de historia de la vida celular.

Sorprendentemente, no solo la secuencia y la estructura de las proteínas codificadas, sino también


las características de la arquitectura de los genes que no son necesariamente directamente
relevantes para la función de los genes, se encuentran altamente conservadas a lo largo de largos
períodos de la historia de la vida. En particular, las posiciones de una gran fracción de intrones se
conservan incluso entre los genomas eucariotas ricos en intrones más distantes (25–30% de
conservación en ortólogos de plantas y cordados) (94–96), y la gran mayoría de las posiciones de
intrones. Son compartidos por mamíferos y animales basales, como Trichoplax y la anémona de
mar (84,86).

La sorprendente conservación de las secuencias y estructuras de los genes contrasta la fluidez de


la composición génica de los genomas de todas las formas de vida que se revelan mediante la
genómica comparativa y la reconstrucción evolutiva. Los genes (casi) universales constituyen una
pequeña fracción de todo el universo genético: en conjunto, este núcleo central de la vida celular
consiste, como máximo, en 70 genes, es decir, no más del 10% de los genes, incluso en los más
pequeños. de los genomas de las formas de vida celulares, pero típicamente, más cerca del 1% de
los genes o menos (90,97,98). Aunque en cada genoma individual, la mayoría de los genes
pertenecen a una 'capa' genética moderadamente conservada que se comparte con organismos
relacionados de forma distante, dentro de todo el universo de genes, los genes del núcleo y de la
cubierta (o más precisamente, los conjuntos de genes ortólogos) son una pequeña minoría (83).
Dada esta estructura distintiva del universo de genes, las reconstrucciones evolutivas
inevitablemente producen una imagen dinámica de la evolución del genoma, con numerosos
genes perdidos y muchos otros ganados a través de HGT (principalmente, en procariotas) y
duplicación de genes (ver más abajo).

Incluso en mayor medida que la composición génica de los genomas, la arquitectura del genoma,
es decir, la disposición de los genes en un genoma muestra inestabilidad evolutiva en comparación
con las secuencias genéticas (99). Con la excepción de la organización de pequeños grupos de
genes vinculados funcionalmente en operones que, en algunos casos, son compartidos por
bacterias y arqueas relacionadas de manera distante, en parte, probablemente, debido a la gran
cantidad de HGT (ver más abajo), hay, en general, relativamente poca conservación del orden
genético incluso entre organismos estrechamente relacionados (100,101). En particular, en
procariotas, la conservación a largo plazo del orden de los genes desaparece completamente
incluso en algunos grupos de genomas estrechamente relacionados que conservan una
correspondencia casi uno a uno de genes ortólogos y más del 99% de identidad de secuencia
media entre proteínas ortólogas (75). Así, en

procariotas, la organización de genes más allá del nivel de los operones está determinada, en su
mayoría, por un extenso proceso aleatorio, en particular, a través de inversiones centradas en el
origen de la replicación (75,102,103). Los eucariotas muestran una conservación algo mayor de la
sintenia genómica de largo alcance pero, incluso en este caso, hay pocos elementos compartidos
de la arquitectura del genoma entre, por ejemplo, diferentes filos animales, y ninguno entre los
diferentes reinos (99).

La variabilidad de las arquitecturas genómicas presenta un dilema interesante para los biólogos
evolutivos: ¿los organismos poseen arquitecturas genómicas únicas que están específicamente
adaptadas para satisfacer las demandas funcionales únicas de los organismos respectivos, o es la
evolución de la arquitectura genómica un proceso mayormente neutral? A pesar de que se
observó repetidamente la agrupación local de genes relacionados funcionalmente y otros
patrones sugestivos de coexpresión génica funcionalmente relevantes, estas tendencias son
relativamente débiles y de ninguna manera ubicuas (104,105). Por lo tanto, el factor dominante en
la evolución de la arquitectura del genoma parece ser un cambio aleatorio, no adaptativo en lugar
de una selección purificadora o positiva.

Transferencia horizontal de genes, la red de evolución y la sustitución forestal del TOL.

Incluso mucho antes de la era genómica, los microbiólogos se dieron cuenta de que las bacterias
tenían la capacidad de intercambiar información genética a través de la HGT, en algunos casos,
produciendo resultados de gran importancia, como la resistencia a los antibióticos (106). Se han
dilucidado múltiples mecanismos moleculares de HGT, incluido el intercambio de plásmidos, la
transducción (HGT mediada por bacteriófagos) y la transformación (107). A pesar de estos
descubrimientos, el HGT fue visto generalmente como un fenómeno menor que es importante
solo en circunstancias especiales y, en cualquier caso, no se consideró que pusiera en peligro el
concepto de TOL que podría ser reconstruido por el análisis filogenético del rRNA y otros genes
conservados. Esta creencia fundamental fue cuestionada por los primeros resultados de las
comparaciones genómicas de bacterias y arqueas que indicaron que, al menos, en algunos
genomas procarióticos, una importante fracción de genes se adquirió a través de HGT
demostrable. Las islas de patogenicidad y las islas de simbiosis similares que comprenden más del
30% del genoma en muchas bacterias patógenas y simbióticas son el principal ejemplo (108-110).
Además, el análisis comparativo de los genomas de las bacterias hipertermofílicas y las arqueas
sugirió que incluso el HGT entre dominios puede ser extenso dado hábitats compartidos (111,112).

Puede ser difícil demostrar el HGT de forma inequívoca, y en particular, diferenciarse de la pérdida
extensa de genes, por lo que aún se discute el alcance de la movilidad genética horizontal entre
procariotas (113-115). Sin embargo, a medida que la base de datos genómica crece, los análisis
extensivos comparativos-genómicos y filogenéticos conducen cada vez más a la conclusión de que
el HGT es prácticamente omnipresente en el mundo procariótico en el sentido de que hay muy
pocos conjuntos de genes ortólogos, si es que hay alguno, cuya historia esté libre de HGT (116,117
). La tasa de HGT difiere sustancialmente para diferentes genes dependiendo de las funciones de
los genes, en parte, de acuerdo con la llamada hipótesis de complejidad que postula que podrían
existir barreras para el HGT de genes que codifican subunidades de complejos de proteínas debido
a un desequilibrio de la dosificación y la mezcla de subunidades heterólogas resultantes de Tales
eventos podrían ser perjudiciales (118,119). Sin embargo, los análisis filogenéticos indican que
incluso dichos genes, por ejemplo, los de las proteínas ribosómicas y las subunidades de la ARN
polimerasa, no son inmunes al HGT (120-122).

La alta prevalencia de HGT en procariotas podría, en parte, explicar la persistencia de la


organización de muchos operones en una amplia gama de organismos, bajo la hipótesis del
operón egoísta (123,124). Aunque los operones podrían seleccionarse inicialmente para la
coexpresión beneficiosa y la corregulación de los genes ligados funcionalmente, es probable que
se mantengan y diseminen en el mundo procariótico debido a la mayor probabilidad de fi jación de
un operón después de la HGT, en comparación, p. Ej. a un par de genes no operónicos. Este
escenario presenta un caso notable de una combinación de fuerzas selectivas (corregulación) y
neutrales (HGT) que contribuyen a la evolución de un aspecto importante de la organización del
genoma (76,104).

Los eucariotas son diferentes de los procariotas con respecto al papel desempeñado por HGT en la
evolución del genoma. En los eucariotas multicelulares, donde las células de la línea germinal son
distintas del soma, el HGT parece ser raro (125) aunque no imposible (126). En ciertas
circunstancias especiales, como la persistencia de bacterias endosimbióticas en animales, la
transferencia de grandes segmentos de genomas bacterianos al genoma del huésped es
ciertamente común (127,128). Los eucariotas unicelulares parecen adquirir genes bacterianos e
intercambiar genes entre ellos en ocasiones relativamente frecuentes (129-131). Mucho más
crucial, sin embargo, es la principal contribución de los genomas de los endosimbiontes a los
complementos genéticos de todos los eucariotas. El descubrimiento de orgánulos similares a las
mitocondrias y genes de origen mitocondrial aparente en todos los eucariotas unicelulares bien
caracterizados, esencialmente, establece que el último ancestro común de los eucariotas
existentes ya poseía el endosimbionte mitocondrial (132,133). En términos de su aparente
afinidad filogenética, los genes eucarióticos que poseen ortólogos procarióticos fácilmente
identificables se dividen marcadamente en genes de probable origen arqueal (principalmente,
pero no exclusivamente, componentes de sistemas de procesamiento de información) y aquellos
de probable origen bacteriano (en su mayoría, enzima metabólica y componentes de diversas
estructuras celulares) (134,135). A menudo se asume que, en general, la mayoría de los genes
"bacterianos" ancestrales en los eucariotas son de origen mitocondrial, pero esto es difícil de
demostrar directamente porque, en el análisis filogenético, estos genes se agrupan con diversos
grupos de bacterias (134). Estos hallazgos son difíciles de interpretar porque la composición génica
del endosimbionte y su huésped no se conocen, y es posible que uno o ambos hayan acumulado
numerosos genes de diversas fuentes (136). Un punto de incertidumbre aún mayor es el escenario
real del origen de los eucariotas [una discusión detallada de este tema principal está fuera del
alcance de este artículo; consulte revisiones y discusiones recientes (133,137–140)]. En pocas
palabras, las hipótesis competitivas y debatidas son las siguientes:

(i) El escenario simbiogenético según el cual el antecesor a-proteobacterial de las mitocondrias


invadió
un huésped arqueal, y este evento desencadena la eucariogénesis, incluida la formación de las
características estructurales distintivas de la célula eucariota, como el sistema endomembrana, el
citoesqueleto y el núcleo (138,141).

(ii) El escenario de Archezoan en el que el huésped del endosimbionte mitocondrial era un


eucariota primitivo que ya poseía todas las características principales de la célula eucariota que
evolucionó sin ninguna relación con la endosimbiosis, pero facilitó esta última a través de la
capacidad fagocítica del protoacariota (137,142). .

Independientemente del papel exacto desempeñado por la endosimbiosis en la eucariogénesis, no


hay dudas razonables de que el complemento genético de los eucariotas sea una quimera
compuesta por genes funcionalmente distintos de descendientes de arqueas y bacterias (134,143).
Además, la endosimbiosis aparentemente hizo contribuciones sustanciales a los complementos
genéticos de algunos de los principales grupos individuales de eucariotas. Por lo tanto, se
presentaron pruebas sólidas de HGT masivo de miles de genes desde un endosimbionte cibina
bacteriano (el cloroplasto) hasta los genomas del huésped (planta) (144). De manera similar, se
detectaron genes de origen algal aparente en los cromalveolatos que engullían un alga roja en un
acto de endosimbiosis secundaria (145)

Las observaciones de HGT extensas, ubicuas y que se producen a través de múltiples rutas
descritas anteriormente conducen a una generalización fundamental: los genomas de todas las
formas de vida son colecciones de genes con diversas historias evolutivas. El corolario de esta
generalización es que el concepto TOL debe revisarse o abandonarse sustancialmente debido a
que una sola topología de árbol o incluso topologías congruentes de árboles para varios genes
altamente conservados no pueden representar la historia de todos o incluso la mayoría de los
genes (146–149). ). Por lo tanto, una representación adecuada de la historia de la vida es una red
de intercambios genéticos en lugar de un solo árbol, y en consecuencia, la hipótesis TOL "fuerte",
es decir, la existencia de un "árbol de especies" para toda la historia de la vida celular, se falsifica.
Por los resultados de la genómica comparativa.

Ciertamente, esta conclusión no debe tomarse como una indicación de que el concepto de árbol
evolutivo introducido por Darwin (1) debe abandonarse por completo. Primero, los árboles tienen
el potencial de representar con precisión la evolución de familias de genes individuales. En
segundo lugar, existen, sin lugar a dudas, partes expansivas de la historia de la vida para las cuales
se pueden obtener árboles congruentes para grandes conjuntos de genes ortólogos y, por
consiguiente, la topología de consenso de estos árboles se califica como un árbol de especies. La
evolución de los principales grupos de eucariotas, como los animales o las plantas, es el caso más
obvio, pero la evolución similar a un árbol parece aplicarse también a muchos grupos de
procariotas a profundidades filogenéticas relativamente poco profundas. La pregunta sigue abierta
si la evolución de la vida en su totalidad se describe mejor como:

(i) un árbol de consenso de genes altamente conservados que representa una "tendencia central"
en la evolución, con eventos de HGT, incluidos los masivos asociados con la endosimbiosis, que
comprenden conexiones horizontales entre las ramas de los árboles [Figura 1A; (150)], o
(ii) una red compleja donde las fases de la evolución similar a un árbol (con conexiones
horizontales) se entremezclan con las fases del "Big Bang" de un intercambio horizontal rampante
de información genética que no puede representarse en principio como árboles [Figura 1B; (151)].

Metagenómica, el mundo en expansión de replicones egoístas y fusión de replicones.

La metagenómica es una nueva dirección importante de la investigación genómica que persigue


(en general, en esta etapa, la secuenciación) de los genomas de todas las formas de vida que
prosperan en un determinado hábitat. Aunque es un campo joven, la metagenómica ya puede
afirmar avances importantes en la caracterización de la diversidad bacteriana de una variedad de
hábitats, en particular, los de los océanos (152-154). La dirección que me gustaría enfatizar como
de particular importancia conceptual para la biología evolutiva es la metagenómica de los virus
(155). La sorprendente conclusión de varios estudios metagenómicos virales es que, al menos, en
algunos, particularmente, los hábitats marinos, los virus (bacteriófagos) son las entidades
biológicas más abundantes, con el número de partículas virales que exceden en un orden de
magnitud el número de células ( 156,157). Aunque los genomas virales son pequeños en
comparación con los genomas de formas de vida celulares, estos resultados metagenómicos
indican que los genomas virales constituyen una parte importante del universo genético que, al
menos, es comparable en tamaño con la parte que toman los genomas de los organismos
celulares. Además, dado que, en los virus con genomas grandes, una fracción sustancial de los
genes no tiene homólogos detectables en las bases de datos de secuencias actuales (158-160),
parece más probable que los virus abarquen la mayor parte de la diversidad genética en este
planeta. Estos hallazgos resuenan con la alta prevalencia de varias clases de elementos móviles
dentro de los genomas de muchos organismos celulares. De hecho, en los genomas de mamíferos,
las secuencias derivadas de elementos móviles, principalmente, los retrotransposones (SINE y
LINE) parecen constituir, al menos, el 40% del ADN genómico (161).

Los virus y varios otros replicones automáticos (definidos como elementos genéticos que no
codifican un sistema de traducción completo), como diversos plásmidos y transposones,
comprenden un grupo genético interconectado que se conoce de forma diversa como el
mobilome, la virosfera o el mundo de los virus (76,162– 164). La identidad del mundo de los virus
se manifiesta en la existencia de un conjunto de "genes distintivos" que codifican proteínas con
funciones clave en la reproducción de los elementos del ego (incluidas las proteínas de la cápside
viral) y están presentes en elementos extremadamente diversos que se propagan en una amplia
variedad de hospedadores, pero no en formas de vida celulares. La existencia de un conjunto
distinto de genes distintivos que incluye, entre otros, ARN y ADN polimerasa dependientes de
ARN, enzimas de replicación que, probablemente, son anteriores al genoma de ADN grande,
sugiere fuertemente que el mundo del virus coexiste con formas de vida celular a lo largo de su
historia, y posiblemente, incluso se origina a partir de un conjunto primordial, precelular de
elementos genéticos (164).

Aunque distinto, el mundo viral interactúa constantemente con el grupo genómico de formas de
vida celular, como lo demuestra el movimiento constante de genes entre bacteriófagos
transductores, plásmidos y cromosomas bacterianos (83), o la captura de genes celulares
(protooncogenes) por retrovirus animales ( 165). Las observaciones recientes de la transferencia
de genes mediada por bacteriófagos entre bacterias relacionadas distantes, incluso sin la
propagación de fagos en el organismo receptor, sugieren que el flujo de genes mediado por
replicones egoístas podría ser más extenso de lo que se sospecha hasta ahora (166). Es importante
destacar que las partes de los elementos móviles con frecuencia son reclutadas (eliminadas) por
los genes hospedadores como elementos reguladores (167,168) y, en algunos casos, partes de
secuencias de codificación de proteínas (169). Los casos individuales de exaptación de genes
completos de elementos móviles también se conocen como ejemplificados sorprendentemente
por la evolución del gen hedgehog, un regulador clave del desarrollo animal, a partir de una
inteína (170,171).

Todos los genomas procariotas, sin excepción, contienen trazas de integración de múltiples
plásmidos y fagos. Incluso de manera más reveladora, los genomas arqueales suelen tener varias
versiones de un operón que codifica componentes clave de la maquinaria de partición de
plásmidos y, a menudo, poseen más de un origen de replicación (172). Por lo tanto, la fusión de
distintos replicones parece ocurrir rutinariamente en procariotas, y en el transcurso de la
evolución, dicha fusión podría haber sido un factor importante en la configuración de la
arquitectura observada de los cromosomas procarióticos (83,173).

En resumen, la genómica comparativa y la metagenómica revelan un vasto mundo dinámico e


interconectado de replicantes marinos que interactúa con los genomas de las formas de vida
celulares y, a lo largo de largos períodos de evolución, hace importantes contribuciones a la
composición de los cromosomas. En procariotas, la interacción entre los cromosomas bacterianos
y arqueales y los replicones de peces es muy intensa, y la distinción entre cromosomas y
megaplasmids se difumina hasta tal punto que los cromosomas son, probablemente, mejor vistos
como "islas" de estabilidad relativa en el mar turbulento. 'de elementos móviles (83). En los
eucariotas, especialmente, en formas multicelulares que evolucionaron la separación entre la línea
germinal y el soma, la distinción entre los cromosomas y los replicones de peces es más nítida. Sin
embargo, la movilidad intragenómica de los elementos transponibles por el mar es extensa, y la
movilidad intergenómica, al menos, dentro de una especie, en realidad está facilitada por el sexo,
con ráfagas de propagación de elementos transponibles que probablemente marcan transiciones
evolutivas (16). El papel central de los elementos móviles en la evolución del genoma socava aún
más el concepto TOL, aunque los árboles filogenéticos de genes distintivos individuales pueden ser
altamente informativos para la reconstrucción de la evolución de los propios elementos del ego
(174,175).

La naturaleza del Último Ancestro Común Universal y las primeras transiciones evolutivas La
genómica comparativa reivindica la conjetura de Darwin sobre el origen de todas las formas de
vida existentes de un único antepasado común. De hecho, las reconstrucciones evolutivas sugieren
que cientos de genes conservados, muy probablemente, se remontan a LUCA (88,89–91). Más
específicamente, estas reconstrucciones indican que LUCA ya poseía un sistema completo de
traducción que no era dramáticamente diferente de (al menos) las versiones más simples de la
maquinaria de traducción moderna (es decir, que consistía de aproximadamente 100 moléculas de
ARN y proteínas) como el sistema de transcripción central y varias vías metabólicas centrales,
como las de la biosíntesis de nucleótidos de purina y pirimidina (90). Sin embargo, los conjuntos de
genes asignados a LUCA en estas reconstrucciones carecen de ciertos componentes esenciales de
la maquinaria celular moderna. En particular, los componentes centrales de la maquinaria de
replicación del ADN son no homólogos (o, al menos, no ortólogos) en bacterias, por un lado, y en
arqueas y eucariotas, por otro lado (176). En otra brecha aguda, los lípidos de la membrana tienen
estructuras distintas y, por consiguiente, las enzimas de biogénesis de la membrana no son
homólogas (no ortólogas) (177).

Estos vacíos principales en el conjunto de genes reconstruidos de LUCA apoyan la idea de que
diferentes sistemas celulares "cristalizaron" de forma asíncrona y sugieren "transiciones de fase"
en las fases iniciales de la evolución celular (151,178). Una clase de hipótesis sostiene que LUCA
era radicalmente diferente de las células modernas, posiblemente, no una célula en absoluto, sino
más bien un conjunto de elementos genéticos que empleaban diversas estrategias de replicación y
expresión, y podrían haber poblado compartimentos inorgánicos como los que se ven en los
respiraderos hidrotermales ( 179,180). Bajo estos escenarios, los sistemas y las membranas de
replicación de ADN de tipo moderno evolucionaron al menos dos veces de manera independiente
en dos dominios de la vida (suponiendo un origen simbiogenético para los eucariotas). En este
caso, el concepto mismo de un LUCA distinto se vuelve ambiguo, y podría ser más apropiado
hablar de LUCAS, el último estado ancestral común universal (181). La clase alternativa de
escenarios postula que LUCA era una célula de tipo moderno con las variedades arqueas o
bacterianas de los sistemas de replicación de ADN y las membranas, o incluso los sistemas mixtos
(177,182). Esta clase de escenarios implica que hubo cambios de un tipo a otro en la evolución de
cada uno de estos sistemas celulares clave o pérdida diferencial de los genes respectivos.

Independientemente de cuál sea el escenario preferido, la falta de conservación de los sistemas


celulares centrales entre los dominios de la vida indica que las primeras etapas de la evolución
celular implicaron cambios radicales que apenas son compatibles con el uniformismo.

Cuantificación de la selección y del ADN basura en todo el genoma: regímenes evolutivos distintos
para genomas diferentes

Hay diferencias importantes en los diseños del genoma entre diferentes líneas de evolución de la
vida. Los procariotas y, especialmente, los virus tienen genomas 'de pared a pared' que consisten,
principalmente, de genes que codifican proteínas y ARN estructurales, con regiones no
codificantes que comprenden, con algunas excepciones, no más del 10-15% de los genómicos
ADN. Los genomas de eucariotas unicelulares tienen densidades de genes características más
bajas pero, en general, no se alejan demasiado de los principios procarióticos, con la mayor parte
del ADN dedicado a la codificación de proteínas, a pesar de la arquitectura distinta del gen intrón-
exón. Los genomas de los eucariotas multicelulares son drásticamente diferentes, ya que solo una
minoría (una pequeña minoría en los vertebrados) del ADN genómico está compuesta por
secuencias que codifican proteínas o ARN estructurales. En general, en toda la gama de formas de
vida, existe una notable dependencia exponencial negativa entre la densidad de los genes
codificadores de proteínas y el tamaño del genoma, aunque también se observan desviaciones
significativas de esta dependencia general, particularmente en procariotas (Figura 2).

Esta dramática diferencia en la organización del genoma entre los genomas de (la mayoría) de los
organismos unicelulares y multicelulares exige una explicación, y la más simple y plausible está
dada por la teoría de la población genética, según la cual la intensidad de la selección purificadora
que afecta a una población es proporcional a la población. Tamaño efectivo de la población. La
fijación de secuencias no codificantes, como intrones o elementos móviles es, en el mejor de los
casos, neutral pero, más probablemente, al menos, algo perjudicial, aunque solo sea por la carga
adicional sobre la maquinaria de replicación. Por lo tanto, la acumulación extensa de tales
secuencias es posible solo en poblaciones relativamente pequeñas en las que la intensidad de la
selección purificadora cae por debajo del "umbral de complejificación". Más específicamente, la
teoría predice que todas las mutaciones con coeficiente (s) de selección menos de 10–6 se
acumularían como neutrales en genomas de eucariotas multicelulares, y muchos casos de
inserción de secuencias no codificantes se asocian con valores tan bajos (16,183,184) .

Teniendo en cuenta el estudio a escala del genoma de la evolución, la siguiente serie de preguntas
importantes tiene que ver con la distribución de los coeficientes de selección entre genomas: la
cantidad de ADN no codificante es realmente basura, ¿cuál es la presión de la selección
purificadora en diferentes genes, ¿Y cuán común es realmente la selección positiva (darwiniana)?
Aunque la medición de la selección de genes individuales, y mucho menos los sitios individuales,
especialmente en regiones no codificantes es técnicamente difícil (185,186), se han informado
varios análisis de todo el genoma. Un análisis exhaustivo del conjunto de proteínas humanas que
combinó datos sobre mutaciones patógenas, SNP no sinónimos y divergencia en ortólogos de
chimpancé humanos llevó a la estimación de que solo el 12% de los residuos de aminoácidos están
asociados con s <10–5, mientras que aproximadamente la mitad de los sitios tienen valores entre
10–4 y 10–2 (187). Por lo tanto, la mayoría de las secuencias de proteínas parecen estar sujetas a
una selección purificadora sustancial. Un estudio complementario sobre los regímenes de
evolución de múltiples grupos de bacterias y arqueas estrechamente relacionadas también reveló
una selección purificadora típicamente fuerte, con las medias genómicas amplias de las relaciones
dN / dS (la proporción de tasas de sustitución de nucleótidos no sinónimos a sinónimos, que es la
tradicional medida de selección en secuencias codificantes de proteínas) entre 0.02 y 0.2 (dN / dS
<< 1 es la firma de selección purificadora) (75).

Una búsqueda en todo el genoma de selección positiva (medida como la relación dN / dS gen-
específica) en genes codificantes de proteínas de seis especies de mamíferos reveló 400 genes
(2,5%) que parecen haber experimentado una selección positiva en al menos una rama de la
filogenética árbol de las especies analizadas; los valores para la mayoría de las ramas individuales
eran muy pequeños (188). Estas estimaciones, aunque conservadoras, muestran que, al menos, en
los mamíferos, la selección positiva que afecta a la secuencia génica completa es bastante rara,
aunque muchos genes que, en general, están sujetos a una selección purificadora probablemente
incluyan sitios seleccionados positivamente. Los análisis exhaustivos de los sitios de codificación
de aminoácidos en 12 genomas de Drosophila arrojaron resultados muy diferentes, lo que sugiere
que una fracción sustancial y, quizás, la mayoría de los reemplazos de aminoácidos se deben a la
selección positiva, aunque los efectos beneficiosos de la mayoría de estos reemplazos parecen ser
Bastante pequeño (189,190). En particular, la distribución de sitios seleccionados positivamente
no es aleatoria entre las categorías funcionales de genes, ya que los genes involucrados en la
inmunidad y otras funciones de defensa, la reproducción y la percepción sensorial son
particularmente susceptibles de selección positiva; esta distribución parecía ser estable entre
animales muy diferentes, incluyendo mamíferos, moscas y nematodos (188,189,191).

Una pregunta candente en los estudios evolutivos de todo el genoma, especialmente, para los
mamíferos con sus genomas enormes, qué fracción del ADN no codificante es basura "real" y
cuánto está sujeta a restricciones funcionales aún desconocidas. La posibilidad de que, a pesar de
la falta de conservación evolutiva detectable, una gran fracción si no la mayoría del ADN humano
es, de hecho, funcionalmente importante y, por lo tanto, mantenida por selección a menudo se
discute, especialmente, a la luz de las demostraciones de que un gran número de Se transcribe la
fracción del genoma (192–194). El descubrimiento de las llamadas secuencias ultraconservadas
que parecen estar sujetas a una selección purificadora excepcionalmente fuerte (195,196) es
compatible con esta idea. Además, una fracción considerable del ADN "basura" podría estar
involucrada en roles funcionales que conllevan solo una conservación limitada de la secuencia,
pero sin embargo son importantes, en particular, para el mantenimiento y remodelación de la
estructura de la cromatina, como las regiones de unión de la matriz / sca ff old (SARs / MARs) (
197,198). Sin embargo, un análisis reciente de todo el genoma de la distribución de la inserción y
las deleciones (en comparaciones de genomas humanos, de ratón y de perro) sugiere que solo el
3% del ADN de eucromatina humana está bajo restricciones selectivas (199). Dado que las
secuencias de codificación proteica comprenden solo el 1.2% de la eucromatina, estos resultados
indican que la mayoría de las secuencias de ADN funcionalmente importantes en los mamíferos no
codifican proteínas, sino que también reivindican las conjeturas iniciales de que la mayor parte del
genoma humano no es funcional, es decir, Después de todo, basura (45,46). Por supuesto, debe
tenerse en cuenta que cualquier definición de basura está condicionada a que la basura de ayer se
pueda reclutar para un papel funcional. En contraste, las comparaciones entre especies de
regiones genómicas no codificantes en Drosophila indican que la mayoría (70% o más de los
nucleótidos) de estas secuencias evolucionan bajo restricciones selectivas, y una fracción
significativa (hasta el 20%) parece ser afectada por aspectos positivos. selección (200–202).
Ciertamente, estos estudios se basan en diferentes supuestos simplificadores (que no pueden
discutirse aquí en detalle), por lo que la conclusión sobre diferencias importantes en regímenes
selectivos entre diferentes linajes debe evaluarse con cautela y está sujeta a validación adicional.
Sin embargo, el hecho mismo de que los organismos con tamaños comparables de los conjuntos
de genes y los niveles de complejidad organizativa, como los insectos, por un lado, y los
mamíferos, por otro lado, difiere tan dramáticamente en términos de densidad de genes y la
cantidad de la "basura" genómica aparente (Figura 2) sugiere que sus genomas evolucionan bajo
diferentes presiones selectivas.

El estudio de la interacción entre procesos neutrales, selección purificadora y selección positiva


aún se encuentra en sus primeras etapas. La colección de conjuntos de genomas estrechamente
relacionados de diversos taxones que es esencial para este análisis es actualmente pequeña,
aunque está creciendo rápidamente, y los métodos para discriminar diferentes modos de
evolución aún están en desarrollo activo. Sin embargo, incluso los resultados ya disponibles dejan
bastante claro que las contribuciones de cada uno de estos factores son muy variables entre los
organismos, según el tamaño efectivo de la población, las tasas características de mutación y
recombinación y, probablemente, otros factores que aún no se han dilucidado.

La duplicación de genes y genomas: la ruta principal de la innovación genómica.

El análisis de los numerosos genomas secuenciados reivindicó la visión de Ohno de la duplicación


de genes como un importante mecanismo evolutivo (51), tal vez, incluso en mayor medida de lo
que el autor del concepto podría anticipar. La mayoría de los genes en la mayoría de los genomas
de formas de vida celular (excepto los genomas más pequeños de parásitos obligados) poseen
parálogos indicativos de duplicación en algún momento durante la evolución (16,69), y muchos
genes pertenecen a grandes familias de parálogos que forman un distribución de ley de poder
característica del número de miembros [(203,204); ver discusión abajo]. Con respecto a la
contribución de la duplicación al origen de los nuevos genes, es importante señalar que hay poca
evidencia convincente de la aparición de novo de genes de secuencias no codificantes; aunque los
genes pueden expandirse reclutando pequeños segmentos adyacentes de secuencia no
codificante [por ejemplo, desde un intrón (205), el nacimiento de un nuevo gen completo a través
de esta ruta parece ser un evento excepcional (206)]. Por lo tanto, es tentador generalizar que la
duplicación de genes no solo es importante, sino que es la ruta dominante que conduce al origen
de los nuevos genes, con la importante adición de que la duplicación suele ir seguida de una
evolución acelerada de la secuencia, así como de la reorganización de un gen. Modo evolutivo que
borra las conexiones detectables a la fuente original.

La idea de Ohno sobre la eliminación o la relajación de la selección después de una duplicación de


genes, que permite una evolución acelerada que tiene el potencial de producir una novedad
funcional, también fue respaldada por datos genómicos comparativos, aunque con un giro
significativo. Se argumentó teóricamente y luego se demostró mediante la medición empírica de la
presión de selección en secuencias genéticas recientemente duplicadas que la relajación de la
selección purificadora era más probable que fuera simétrica, para afectar a ambos duplicados más
o menos por igual (207,208). Por lo tanto, la ruta más común de evolución de los genes duplicados
podría no ser la neofuncionalización postulada por Ohno, sino la subfuncionalización mediante la
cual los nuevos parálogos conservan distintos subconjuntos de las funciones originales del gen
ancestral, mientras que el resto de las funciones se deterioran diferencialmente (209,210). Los
análisis más sofisticados parecen sugerir que ambos regímenes de evolución podrían darse cuenta
en diferentes etapas de la historia de los genes parálogos, con una rápida subfuncionalización
inmediatamente después de la duplicación seguida por una posterior neofuncionalización más
lenta (211–213).

La duplicación de genes se produce a lo largo de la evolución de cualquier linaje, pero la tasa de


duplicación no es uniforme en grandes escalas evolutivas, por lo que las transiciones organizativas
en la evolución parecen ir acompañadas de ráfagas de duplicación de genes, posiblemente,
habilitadas por una selección purificadora débil durante los cuellos de botella de la población (ver
abajo). Quizás, el ejemplo más ilustrativo en este punto es el surgimiento de eucariotas que fue
acompañado por una ola de duplicación masiva, produciendo la característica de relación co-
ortóloga muchos a uno entre los genes eucarióticos y sus ancestros procarióticos (214). De manera
similar, se cree que la duplicación diferencial de los grupos de genes Hox y otros reguladores del
desarrollo han jugado un papel fundamental en la diferenciación de los filos animales (215,216).
Podría decirse que los casos más dramáticos de duplicación de genes "saltatorios" involucran
eventos de duplicación de genoma completo (WGD, por sus siglas en inglés) (217). Siguiendo la
hipótesis original de Ohno, el análisis del genoma reveló rastros de eventos WGD independientes
retenidos en la distribución de tamaños de las familias de genes parálogos y / o las posiciones
genómicas de las regiones parálogas, a pesar de la extensa pérdida de genes después de la WGD,
en levaduras (218,219), cordones ( 220–223) y plantas (224,225). Mecánicamente, la alta
prevalencia de WGD en los eucariotas podría no ser particularmente sorprendente porque resulta
de un fenómeno genético bien conocido y extendido, la poliploidización. Sin embargo, las
consecuencias evolutivas de la WGD parecen ser trascendentales, ya que estos eventos crean la
posibilidad de una sub / neofuncionalización rápida simultáneamente en todo el complemento
genético de un organismo (226). En particular, se piensa que WGD ha jugado un papel central en la
radiación primaria de cordados (220). Es difícil descartar la posibilidad de que los eventos más
antiguos de WGD ya no sean detectables fácilmente debido a las numerosas pérdidas de genes
que ocultan la señal de WGD; en particular, el estallido de duplicaciones que siguió a la
eucariogénesis, pero es anterior al último ancestro común de los eucariotas existentes, podría
haber sido provocado por la primera WGD en la evolución eucariótica (214).

Teniendo en cuenta la amplia aparición de WGD en múltiples linajes eucariotas, es notable que
hasta el momento no se hayan detectado tales eventos mediante el análisis de los numerosos
genomas procarióticos disponibles, aunque se observó repetidamente poliploidía transitoria
(227,228). Posiblemente, la ausencia de WGD detectable en procariotas se debe a la selección
purificadora eficiente que actúa en una gran población procariótica (ver más abajo) y conduce a la
eliminación rápida de genes duplicados que borrarán los rastros de WGD en caso de que ocurra tal
evento.

En el nivel de los conceptos generales de la biología evolutiva que me concierne principalmente


aquí, los estudios genómicos sobre la duplicación de genes llevan a, al menos, dos
generalizaciones sustanciales. En primer lugar, la demostración del significado evolutivo primario
de las duplicaciones, incluidas las duplicaciones de grandes regiones genómicas y genomas
completos, es una sentencia virtual de muerte para el gradualismo darwiniano: incluso una
duplicación de un solo gen apenas califica como una variación infinitamente infinita, mientras que
la DGE califica como un evento bonafina. . En segundo lugar, la primacía de la duplicación de genes
con la subsiguiente (a veces, rápida) diversificación de los parálogos como la ruta del nuevo origen
genético refuerza la metáfora de la evolución como un retorcedor: la evolución claramente tiende
a generar nuevos dispositivos funcionales al jugar con los anteriores. Hacer una copia de seguridad
en lugar de crear una novedad desde cero.

Aparición y evolución de la complejidad genómica: el paradigma no selectivo y la falacia del


progreso evolutivo

Sin lugar a dudas, los eucariotas multicelulares, como los animales y las plantas, se caracterizan
por una complejidad organizacional mucho mayor que las formas de vida unicelulares, y en el
espíritu de la Síntesis Moderna, esta complejidad se ve generalmente como resultado de
numerosos cambios adaptativos impulsados por la selección natural. y, al ser considerado así,
puede verse como una manifestación del "progreso" en la evolución. La correspondencia entre la
complejidad organizativa y la complejidad genómica es un tema abierto, en parte, porque la
complejidad genómica no es fácil de definir. Una definición simple y plausible puede ser el número
de nucleótidos que transportan información funcionalmente relevante, es decir, están ectados por
selección (229,230). Bajo esta definición, los genomas de los eucariotas multicelulares, por
supuesto, son mucho más complejos que los genomas de formas unicelulares, y esta mayor
complejidad genómica se traduce también en complejidad funcional.

Un ejemplo sorprendente es el empalme alternativo que es un dispositivo funcional crucial en


organismos complejos como los mamíferos, donde crea varias veces más proteínas que genes
codificantes de proteínas (231–233) (por lo tanto, el hecho de que los humanos tienen 20000
genes comparados). a 10000 genes en la bacteria Myxococcus xanthus no debe traducirse a la
afirmación de que "el proteoma humano es dos veces más complejo que el de una bacteria": la
diferencia real es mayor debido a un empalme alternativo). El empalme alternativo es posible
gracias a señales de empalme débiles que son procesadas o omitidas por el spliceosome con
frecuencias comparables (234). En cierto sentido, los eventos de empalme alternativo
funcionalmente importantes se codifican en estas uniones de empalme y, en cierta medida,
también en secuencias intrónicas adicionales. Sin embargo, ¿el empalme alternativo evolucionó
como una adaptación funcional? Con toda probabilidad, no.

De hecho, se demostró que los genomas ricos en intrones típicamente poseen señales de
empalme débiles, mientras que los genomas pobres en intrones (en su mayoría, los de eucariotas
unicelulares) tienen uniones de empalme estrechas, probablemente, lo que garantiza una alta
fidelidad de empalme (235). Recientes estudios detallados demostraron una baja fidelidad al
empalme en los organismos ricos en intrones, de modo que se producen numerosas variantes mal
empalmadas y, en su mayoría, se destruyen por el sistema de decaimiento mediado sin sentido
(NMD) (236). Las reconstrucciones evolutivas sugieren fuertemente que los eucariotas antiguos,
incluido el último ancestro común de las formas existentes, poseían altas densidades de intrones
comparables a las de los genomas modernos más intrínsecos, como los vertebrados (237–239) y,
por inferencia, tenían señales de empalme débiles que producían numerosas transcripciones
alternativas (235). La conservación de la maquinaria NMD en todos los eucariotas (240) es
totalmente compatible con esta hipótesis. Por lo tanto, parece que el empalme alternativo surgió
como un "defecto genómico" del cual los organismos respectivos no pudieron deshacerse,
presumiblemente, debido a una selección purificadora débil, y desarrollaron un mecanismo
especial para enfrentarlo, a saber, la NMD. Poco a poco, también desarrollaron formas de utilizar
este spandrel para múltiples funciones.

La explicación anterior del origen del empalme alternativo podría resumir la teoría genética
poblacional no evolucionista de la evolución de la complejidad genómica que fue recientemente
expuesta por Lynch (16,183,184). Como ya se mencionó en la sección anterior, el principio central
de la teoría es que los cambios genéticos que conducen a un aumento de la complejidad, como las
duplicaciones de genes o las inserciones de intrones, son ligeramente perjudiciales y, por lo tanto,
se pueden corregir a una velocidad apreciable solo cuando se purifica la selección. En una
población es débil. Por lo tanto, dado que la fuerza de la selección purificadora es proporcional al
tamaño efectivo de la población, solo es posible un aumento sustancial de la complejidad
genómica durante los cuellos de botella de la población. Bajo este concepto, la complejidad
genómica no es, originalmente, adaptativa, sino que es provocada por procesos evolutivos neutros
cuando la selección purificadora no es efectiva. En otras palabras, la complejificación comienza
como un "síndrome genómico", aunque las características complejas (spandrels) posteriormente
se cooptan para varias funciones y quedan sujetas a selección. Por el contrario, en poblaciones
altamente exitosas, como las de muchos procariotas, la selección purificadora es tan intensa que
no es posible aumentar la complejidad genómica y, de hecho, la contracción del genoma es más
probable.

Por supuesto, hay excepciones a estos principios, como los genomas bacterianos con más de
12000 genes (241), los genomas virales con proliferación extensa de genes duplicados (158) y los
genomas de eucariotas unicelulares [p. Ej. Chlamydomonas (242) o Trichomonas (243)] que, según
la mayoría de los criterios, son tan complejos como los genomas de animales o plantas
multicelulares. Además, algunos genomas procarióticos [por ejemplo, el crenarchaeon Sulfolobus
solfataricus (244)] y los genomas de eucariotas unicelulares [p. ej. Trichomonas vaginalis (243)] se
encuentra entre las personas con mayor contenido de elementos transponibles. Aparentemente,
el resultado de la evolución del genoma depende del equilibrio entre la presión de la selección
purificadora, el mismo dependiente del tamaño de la población y la tasa de mutación, la
intensidad de los procesos de recombinación, la actividad de los elementos del ego y la adaptación
a hábitats específicos (99). Un atractivo

La hipótesis es que, al menos, en procariotas, el límite superior para el número de genes en un


genoma, un buen proxy para la complejidad genómica, está determinado por la "sobrecarga
regulatoria (burocrática)" (83,245,246). La existencia de tal sobrecarga está implícita en la
observación notable de que diferentes clases funcionales de genes se escalan de manera diferente
con respecto al número total de genes en un genoma, y en particular, los genes reguladores (como
los represores y activadores de la transcripción) muestran una ) escala cuadrática
(83,245,247,248). Posiblemente, en cierta proporción entre el número de reguladores y el número
de genes regulados, quizás, cerca de 1: 1, la carga de los reguladores se vuelva insostenible. Por lo
tanto, la evolución de la complejidad del genoma, sin duda, depende de una combinación
compleja de procesos estocásticos (neutrales) y adaptativos. Sin embargo, parece que, en la
actualidad, la hipótesis nula más consistente y simple de la evolución genómica es que la
expansión del genoma, un requisito previo para la complejificación, no es un resultado de la
adaptación, sino más bien una consecuencia de una selección purificadora débil.

La siguiente gran pregunta que se debe hacer con respecto a la complejidad, tanto organizativa
como genómica, es: ¿hubo una tendencia constante hacia el aumento de la complejidad durante
los 3.500 millones de años de evolución de la vida en la Tierra? La respuesta más probable es, no.
Incluso las reconstrucciones muy conservadoras de genomas ancestrales de arqueas y bacterias
indican que estos genomas eran comparables en tamaño y complejidad a los de formas modernas
relativamente simples (88,89,91,93). Además, las reconstrucciones para algunos grupos
individuales, y no solo para los parásitos, apuntan a la pérdida de genes y al encogimiento del
genoma como el modo de evolución predominante (249). Teniendo en cuenta que numerosos
grupos procarióticos, sin duda, se han extinguido en el curso de la historia de la vida, hay razones
para creer que, incluso antes de la radiación de todos los principales linajes conocidos en la
actualidad, la distribución de los tamaños del genoma y la complejidad media en procariotas fue
(casi ) lo mismo que es ahora. Por supuesto, es concebible que las formas más complejas
conocidas evolucionaran relativamente tarde en la evolución pero, de ser así, podrían explicarse
por procesos puramente estocásticos, dado que la vida, en las etapas previas a LUCAS de su
evolución, debe han comenzado 'desde un comienzo tan simple' (1250)

En la misma línea, el descubrimiento de genomas grandes y complejos en animales de tallo (es


decir, animales con simetría radial, como Cnidaria, que se ramificaron en el tronco de la evolución
del metazoo antes del origen de la Bilateria) (84–86) sugiere que hubo poco o ningún aumento en
la complejidad genómica durante la evolución de los metazoos (aunque la complejidad
organizacional sí aumentó); en cambio, la pérdida de genes recurrentes en diferentes linajes fue el
proceso evolutivo más prevalente.

Ciertamente, se conocen episodios de mayor aumento en la complejidad, como el origen de los


eucariotas y el origen de las formas multicelulares, por mencionar ejemplos obvios. Sin embargo,
estos no parecen ser parte de una tendencia gradual y consistente, sino más bien eventos
singulares, más o menos catastróficos provocados por sucesos raros y fortuitos, como la
domesticación del endosimbionte en el caso del origen de los eucariotas.

En general, los estudios teóricos y empíricos sobre la evolución de la complejidad genómica


sugieren que no existe una tendencia a la complejidad en la historia de la vida y que, cuando la
complejidad aumenta sustancialmente, esto ocurre no como una adaptación sino como una
consecuencia de una depuración débil. La selección, en sí misma, por paradójica que pueda
parecer, un signo revelador del fracaso evolutivo. Parece que estos hallazgos son suficientes para
poner fin a la noción de "progreso" evolutivo, una sugerencia que se hizo anteriormente sobre una
base más general.

Genómica funcional, biología de sistemas y determinantes de la tasa de evolución de los genes.

Al igual que la última década del siglo XX fue la época de la genómica cuando la cantidad de
secuencias del genoma se transformó en una nueva calidad, lo que permitió una generalización
novedosa, como el 'desarraigo' del TOL, la primera década del nuevo siglo se convirtió en la era De
genómica funcional y biología de sistemas. Estas disciplinas produjeron datos cada vez más fiables
de un nuevo tipo que comienzan a llenar la brecha previamente evidente entre el genoma y el
fenotipo de un organismo (en lo sucesivo, variables fenómicas). Las variables fenómicas incluyen
perfiles genómicos de niveles de expresión génica, mapas completos de proteína-proteína e
interacciones genéticas, información sobre los efectos de la inactivación de genes (la capacidad de
dispensación de genes, típicamente, se define como la esencialidad de un gen para el crecimiento
en medios ricos), y más (81,82). Los primeros análisis comparativos que se hicieron posibles
cuando se disponía de información suficiente sobre la expresión génica para múltiples organismos
revelaron una interacción entre procesos neutrales y selectivos. Si bien los niveles de expresión
entre los genes ortólogos en humanos y ratones muestran una conservación significativa (en
comparación con los pares de genes aleatorios), la divergencia en la expresión es más pronunciada
que entre las secuencias de proteínas de los ortólogos (251,252). Por lo tanto, aunque, en
términos generales, la evolución de la expresión génica es similar a la evolución de la secuencia, ya
que la selección purificadora es la fuerza limitante principal (253), el componente genuinamente
neutral y sin restricciones probablemente contribuya más a la evolución de la expresión.

El análisis conjunto de la nueva clase de variables fenómicas caracterizadas por la biología de


sistemas y las medidas de evolución de los genes, como la tasa de evolución de la secuencia y la
propensión a la pérdida de genes, revelaron una estructura de correlaciones bastante inesperada
[(81,254,255); Figura 3A]. A pesar del vínculo intuitivo entre la tasa de evolución y la
dispensabilidad de los genes [se espera que los genes 'importantes' evolucionen más lentamente
que los menos importantes (256)], solo se detectó un vínculo débil (en el mejor de los casos) entre
estas características (257–259) . El vínculo entre la tasa de evolución y la importancia funcional de
un gen merece una investigación más profunda, ya que un análisis exhaustivo revela un efecto
fenotípico medible del knockout de virtualmente cada gen de levadura en algunas condiciones
(260). Sin embargo, a pesar del resultado de tales estudios, claramente, este vínculo es sutil,
incluso si resulta robusto. En contraste, la correlación más fuerte en todas las comparaciones
entre variables evolutivas y fenómicas se observó entre el nivel de expresión génica y la tasa de
evolución de la secuencia o la propensión a la pérdida de genes: los genes altamente expresados
tienden a evolucionar sustancialmente más lentamente que los genes de baja expresión (254,261).

Este hallazgo se ve reforzado por las observaciones de una correlación positiva entre la
divergencia de secuencias y la divergencia de los perfiles de expresión entre los genes ortólogos
humanos y de ratón (252) y las tasas comparativamente bajas de divergencia de perfiles de
expresión en genes altamente expresados (262).

La estructura general de las correlaciones entre variables evolutivas y fenómicas se captura de


manera sucinta en el concepto del "estado" de un gen en un genoma (255). Los genes de estado
alto evolucionan lentamente, rara vez se pierden durante la evolución y, por lo general, están
altamente expresados, con numerosas interacciones proteína-proteína y genética, y muchos
parálogos (Figura 3B). Sin embargo, debe observarse que a pesar de esta apariencia de orden en la
estructura de correlación, todas las correlaciones son relativamente débiles y no parecen
aumentar significativamente con la mejora de la calidad de los datos (254,255). Estas
observaciones apuntan a la multiplicidad de los determinantes del curso de la evolución de un gen
y sugieren que un ruido estocástico verdaderamente aleatorio podría ser un factor importante.

La aparición del vínculo entre la tasa de evolución de la secuencia como la conexión más
prominente entre la variable evolutiva y la variable fenómica condujo a un nuevo concepto de los
principales determinantes de la evolución de la proteína. En la era pregenómica, generalmente se
asumió que la tasa de evolución de la secuencia debería ser una función de, en primer lugar, las
restricciones estructural-funcionales intrínsecas que afectan a la proteína dada y, en segundo
lugar, la importancia del papel biológico de la proteína en el organismo ( 256). Con el
advenimiento de los datos de biología de sistemas, se observó que las variables fenómicas, en
particular, la expresión génica podrían ser igual o incluso más importantes que los factores
tradicionalmente considerados (263,264). Esta realización condujo a la hipótesis de Mdransflexión
inducida por plegado incorrecto (MIM) según el nivel de expresión o, más precisamente, la tasa de
eventos de traducción es de hecho el determinante dominante de la tasa de evolución de la
secuencia. Se cree que la causa de la covariación entre la tasa de evolución de la secuencia y el
nivel de expresión es la selección de la resistencia al plegamiento incorrecto de proteínas, que es
cada vez más importante para las proteínas altamente expresadas debido a los efectos tóxicos de
las proteínas mal plegadas (265,266). La hipótesis MIM podría explicar adicionalmente la
correlación positiva bastante desconcertante pero consistente y fuerte entre las tasas de
evolución en posiciones sinónimas y no sinónimas (dN y dS, respectivamente) de secuencias
codificantes de proteínas (267). De hecho, es probable que esta correlación sea una consecuencia
de la lenta evolución en ambas clases de sitios en genes altamente expresados que, en el caso de
sitios sinónimos, probablemente se deba a la selección de codones que minimizan la mala
traducción (268,269). Simulaciones por computadora detalladas de la evolución de la proteína
sugieren que el efecto tóxico de la plegamiento incorrecto de la proteína, de hecho, podría
justificar la explicación de la covariación observada del nivel de expresión y la tasa de evolución de
la secuencia (269). Un análisis de la evolución de las proteínas multidominio reveló una
homogeneización sustancial de las tasas evolutivas específicas del dominio en comparación con el
mismo par de dominios en proteínas separadas, posiblemente atribuibles a las tasas de traducción
igualadas, pero diferencias significativas entre las tasas de evolución específicas del dominio
persistieron incluso en Proteínas multidominio (270). Por lo tanto, la hipótesis MIM generalizada
según la cual la tasa de evolución de la proteína, principalmente, depende de dos factores:

(i) Robustez intrínseca del plegado incorrecto que depende de la estabilidad y designabilidad
características de la proteína (dominio) dada.

(ii) Tasa de conversión que puede verse como un amplificador del costo de adecuación del plegado
incorrecto y, en consecuencia, de la selección de la robustez de la mala incorporación de
aminoácidos.

La biología de los sistemas evolutivos reveló una nueva capa de conexiones entre la evolución y el
funcionamiento del genoma. Es cada vez más claro que los procesos que vinculan el genoma y el
fenotipo de un organismo, en particular, la expresión génica ejercen una retroalimentación
sustancial sobre la evolución de los genes. La tasa de evolución de los genes codificantes de
proteínas podría depender más de las restricciones relacionadas con la prevención de efectos
nocivos de plegado incorrecto que de las restricciones asociadas con la función específica de la
proteína.

Universales de la evolución del genoma.

La genómica comparativa y la biología de sistemas producen enormes cantidades de datos, y esta


gran cantidad de información requiere una búsqueda de patrones y regularidades. De hecho, se
descubrieron varias regularidades de este tipo que están generalizadas e incluso podrían ser
universales para todo el curso de la evolución de la vida. En la sección anterior, discutí uno de tales
universales aparentes, la correlación negativa entre la tasa de evolución de la secuencia de genes y
el nivel de expresión que parece mantenerse en todos los organismos para los cuales los datos
están disponibles y conduce a una reevaluación de los factores que afectan a la evolución del gen
ect ( 269).

Otras regularidades potencialmente importantes vienen en forma de distribuciones conservadas


de variables evolutivas y funcionales. Sorprendentemente, se encontró que las distribuciones de
las tasas de evolución de secuencia de genes ortólogos entre genomas estrechamente
relacionados son altamente similares en taxones distantes (271); cuando están estandarizadas,
estas distribuciones son virtualmente indistinguibles en bacterias, arqueas y eucariotas y se
aproximan mejor por una distribución log-normal (Figura 4A). Teniendo en cuenta las diferencias
dramáticas en la complejidad genómica y la arquitectura (ver más arriba), así como la biología de
estos organismos, la identidad cercana de las distribuciones de tasas es sorprendente y exige una
explicación en términos de factores universales que afectan la evolución del genoma. La
resistencia al plegamiento incorrecto de proteínas discutido anteriormente parece ser un buen
candidato para un factor tan universal, aunque aún no se han desarrollado modelos cuantitativos
que expliquen la distribución de la tasa.

Como se mencionó anteriormente, la duplicación de genes da forma a todos los genomas, y la


distribución del tamaño de la familia en todos los genomas secuenciados sigue una distribución
similar a la ley de poder, con la única diferencia apreciable que es el exponente (203,204), por lo
que esta distribución se presenta como un universal de evolución genómica. Esta distribución se
ajusta estrechamente a un modelo simple de nacimiento y muerte de evolución genética con tasas
de natalidad y mortalidad equilibradas y sin participación directa de ninguna forma de selección
[(204,272); Figura 4B

La escala diferencial de las clases funcionales de genes con el tamaño del genoma que se
menciona anteriormente sugiere la existencia de un conjunto completo de constantes
fundamentales de la evolución. Las relaciones entre las tasas de duplicación y las tasas de
eliminación de genes que determinan los exponentes de las leyes de poder para cada clase de
genes parecen ser las mismas para todos los linajes probados de procariotas e invariantes con
respecto al tiempo, por lo que las clases funcionales de genes parecen poseer 'Potenciales
evolutivos' universales (245,273).

La aparente universalidad de estas y otras características centrales de la evolución del genoma


sugiere que modelos relativamente simples y no selectivos podrían ser suficientes para formar el
marco de una teoría evolutiva general con respecto a la cual la selección purificadora
proporcionaría condiciones de frontera (restricciones) mientras que la darwiniana es positiva. La
selección (adaptación) se manifestaría como un modulador cuantitativamente cuantitativo,
aunque fuera funcionalmente crucial del proceso evolutivo.

CONCLUSIONES

Dos siglos después del nacimiento de Darwin, 150 años después de la publicación de su 'Origen de
las especies', y 50 años después de la consolidación de la Síntesis moderna, el análisis comparativo
de cientos de genomas de muchos taxones diversos ofrece oportunidades sin precedentes para
probar las conjeturas de ) Darwinismo y desciframiento de los mecanismos de evolución. La
genómica comparativa reveló una sorprendente diversidad de procesos evolutivos que era
inimaginable en la era pre-genómica. Además de las mutaciones puntuales que se pueden
equiparar con los 'cambios infinitosimales' de Darwin, la evolución del genoma implica
contribuciones importantes de duplicaciones genéticas y genómicas completas, grandes
eliminaciones que incluyen la pérdida de genes o grupos de genes, transferencia horizontal de
genes y regiones genómicas completas, varios tipos de reordenamientos genómicos, e interacción
entre genomas de formas de vida celulares y diversos elementos genéticos del ego. El paisaje
emergente de la evolución del genoma incluye el clásico, la selección natural darwiniana como un
componente importante, pero es mucho más pluralista y complejo de lo que conlleva la visión
directa de Darwin que se solidificó en la Síntesis Moderna (16,184). La mayoría de las secuencias
en todos los genomas evolucionan bajo la presión de la selección purificadora o, en los organismos
con los genomas más grandes, de manera neutral, con solo una pequeña fracción de mutaciones
en realidad beneficiosas y fijas por la selección natural como lo imaginó Darwin. Además, las
contribuciones relativas de las diferentes fuerzas evolutivas varían enormemente entre los linajes
del organismo, principalmente debido a las diferencias en la estructura de la población.

La genómica evolutiva demolió de manera efectiva el concepto directo de TOL al revelar el


carácter dinámico y reticulado de la evolución, donde HGT, la fusión del genoma y la interacción
entre los genomas de las formas de vida celulares y los diversos elementos genéticos del ego
ocupan el lugar central. En esta dinámica visión del mundo, cada genoma es un palimpsesto, una
colección diversa de genes con diferentes destinos evolutivos y probabilidades muy diversas de
perderse, transferirse o duplicarse. Así que el TOL se convierte en una red, o quizás, más
apropiadamente, el Bosque de la Vida que consiste en árboles, arbustos, matorrales de lianas y,
por supuesto, numerosos troncos y ramas muertas. Si el TOL puede recuperarse como una
tendencia central en la evolución de múltiples genes conservados o si este concepto debe
abandonarse de lleno por la imagen del Bosque de la Vida, sigue siendo una pregunta abierta
(274)

La Tabla 1 describe el estado de los principios centrales de la biología evolutiva clásica en la era de
la genómica evolutiva y la biología de sistemas. Todos los conceptos clásicos han sufrido una
transformación, convirtiéndose en caracterizaciones más complejas y pluralistas del proceso
evolutivo (15). Al representar el cambio en los trazos más anchos posibles, la información
primordial de Darwin sobre la interacción entre el azar y el orden (introducida por la selección
natural) sobrevivió, incluso en una forma nueva, mucho más compleja y matizada, con
contribuciones especí fi cas de diferentes tipos de procesos aleatorios y Se revelan distintos tipos
de selección. En contraste, la insistencia en la adaptación como modo principal de evolución que
se manifiesta en el Origen, pero especialmente en la Síntesis Moderna, se volvió profundamente
sospechosa, si no completamente obsoleta, dejando espacio para una nueva cosmovisión que le
da mucho más protagonismo a la no adaptativa. procesos (184).

Más allá de la asombrosa e inesperada diversidad de la organización del genoma y los modos de
evolución revelados por la genómica comparativa, ¿hay alguna posibilidad de descubrir principios
generales subyacentes? O, ¿es el único principio de este tipo el papel central del azar y la
contingencia en la evolución, elegantemente captado por Jacob (55) en su fórmula de "evolución
como retoques"? De una manera un tanto irónica, uno se inclina a preguntar: ¿es concebible una
síntesis posmoderna y, quizás, incluso a la vista?

Varios desarrollos recientes en la genómica evolutiva pueden ser candidatos para los roles de
generalizaciones de alto nivel que subyacen a la diversidad de los procesos evolutivos. Quizás, el
de mayor alcance de estos es el concepto genético poblacional de la evolución del genoma
desarrollado por Lynch (16). De acuerdo con este concepto, las características principales de los
genomas no están conformadas por la adaptación sino por procesos evolutivos estocásticos que
dependen críticamente de la intensidad de la selección purificadora, lo que, a su vez, está
determinado por el tamaño efectivo de la población y la tasa de mutación de los organismos
respectivos. . En particular, la complejidad de los genomas de los eucariotas multicelulares se
interpreta como evolucionando, principalmente, no como una adaptación que garantiza la
complejidad organizativa y funcional, sino como un "síndrome genómico" causado por una
selección purificadora ine fi ciente en poblaciones pequeñas. Algunos de los elementos de
secuencia acumulados a través de procesos neutros se reclutan para funciones biológicas que
colectivamente, de hecho, proporcionan la evolución de organismos estructuralmente y
funcionalmente complejos. A la inversa, los genomas compactos de procariotas y algunos
eucariotas unicelulares pueden no estar conformados por selección por "racionalización del
genoma", sino más bien por una mejoría efectiva incluso de secuencias ligeramente nocivas en
grandes poblaciones (83). La visión no adaptativa de la evolución de la complejidad genómica de
ninguna manera implica que no haya características complejas que evolucionen nunca como
adaptaciones directas o que la racionalización del genoma nunca pueda ser una fuerza impulsora
importante de la evolución del genoma. Sin embargo, creo que la evidencia acumulada por la
genómica evolutiva es suficiente para requerir el cambio de la hipótesis nula central de la
evolución del genoma de adaptacionista a neutral, con la carga de la prueba trasladada a los
adeptos de la adaptación generalizada (230)

El concepto del carácter sustancialmente no adaptativo de la evolución del genoma parece afectar
nuestra comprensión básica del significado de la conservación de las características genómicas.
Como ejemplo, la conservación bastante enigmática de las posiciones de una gran fracción de las
posiciones de los intrones a lo largo de la evolución de los eucariotas podría no ser una
consecuencia de una fuerte selección purificadora que causaría la eliminación de variantes en las
que se perdieron los respectivos intrones (el valor predeterminado es interpretación implícita por
la noción misma de selección purificadora y totalmente compatible con la teoría neutral). Por el
contrario, la conservación de intrones y otras características genómicas sin funciones obvias
podría ser la consecuencia de una selección purificadora débil en pequeñas poblaciones de
organismos complejos que es insuficiente para eliminar estos elementos de manera eficiente. Esto
no significa que muchos caracteres genómicos (como los genes individuales, los residuos de
aminoácidos o los nucleótidos) no se conserven durante la evolución debido a su importancia
funcional, sino que sugieren que incluso este "sagrado", principio central de la biología evolutiva ...
Lo que se conserva es funcionalmente relevante ", no es un absoluto, y la alternativa no
adaptativa debe tomarse en serio. Junto con la comprensión de que la contracción del genoma es
al menos tan común en la evolución como la expansión del genoma, y el aumento de la
complejidad genómica no es una tendencia evolutiva central, el concepto de evolución del
genoma no adaptativo implica que la idea del progreso evolutivo puede ponerse a salvo.
descansar.

A veces se argumenta que los desarrollos recientes en genómica y biología de sistemas producen
un laberinto de conexiones entre diferentes tipos de datos que son intratables en cualquier forma
explícita, eliminando así cualquier esperanza para el descubrimiento de regularidades simples y
"similares a la ley" y reduciendo gran parte de La investigación en estas áreas para el desarrollo de
algoritmos predictivos (275). Sin embargo, es exactamente este tipo de regularidades simples y
aparentemente universales que emergen del análisis conjunto de datos comparativos-genómicos y
de biología de sistemas. La distribución de las tasas de evolución a través de conjuntos de genes
ortólogos, la distribución de los tamaños de las familias de genes parálogos, la correlación negativa
entre el nivel de expresión y la tasa de evolución de la secuencia de un gen, y otras relaciones
entre las variables evolutivas y fenómicas clave parecen ser genuinas. universales de la evolucion
La simplicidad de estas regularidades universales sugiere que están moldeadas por procesos
evolutivos fundamentales igualmente simples, en lugar de por la selección de funciones
específicas. En algunos casos, ya se han desarrollado modelos explícitos de tales procesos y se ha
demostrado que se ajustan a los datos. Estos modelos no incluyen la selección en absoluto o dan
una nueva interpretación a la selección. Un buen ejemplo es la hipótesis generalizada de error en
la traducción inducida por la mala interpretación que explica la covariación de la expresión génica
y la tasa de evolución de la secuencia mediante la selección de la robustez para el plegado
incorrecto que se presenta como un determinante importante de la evolución de la proteína. El
corolario inesperado de este modelo es que la fuerza motriz principal de la selección purificadora
podría no ser el mantenimiento de una función biológica, sino la prevención de efectos nocivos no
específicos de una proteína mal plegada.
En conjunto, los desarrollos en la genómica evolutiva y la biología de sistemas aquí descritos
parecen sugerir que, aunque en la actualidad solo se están formulando elementos aislados de una
nueva síntesis "posmoderna" de la biología evolutiva, tal síntesis es ciertamente factible. Además,
es probable que adopte una forma definitiva mucho antes del 250 aniversario de Darwin.

LA BIODIVERSIDAD DE LAS ESPECIES Y SUS TASAS DE EXTINCIÓN, DISTRIBUCIÓN Y PROTECCIÓN

ANTECEDENTES: Una función principal de la Plataforma Intergubernamental de Ciencia y Política


sobre Biodiversidad y Servicios de los Ecosistemas (IPBES) es "realizar evaluaciones periódicas y
oportunas de los conocimientos sobre biodiversidad". En diciembre de 2013, su segunda sesión
plenaria aprobó un programa para comenzar una evaluación global. en 2015. El Convenio sobre la
Diversidad Biológica (CDB) y otras cinco convenciones relacionadas con la biodiversidad han
adoptado la IPBES como su interfaz entre ciencia y política, por lo que estas evaluaciones serán
importantes para evaluar el progreso hacia las Metas de Aichi del CDB del Plan Estratégico para la
Biodiversidad 2011– 2020. Como contribución a dicha evaluación, revisamos la biodiversidad de
las especies de eucariotas y sus tasas de extinción, distribuciones y protección. Documentamos lo
que sabemos, cómo es probable que difiera de lo que no hacemos y cómo estas diferencias
afectan a las estadísticas de biodiversidad. Curiosamente, varios objetivos mencionan
explícitamente "especies conocidas", una declaración fuerte, aunque implícita, de conocimiento
incompleto. Comenzamos preguntando cuántas especies se conocen y cuántas quedan sin
describir. Luego consideramos cuánto inflan las acciones humanas los índices de extinción. Mucho
depende de dónde están las especies, porque los diferentes biomas contienen diferentes números
de especies de diferentes susceptibilidades. Los biomas también sufren diferentes niveles de daño
y tienen niveles de protección desiguales. La forma en que cambiarán las tasas de extinción
dependerá de cómo y dónde se expandan las amenazas y de si la mayor protección las contradice.

AVANCES: Estudios recientes han aclarado dónde viven las especies más vulnerables, dónde y
cómo la humanidad cambia el planeta y cómo esto conduce a las extinciones. Estos datos son cada
vez más accesibles, lo que aporta mayor transparencia a la ciencia y la gobernabilidad. Los
catálogos taxonómicos de plantas, vertebrados terrestres, peces de agua dulce y algunos taxones
marinos son suficientes para evaluar su estado y las limitaciones de nuestro conocimiento. Sin
embargo, la mayoría de las especies no están descritas. Las especies que mejor conocemos tienen
grandes rangos geográficos y son a menudo comunes dentro de ellas. Sin embargo, la mayoría de
las especies conocidas tienen rangos pequeños, y estas especies son típicamente descubrimientos
más recientes. El número de especies conocidas con rangos muy pequeños está aumentando
rápidamente, incluso en taxones conocidos. Están geográficamente concentrados y es
desproporcionadamente probable que se vean amenazados o que ya estén extintos. Esperamos
que especies desconocidas compartan estas características. Las tasas actuales de extinción son
aproximadamente 1000 veces la tasa de extinción de fondo. Estos son más altos que los estimados
previamente y probablemente todavía se subestiman. Las tasas futuras dependerán de muchos
factores y están listas para aumentar. Finalmente, aunque ha habido un rápido progreso en el
desarrollo de áreas protegidas, tales esfuerzos no son ecológicamente representativos, ni tampoco
protegen de manera óptima la biodiversidad.

PERSPECTIVA: El progreso en la evaluación de la biodiversidad surgirá de la expansión continua de


las muchas bases de datos en línea creadas recientemente, combinándolas con las nuevas fuentes
de datos globales sobre el cambio en el uso de la tierra y el océano y con datos cada vez más
compartidos sobre la distribución de especies. En www.savingspecies.org y www.youtube se
pueden encontrar ejemplos de conservación práctica que se desprenden del uso de datos
combinados en Colombia y Brasil. com / watch? v = R3zjeJW2NVk.

Estudios recientes aclaran dónde viven las especies más vulnerables, dónde y cómo la humanidad
cambia el planeta y cómo esto conduce a las extinciones. Evaluamos estadísticas clave sobre las
especies, su distribución y su estado. La mayoría no están descritas. Las que mejor sabemos tienen
grandes rangos geográficos y con frecuencia son comunes dentro de ellas. La mayoría de las
especies conocidas tienen rangos pequeños. El número de especies de pequeño rango está
aumentando rápidamente, incluso en taxones conocidos. Están geográficamente concentrados y
es probable que estén amenazados o extintos de manera desproporcionada. Las tasas actuales de
extinción son alrededor de 1000 veces la tasa de fondo probable de extinción. Las tasas futuras
dependen de muchos factores y están listas para aumentar. Aunque ha habido un rápido progreso
en el desarrollo de áreas protegidas, tales esfuerzos no son ecológicamente representativos, ni
tampoco protegen de manera óptima la biodiversidad.

Una de las cuatro funciones de la Plataforma Intergubernamental de Ciencia y Política sobre


Biodiversidad y Servicios de los Ecosistemas (IPBES) es "realizar evaluaciones periódicas y
oportunas de los conocimientos sobre la biodiversidad" (1). En diciembre de 2013, su segunda
sesión plenaria aprobó el inicio de evaluaciones globales y regionales en 2015 (1). El Convenio
sobre la Diversidad Biológica (CDB) y otras cinco convenciones relacionadas con la diversidad
biológica han adoptado la IPBES como su interfaz entre ciencia y política, por lo que estas
evaluaciones serán importantes para evaluar el progreso hacia las Metas de Aichi del Plan
Estratégico para la Diversidad Biológica 2011-2020 (2 ). Seguirán necesariamente las definiciones
de biodiversidad del CDB introducidas por Norse y otros (3) como niveles genéticos, de especies y
ecosistémicos de la organización ecológica. Como contribución, revisamos la biodiversidad de las
especies de eucariotas y sus tasas de extinción, distribuciones y protección.

Curiosamente, varios objetivos mencionan explícitamente "especies conocidas", una declaración


fuerte, aunque implícita, de conocimiento incompleto. Entonces, ¿cuántas especies de eucariotas
hay (4)? Para las plantas terrestres, hay 298,900 nombres de especies aceptadas, 477,601
sinónimos y 263,925 nombres sin resolver (5). Debido a que los nombres aceptados entre los
resueltos es del 38%, parece razonable predecir que finalmente se aceptará la misma proporción
de nombres no resueltos. Esto produce otras ~ 100,000 especies para un estimado total de
400,000 especies (5). Los modelos predicen un 15% más por descubrir (6), por lo que el número
total de especies de plantas terrestres debería ser> 450,000 especies, muchas más de las que se
asume convencionalmente que existen.
Para los animales, las revisiones generales recientes atestiguan la dificultad de la pregunta. Se
describen alrededor de 1.9 millones de especies (7); la gran mayoría no tiene en cuenta. Costello
et al. (8) estiman 5 T 3 millones de especies, Mora et al. (9) 8.7T 1.3 millones, y Chapman (7) 11
millones. Raven y Yeates (10) estiman de 5 a 6 millones de especies de insectos solos, mientras
que Scheffers et al. (11) piensa que las incertidumbres en el número de insectos y hongos hacen
imposible un rango plausible. Las estimaciones de las especies incluidas en la especie incluyen 2,2
T 0,18 millones (9), y Appeltans et al. estima de 0.7 a 1.0 millones de especies, con 226,000
descritas y otras 70,000 en colecciones pendientes de descripción (12).

Las preocupaciones sobre la biodiversidad surgen porque las tasas actuales de extinción son
excepcionalmente altas. En consecuencia, primero comparamos las tasas de extinción actuales con
aquellas antes de que las acciones humanas las elevaran. Las especies vulnerables están
geográficamente concentradas, por lo que a continuación consideramos la biogeografía de la
extinción de especies. Dado el carácter incompleto de la taxonomía, consideramos cómo las
especies no descritas se diferencian de las especies descritas en su rango de tamaños geográficos,
distribuciones y riesgos de extinción. Para entender si las tasas de extinción de especies serán

aumente o disminuya, revisamos cómo y dónde se expanden las amenazas y si una mayor
protección puede contrarrestarlas. Concluimos revisando las perspectivas de progreso en la
comprensión de las lagunas clave en el conocimiento actual.

Antecedentes Tasas de extinción de especies Dadas las incertidumbres en el número de especies y


que solo un pequeño porcentaje de las especies se evalúan para determinar su riesgo de extinción
(13), expresamos las tasas de extinción como fracciones de especies que se extinguen con el
tiempo: extinciones por millón de años-año (E / MSY) (14) —más que como números absolutos.
Para las extinciones recientes, seguimos a los cohortes a partir de las fechas de su descripción
científica (15). Esto excluye especies, como el dodo, que se extinguió antes de la descripción. Por
ejemplo, los taxónomos describieron 1230 especies de aves después de 1900, y 13 de ellas están
ahora extintas o posiblemente extintas. Esta cohorte acumuló 98,334 especies por año, lo que
significa que una especie promedio ha sido conocida por 80 años. La tasa de extinción es (13 /
98,334) × 106 = 132 E / MSY.

La pregunta más difícil se refiere a cómo podemos comparar dichas estimaciones con aquellas en
ausencia de acciones humanas, es decir, la tasa de extinción de fondo. Tres líneas de evidencia
sugieren que una declaración anterior (14) de una tasa de "referencia" de 1 (E / MSY) es
demasiado alta.

Primero, el registro fósil proporciona evidencia directa de las tasas de fondo, pero es escaso en
tiempo, espacio y nivel taxonómico, ya que trata principalmente con géneros (16). Muchas
especies están en géneros monotípicos, mientras que las de los géneros politípicos a menudo
comparten las mismas vulnerabilidades a la extinción (17), por lo que las tasas de extinción de
especies y géneros deberían ser bastante similares. Alroy encontró que los mamíferos cenozoicos
tenían 0.165 extinciones de géneros por millón de géneros-año (18). Harnik y otros (19) calcularon
las fracciones de especies que se extinguían en diferentes intervalos. Al convertirlos a sus tasas
correspondientes, se obtienen valores para los últimos millones de años de 0,06 géneros de
extinción por millón de géneros-año para cetáceos, 0,04 para carnívoros marinos y, para una
variedad de invertebrados marinos, entre los valores de 0,001 (braquiópodos) y 0,01. (equinoides).
En segundo lugar, las filogenias de base molecular cubren muchos taxones y entornos,
proporcionando una alternativa atractiva a las deficiencias del registro fósil. Un modelo simple del
aumento observado en el número de especies St en un clado filogenético a lo largo del tiempo, t,
isSt = S0 exp [(l - m) × t], donde l y m son las tasas de especiación y extinción. En la práctica, I y M
pueden variar de maneras complejas. Estimar la tasa de diversificación promedio, l - m, requiere
solo datos modestos. Si se puede separar la extinción de las tasas de especiación utilizando
números de especies a lo largo del tiempo es controvertido (20, 21) y un área de investigación
activa que requiere datos cuidadosamente seleccionados para evitar posibles sesgos. Con el
modelo simple, el logaritmo del número de linajes [linajes a través del tiempo (LTT)] debería
aumentar linealmente con el tiempo, con una pendiente l - m, pero con una calificación
importante. En el límite de la actualidad, los taxones más recientes aún no han tenido tiempo de
extinguirse. La curva LTT debe ser cóncava y su pendiente debe aproximarse a l (20, 21). Esto
permite una estimación separada de las tasas de especiación y extinción.

Desafortunadamente, en los muchos estudios compilados por McPeek (22), el 80% de las curvas
LLT fueron convexas, donde m = 0. Si las subespecies reconocidas actualmente se consideraran
como especies, entonces una fracción mayor de las curvas LTT podría ser cóncava, m> 0. Esto
sugiere que la opinión taxonómica juega un papel de confusión y uno que no se resuelve
fácilmente, independientemente de los modelos estadísticos subyacentes. La pregunta crítica es
qué tan grande puede pasar desapercibida una tasa de extinción con estos métodos.
Generalmente, si fuera grande, predecirían las curvas cóncavas, pero eso no proporciona la
cuantificación.

Tercero, los datos sobre la diversificación neta, l - m, están ampliamente disponibles. Las plantas
(23) tienen tasas de diversificación medias de 0,06 especies nuevas por especie por millón de años,
aves 0,15 (24), varios cordados 0,2 (22), artrópodos 0,17 (22) y mamíferos 0,07 (22). Las tarifas
para clados individuales son excepcionalmente> 1. Valente y otros (25) buscaron tasas
excepcionalmente altas, encontrando> 1 para el género Dianthus (claveles, Caryophyllaceae),
Lupinus andino (Lupins, Fabaceae), Zosterops (ojos blancos, Zosteropidae) y cíclidos en África
oriental lagos

No hay evidencia de descensos generalizados, recientes, pero prehumanos en la diversidad en la


mayoría de los taxones, por lo que las tasas de extinción deben ser generalmente menores que las
tasas de diversificación. Esto coincide con la conclusión de los estudios filogenéticos que no
detectan altas tasas de extinción en relación con las tasas de especiación, y ambas líneas de
evidencia son compatibles con los datos fósiles. Esto sugiere que 0.1 E / MSY es una estimación de
orden de magnitud de la tasa de extinción de fondo.

Tasas actuales de extinción de especies

La Unión Internacional para la Conservación de la Naturaleza (UICN), en su Lista Roja de Especies


Amenazadas, evalúa el riesgo de extinción de las especies como Preocupación Mínima, Casi
Amenazada, tres categorías de especies amenazadas (Vulnerable, En Peligro y En Peligro Crítico), y
Extinto (13). Para marzo de 2014, la UICN había evaluado 71,576 especies principalmente
terrestres y de agua dulce: 860 estaban extintas o extintas en la naturaleza; 21,286 fueron
amenazadas, con 4286 en peligro crítico (13). Los porcentajes de especies terrestres amenazadas
fueron del 13% (aves) al 41% (anfibios y gimnospermas) (13). Para los taxones de agua dulce (26),
los niveles de amenaza abarcan desde el 23% (mamíferos y peces) hasta el 39% (reptiles).

Los esfuerzos están expandiendo los datos limitados de los océanos para los cuales solo el 2% de
las especies se evalúan en comparación con el 3.6% de todas las especies conocidas (27). Peters y
otros (28) evaluaron el género de caracol Conus, Carpenter y otros (29) corales y Dulvy y otros (30)
1041 especies de tiburones y rayas. En general, unas 6041 especies marinas tienen datos
suficientes para evaluar el riesgo: el 16% está amenazado y el 9% está casi amenazado, la mayoría
por sobreexplotación, pérdida de hábitat y cambio climático (13).

El método directo de estimar las tasas de extinción rastrea el cambio de estado a lo largo del
tiempo. La mayoría de los cambios en las categorías de la Lista Roja de la UICN se deben a un
mejor conocimiento, por lo que el cálculo del Índice de la Lista Roja mide el riesgo agregado de
extinción de todas las especies en un grupo dado, eliminando dichos cambios no originales (31).
Hoffmann et al. (32) mostraron que, en promedio, 52 de las 22,000 especies de mamíferos, aves y
anfibios se movían una categoría de la Lista Roja más cerca de la extinción cada año. Si la
probabilidad de cambio entre cualquiera de las dos categorías adyacentes de la Lista Roja fuera
idéntica, se obtendría una tasa de extinción de 450 E / MSY. La probabilidad es menor para la
transición de en peligro crítico a extinto (33), sin embargo, quizás porque los primeros reciben una
atención de conservación desproporcionada.

Las tasas de extinción de los análisis de cohortes promedian alrededor de 100 E / RMS (Tabla 1).
Las tarifas locales de las regiones pueden ser mucho más altas: 305 E / MSY para peces en los ríos
y lagos de América del Norte (34), 954 E / MSY para los gasterópodos de agua dulce de la región
(35) y probablemente> 1000 E / MSY para peces cíclidos en África Lago Victoria (36)

Los estudios sobre las tasas de extinción modernas por lo general no abordan la tasa de
extinciones genéricas, pero son posibles las comparaciones directas con los fósiles. Para los
mamíferos, la tasa es de ~ 100 extinciones de géneros por millón de años géneros (13) y ~ 60
extinciones para aves (13, 37).

¿Cómo afecta el conocimiento taxonómico incompleto a estas estimaciones? Dado que muchas
especies aún no están descritas y muchas especies con rangos pequeños son descubrimientos
recientes, estas cifras seguramente se subestiman. Muchas especies se habrán extinguido o
extinguirán antes de la descripción (8, 15). Las tasas de extinción de las especies descritas después
de 1900 son considerablemente más altas que las descritas anteriormente, lo que refleja su mayor
rareza (Tabla 1). Además, una mayor fracción de las especies descritas recientemente están en
peligro crítico (Tabla 1). Las tasas de extinción y las proporciones de especies amenazadas
aumentan con el conocimiento mejorado. Esto nos advierte que las estimaciones de tasas de
extinción recientes basadas en taxones poco conocidos (como los insectos) pueden ser
subestimaciones sustanciales porque muchas especies raras no están descritas.

En resumen, las tasas de extinción actuales de ~ 100 E / MSY y la fuerte sospecha de que estas
tasas fallan en las extinciones incluso para los taxones conocidos, y ciertamente para los más
pobres, significa que las tasas de extinción actuales son mil veces más altas que la tasa de fondo
de 0.1 E / MSY.

La biogeografía de la extinción global de especies


Las acciones humanas han eliminado a los principales depredadores y otras especies de gran
cuerpo en la mayoría de los continentes (38), y los océanos están agotados masivamente de peces
depredadores (39). Por ejemplo, los ecosistemas de sabana africana alguna vez cubrieron ~ 13.5
millones de km2. Solo ~ 1 millón de km2 ahora tienen leones, y mucho menos área tiene
poblaciones viables de ellos (40). Al reconocer la importancia de tales extirpaciones regionales,
nos concentramos en las extinciones mundiales irreversibles de las especies y ahora consideramos
dónde ocurrirán.

Patrones generales— “leyes” (41): describen las distribuciones geográficas de las especies. En
primer lugar, dominan los pequeños rangos geográficos. Gaston (42) sugiere una distribución
lognormal, aunque muchos taxones tienen más especies de rango pequeño que incluso esa
distribución sesgada (Fig.1). En la Fig. 1, el 25% de la mayoría de los taxones tienen rangos <105
km2 y, para los anfibios, <103 km2.

Estos tamaños sobrestiman sustancialmente los rangos reales. La Figura 1 supone que, para las
plantas, la presencia en una de las 369 regiones de la Lista de verificación mundial de familias de
plantas seleccionadas (WCSPF) (43) significa que la especie se encuentra en toda la región.
Similarmente, la Fig. 1 asume que las especies de Conus ocurren en todo el océano dentro de sus
límites geográficos. Estos límites externos de los rangos estimados son demasiado grandes. Por
supuesto, las especies están además limitadas a hábitats específicos dentro de los límites externos
de sus rangos (44, 45).

Una segunda ley es que las especies de pequeño rango son generalmente más escasas a nivel local
que las extendidas (41). Combinadas, estas dos formas de secuencia tienen consecuencias. En
primer lugar, como era de esperar, los taxónomos generalmente describen especies extensas y
abundantes localmente antes que las pequeñas y localmente escasas (46). Incluso para
vertebrados conocidos, los taxónomos describieron más de la mitad de las especies en Brasil con
rangos <20,000 km2 después de 1975 (47).

Segundo, dado que la mayoría de las especies no están descritas, se espera que las muestras de
regiones previamente inexploradas contengan una preponderancia de ellas. De hecho, la fracción
de especies no descritas debe proporcionar estimaciones de cuántas especies hay en total (11,
12). En la práctica, las muestras pequeñas en ubicaciones dispersas incluyen especies comunes y
extendidas y algunas raras. Por ejemplo, en muestras de aproximadamente 6 millones de km2 de
tierras bajas del Amazonas, solo 227 especies representaron la mitad de los árboles individuales, lo
que sugiere que el Amazonas podría ser florísticamente bastante homogéneo. Sin embargo, las
muestras contenían 4962 especies de árboles conocidas, y muchas de ellas no pudieron
identificarse (48). El Amazonas puede contener hasta 16,000 especies (48). Solo la acumulación de
listas de especies mientras se cuantifica el esfuerzo de muestreo puede proporcionar estimaciones
convincentes de cómo la diversidad varía geográficamente y, por lo tanto, de cuántas especies hay
en total.

Las incertidumbres acerca de dónde están las especies pueden ser más limitantes que no saber
cuántas especies hay. La UICN mapea 43,000 especies (13). Casi la mitad son anfibios, aves y
mamíferos. El mapa más común, pero menos informativo para la conservación, es de riqueza de
especies. Las especies ampliamente distribuidas dominan estos mapas, mientras que la mayoría de
las especies con rangos pequeños son casi invisibles (fig. S1). Un acompañamiento esencial traza
mapas de especies de pequeño rango, como la riqueza de especies con un tamaño menor al rango
de la mediana (49) o, para regiones más definidas, endémicas de cada región. Las figuras 2 a 5
proporcionan ejemplos de mamíferos y anfibios (13, 50, 51), plantas con flores (43), peces de agua
dulce (52) y caracoles marinos del género Conus (28). Los materiales complementarios
proporcionan detalles (53). Hay mapas similares para 845 especies de coral formadoras de
arrecifes (29), peces costeros, varios depredadores marinos e invertebrados (54, 55).

Donde hay la mayoría de las especies, uno podría esperar la mayoría de las especies de todos los
tamaños de rango, tanto grandes como pequeñas. Sorprendentemente, las especies con pequeños
rangos están geográficamente concentradas. El mayor número de especies de aves vive en las
tierras bajas del Amazonas, mientras que las especies de pequeño rango se concentran en los
Andes (fig. S1). Aunque mapeados a una escala mucho más gruesa, los peces de agua dulce
también suelen alcanzar su mayor diversidad en los grandes ríos que fluyen a través de los
bosques. Una sorprendente excepción son los altos números en los lagos de la falda de África
Oriental (Fig. 4). Filipinas tiene el mayor número de especies de Conus; las concentraciones de
especies de pequeño rango están en otra parte (Fig. 5). Otros taxones marinos son similares (55).

Muchas extinciones pasadas han estado en islas, pero los patrones actuales de amenaza son
geográficamente mucho más amplios (49, 56). Especies raras, bien extendidas pero escasas (como
los principales depredadores y otros animales de gran cuerpo) o con rangos geográficos pequeños
y, con frecuencia, localmente escasos (41), dominan las listas. Las especies con rangos pequeños
son desproporcionadamente más propensas a ser amenazadas que aquellas con rangos más
grandes (49, 57). Curiosamente, para un rango de tamaño dado, una fracción más pequeña de las
especies de islas está amenazada que para las de los continentes, probablemente porque las
especies de las islas son localmente más abundantes (49).

Las concentraciones de especies amenazadas coinciden más con las concentraciones de especies
de pequeño rango que con el número total de especies y, por lo tanto, son más informativas sobre
dónde viven las especies actualmente amenazadas y dónde pueden amenazarse en el futuro (49,
50) (Fig. 2 y Fig. . S1).

Myers y otros (58) señalaron el punto vital y separado de que la destrucción del hábitat es mayor
donde viven las concentraciones más altas de especies de pequeño rango. Por así decirlo, las
especies de pequeño rango nacen vulnerables y luego tienen las mayores amenazas sobre ellas. La
definición del punto de acceso de Myers et al. Combina un número mínimo de especies de plantas
de pequeño rango y una pérdida de hábitat suficientemente alta.

Tasas futuras de extinción de especies El motor principal de la extinción de especies es el


crecimiento de la población humana y el aumento del consumo per cápita. El tiempo que
continúen estas tendencias, dónde y a qué velocidad dominarán los escenarios de extinción de
especies y desafiarán los esfuerzos para proteger la biodiversidad.

Antes de la última década, la mayoría de las aplicaciones desarrollaban escenarios de extinción a


partir de suposiciones simples del cambio en el uso de la tierra como un impulsor principal de la
pérdida de biodiversidad, empleando la relación especie-área (14). Por ejemplo, Pimm y Raven
(60) proyectaron una extinción del 18% para el año 2100 debido a la deforestación hasta la fecha
en los hotspots de bosques tropicales y la extinción del 40% si estas regiones conservaran el
hábitat natural solo en las áreas actualmente protegidas.

Hasta hace poco, estos escenarios eran los únicos modelos empíricamente validados. Las
validaciones se centraron en vertebrados, a nivel mundial (61) o regional: el este de los Estados
Unidos (62), el Bosque Atlántico de América del Sur (63) y el sudeste insular de Asia (64). Hubo una
excelente correspondencia entre el número de especies pronosticadas para extinguirse y las que
lo hicieron (62) o, para la deforestación más reciente, con las amenazadas (61, 63, 64). Hay
discusiones sobre la teoría subyacente de tales estimaciones (65). No obstante, cuando se cuentan
todas las extinciones que pueden seguir a la deforestación (66), estas estimaciones son
conservativas.

La teoría predice que muchas más extinciones son posibles con una fragmentación severa del
hábitat (67), como confirman las observaciones (68).

La revisión de Pereira et al. Sobre las futuras extinciones proyectadas (69) clasificó y comparó
varios modelos. Sorprendentemente, los seis conjuntos de proyecciones pronosticaron un rango
cien veces mayor de tasas de extinción. Esto surgió de los diferentes factores considerados
(cambio de uso de la tierra, cambio climático o ambos), enfoques modelo, cobertura taxonómica y
escala geográfica. Dado este rango, existe una necesidad urgente de validación de proyecciones
contra extinciones documentadas hasta la fecha. Pocos estudios intentan esto. Aquí,
consideramos las perspectivas de dicha validación con los nuevos datos disponibles que pueden
reducir las incertidumbres.

La alteración del clima causará extinciones de especies, pero el rango de estimaciones es grande.
Thomas et al. (70) estimaron que entre el 15 y el 37% de varios taxones se comprometería a la
extinción en 2050 para un escenario de calentamiento de rango medio. Los estudios específicos
para aves estimaron que> 400 especies de aves terrestres de las 8750 estudiadas (4,6%)
experimentarán una reducción en el rango superior al 50% para el año 2050 (71). Para las aves
terrestres del hemisferio occidental, las estimaciones de extinción intermedias basadas en los
cambios proyectados inducidos por el clima en las distribuciones actuales oscilaron entre 1.3%
(calentamiento de 1.1 ° C) y 30% (calentamiento de 6.4 ° C) de las 3349 especies estudiadas (72).
Una evaluación global de las contracciones del rango inducido por el calentamiento esperado
estimó que 184 a 327 especies de aves montanas (de un total de 1009) perderían> 50% de su
rango y darían como resultado tamaños de rango de <20,000 km2 (73).

Cheung y otros (74) utilizaron un modelo climático global para predecir los cambios de rango, la
extinción y las intensidades de invasión basadas en el calentamiento del océano hasta 2050 para
1066 especies de peces e invertebrados marinos explotados. Predijeron que los movimientos de
rango hacia los polos conducirían a la extinción de especies en latitudes tropicales y subpolares de
4 y 7% respectivamente, con la mayoría de los reajustes de rango en el medio. Atribuyen las
menores probabilidades de extinción que en tierra (70) a una mayor libertad de movimiento en el
mar. Los mares cerrados, como el Mediterráneo, podrían atrapar grupos de especies endémicas
contra barreras insuperables (75). Tampoco consideraron ningún otro motor de extinción
potencial, como la acidificación de los océanos (76), la pesca excesiva (30) o la incapacidad de las
especies sésiles, como los corales empolladores, para moverse.
En la tierra, los efectos de la alteración del clima siguen sin estar claros por varias razones. Una
incertidumbre clave es si la perturbación del clima y la destrucción del hábitat dañan conjuntos
superpuestos de especies o especies muy diferentes, y pueden actuar de forma sinérgica. La
interrupción del clima parece ser una amenaza adicional (77). Algunos estudios combinan
explícitamente las proyecciones del área de la especie de la pérdida de especies para incorporar el
cambio climático como motor, a través de modelos de cambio de vegetación global (78), y
sugieren que el 12% de las especies se extinguirán. Otros estudios estiman que del 7 al 24% de las
especies de plantas (79) se extinguirán. Los impactos de la alteración climática son complejos. Un
metaanálisis comparó 188 pronosticados con 130 respuestas observadas de cambio climático y
sugirió que del 10 al 14% de las especies se extinguirían (80). Además, las interacciones de los
impulsores ambientales con rasgos biológicos intrínsecos (por ejemplo, rango geográfico, tamaño
corporal y tasa reproductiva) indican que las respuestas de las especies al aumento de la densidad
de la población humana serán cada vez más inciertas (81).

Otra novedad es que ninguno de los modelos de Pereira et al. (69) evaluó la viabilidad de la
población y la idoneidad del hábitat. Más bien, toman enfoques indirectos, como una fracción de
su rango actual, como en (70). Los enfoques que incorporan la viabilidad proporcionan bases
empíricas sólidas para estimar el riesgo de extinción (82). Sin embargo, algunos estudios
regionales los han empleado, incluido un estudio sobre Proteaceae de Sudáfrica (83).

Por encima de todo, hay pocas pruebas empíricas. Los métodos anteriores suponen que las
especies se mueven hacia el polo, a elevaciones más altas o a profundidades más profundas para
permanecer en sus envolturas climáticas. Usando repeticiones fortuitas de las encuestas
realizadas hace décadas, diversos estudios encuentran retrasos sustanciales en los movimientos
en pendiente ascendente de plantas (84), insectos (85) y aves (86). Estos cuestionan el destino de
las especies que ahora viven fuera de las envolturas del clima pasado. Además, los pocos estudios
que consideran las predicciones de cambios en los rangos geográficos desde el pasado hasta el
presente y luego los calibran con respecto a los rangos actuales no siempre encuentran
coincidencias convincentes (87).

Para las especies de agua dulce, la modificación directa e indirecta del hábitat, incluida la
contaminación (88) y la ya extensa y continua fragmentación y regulación del flujo de los ríos (89),
son claramente los principales impulsores de la extinción, especialmente para las especies con
capacidades limitadas de dispersión. Las alteraciones existentes en los sistemas de agua dulce
pueden ya haber comprometido la viabilidad de las especies en la medida en que ningún nivel de
protección futura pueda prevenir la extinción (90).

Las especies introducidas, incluidas las enfermedades, son una causa importante de extinción y la
causa principal de extinciones de aves recientes (37). Alrededor del 10% de las especies de plantas
son endémicas de islas lo suficientemente pequeñas como para que los herbívoros introducidos
sean una amenaza importante (59). No conocemos estimaciones de tasas de extinción de especies
introducidas. Dichas extinciones pueden desarrollarse de forma rápida e impredecible, como la
destrucción de la avifauna endémica de Guam por una serpiente introducida (91) y la destrucción
y posible extinción, principalmente por la perca del Nilo, de hasta 200 cíclidos de haplocromina del
Lago Victoria (36).
En resumen, hay pocas predicciones empíricamente probadas de futuras extinciones. Los
escenarios típicos consideran lo que se puede predecir: extinciones por deforestación o alteración
del clima, pero no procesos potencialmente importantes (enfermedades, especies introducidas o
cambios hidrológicos) que no se pueden modelar fácilmente.

¿Cómo la protección reducirá las tasas de extinción?

Entre las muchas incertidumbres a la hora de proyectar tasas de extinción futuras, una
especialmente importante es el efecto que las acciones de conservación podrían tener para
reducirlas (92). Por ejemplo, la velocidad a la que los mamíferos, aves y anfibios se han deslizado
hacia la extinción en las últimas cuatro décadas hubiera sido 20% mayor si no fuera por los
esfuerzos de conservación (32).

La destrucción de los hábitats naturales es la principal amenaza para las especies (13). Por lo tanto,
las áreas protegidas, aunque son diversas y difieren sustancialmente en sus propósitos y niveles de
protección (93), son esenciales para reducir las extinciones. La Meta 11 de Aichi busca la
protección de> 17% de los ecosistemas terrestres y de agua dulce "ecológicamente
representativos" y> 10% de los ecosistemas costeros y marinos (2), mientras que la Meta 4 de la
Estrategia Global para la Conservación de Plantas (GSPC) del CDB busca> 15% de Región ecológica
o tipo de vegetación ”(94).

En 2009, el 12.9% del área total de la tierra estaba bajo alguna protección legal, por encima del
<4% en 1985 (95). Las áreas protegidas están sesgadas hacia áreas donde hay poca presión
humana (96). La cobertura varía entre el 4% y el 25% de protección de 14 biomas terrestres
principales (96). De las 821 ecorregiones terrestres del mundo, la mitad tenía <10% de su área
protegida (96).

Qué tan bien estas áreas capturan especies dentro de sus límites ahora y en el futuro es un insumo
esencial para predecir las tasas de extinción futuras (50, 60). Rodrigues y otros (97) analizaron
rangos de mamíferos, aves, anfibios y tortugas amenazados combinados con la Base de datos
mundial sobre áreas protegidas (93). En general, el 27% de los anfibios amenazados, el 20% de las
aves amenazadas, el 14% de los mamíferos amenazados y el 10% de las tortugas amenazadas
viven fuera de las áreas protegidas. Los análisis subsiguientes han establecido objetivos de
representación escalados en proporción inversa al tamaño del rango (98); por ejemplo, 100% de
representación para especies con rangos <1000 km2, 10% de representación para rangos> 250,000
km2, y una interpolación lineal para especies intermedias. Solo ~ 46% de las aves, ~ 39% de los
mamíferos y ~ 19% de los anfibios alcanzan o superan sus objetivos (98).

Estos análisis de brechas globales son vulnerables a errores de comisión (las especies parecen
aparecer cuando no lo hacen) como resultado de la superposición de los mapas de especies de
resolución gruesa con los límites de áreas protegidas de alta resolución (99). Estos pueden generar
una falsa sensación de seguridad:

Las especies pensadas con seguridad representadas pueden extinguirse. Los enfoques alternativos
que aceptan errores de omisión más altos, aunque menos eficientes, son menos problemáticos.
Por lo tanto, para las aves, las áreas protegidas cubren solo el 49% de los sitios documentados que
albergan a toda la población de al menos una especie altamente amenazada (56) y solo el 51% de
los sitios de importancia mundial para las aves (100).
¿Las áreas protegidas funcionan? Ciertamente, algunos fallan completamente: incluso los grandes
parques nacionales en África occidental han perdido leones y muchas de sus presas (40). Para las
poblaciones de especies de agua dulce, la presencia dentro de las reservas no es garantía de
protección, dadas las amenazas externas como la modificación del flujo y la falta de una gestión
explícita de reservas para cumplir los objetivos de agua dulce (101). Los bosques protegidos
generalmente conservan su cubierta forestal (102), tienen muchos menos incendios
antropogénicos que las áreas no protegidas (103) y no atraen a su perímetro el crecimiento de la
población humana superior al esperado (104). La mayoría de los estudios no evalúan directamente
las poblaciones de plantas y animales, y los hábitats restantes a menudo son demasiado pequeños
o están muy explotados para retener a todas sus especies (105). Aquellos que hacen un
seguimiento de las especies revelan que las áreas protegidas producen resultados sustanciales
para prevenir las extinciones. A nivel mundial, las especies con> 50% de los sitios de especial
importancia para ellas protegidas se están deslizando hacia la extinción solo la mitad de las que
tienen <50% de sus sitios importantes protegidos (100).

La protección del océano se queda atrás en la tierra. Una evaluación de 2013 (106) informó ~
10,000 áreas marinas protegidas (AMP) que cubren el 2.3% de los océanos. La Meta 11 de Aichi
admite "otras medidas de conservación basadas en áreas efectivas", por lo que esta evaluación
incluyó grandes zonas de manejo de pesquerías cerradas a ciertas artes de pesca, incluidas algunas
en Nueva Inglaterra, Florida y Nueva Zelanda. Estos no se establecieron para la conservación de la
biodiversidad y, en el caso de Nueva Zelanda, fueron propuestos por la industria de pesca de
altura, evitando lugares importantes para la pesca (106). Una evaluación más conservadora (107)
estima una cobertura global del 1,8%.

Como en tierra, la cobertura del área marina protegida es desigual. Las reservas a menudo están
ausentes donde las amenazas a la biodiversidad son más altas, como las zonas de pesca y los
arrendamientos de petróleo y gas. Más allá de los límites de 200 millas náuticas de la jurisdicción
nacional, el 0.17% de las aguas abiertas están protegidas, en comparación con el 8% de las
plataformas continentales (106). Los arrecifes de coral costeros son los mejor protegidos, con un
18.7% dentro de áreas protegidas para 2006 (108). Sin embargo, solo el 2% de las AMPs se
consideraron de tamaño, administración, nivel de protección y conectividad adecuados. Los
movimientos para establecer sitios grandes y remotos como AMPs, como el Territorio Británico del
Océano Índico de los EE. UU., Han contribuido en gran medida al reciente crecimiento de la
protección, lo que sugiere que el objetivo de cobertura del 10% de Aichi podría ser alcanzable
(109). Las áreas marinas protegidas que no son aptas, bien aplicadas, viejas, grandes y aisladas por
aguas profundas o arena tienen un éxito desproporcionado en la retención de sus especies (110).

La Meta 11 de Aichi busca la protección del 17% de las tierras terrestres (2), mientras que el GSPC
busca proteger el 60% de las especies de plantas (94). ¿Ambos objetivos son posibles
simultáneamente? La concentración de especies de pequeño rango es tal que las tierras se
protegieron eficientemente para capturar la biodiversidad, el 17% así seleccionado abarcaría parte
de los rangos del 81% de las especies de plantas y todos los rangos del 67% (59). ¿Cómo podría la
predicción de que un 15% más de especies de plantas no están actualmente descritas cambiar
estas selecciones? Joppa et al. (111) utilizaron tasas de descripción de especies corregidas para el
esfuerzo taxonómico y predijeron que las especies no descritas estarán en las concentraciones
conocidas de especies con rangos pequeños, lo que dejará las prioridades actuales sin cambios.
Estas prioridades de plantas coinciden con las de los vertebrados terrestres. Alrededor del 89% de
las especies de aves, el 80% de los anfibios y el 74% de los mamíferos viven dentro de estas áreas
prioritarias para las plantas (59). Los porcentajes para las especies con rangos más pequeños que
la mediana son 88%, 82% y 73%, respectivamente (59). Con datos actualizados, estos resultados
capturan la observación de Myers et al. (58) de que la conservación de una gran fracción de
especies es posible en áreas limitadas si las autoridades eligen áreas protegidas que conocen qué
especies contienen (112). Las áreas de alta diversidad de peces de agua dulce coinciden con
algunas áreas de alta diversidad terrestre, pero tal congruencia no se puede asumir: las
excepciones incluyen los sistemas de agua dulce de alta diversidad de los deltas del Ganges y
Mekong (113) (Fig. 4). Además, la protección de las especies de agua dulce requiere la gestión de
los paisajes y el uso del agua más allá de las cercas de las reservas y en pozos más grandes (101).

Lo que sabemos, lo que no sabemos y cómo solucionar los vacíos

Sabemos lo suficiente como para ver que nuestra ignorancia sobre los números de las especies, las
distribuciones y el estado afecta en gran medida a las estadísticas clave de biodiversidad. Dos
ejemplos ilustran las consecuencias. Primero, alrededor del 20% de las plantas conocidas se
consideran amenazadas (114). Si se agrega el 15% previsto de especies no descritas, casi todas
serán raras y en lugares con gran pérdida de hábitat (36), se sugiere que el 30% de las especies de
plantas están amenazadas (6). La perturbación climática amenaza especies adicionales.

En segundo lugar, solo el 6,5% de las 632 especies de Conus están amenazadas. Otro 14% son
"deficientes en datos": no hay información suficiente para evaluar su estado, generalmente
porque son raros y tienen pequeños rangos geográficos (28). Si se conociera mejor el hecho de
considerarlos amenazados, el mapa de dónde se encuentran las especies amenazadas cambiaría
sustancialmente (Fig. 5). La inversión para extender la cobertura de la Lista Roja de la UICN a su
objetivo de 160,000 evaluaciones de especies es una prioridad (115). ¿Cuál es el progreso hacia un
mejor conocimiento y cuáles son las perspectivas de mejoras continuas? La Meta 19 de Aichi exige
que los datos sean "ampliamente compartidos". Los esfuerzos recientes en línea hacia este
objetivo incluyen el Fondo de Información de Biodiversidad Global (GBIF) (116), con 420 millones
de registros y 1.45 millones de nombres de especies y subespecies, y el Biogeográfico Oceánico
Sistema de información (117), con 38 millones de registros de 115,000 especies. Species 2000
busca crear una lista de verificación validada de todas las especies, y el Árbol de la Vida (118) y el
TimeTree (119) proporcionan relaciones filogenéticas.

Las comunidades de taxónomos ahora abordan el tedioso pero vital problema de la sinonimia y la
colocación de sus listas y decisiones taxonómicas en el dominio público. Las grandes bases de
datos incluyen el Registro mundial de especies marinas (120), que ha verificado el 95% de las
221,000 especies marinas, y FishBase, con 32,700 especies de peces (121). WCSPF (43) ha
evaluado actualmente ~ 110,000 especies de plantas (5).

Las nuevas tecnologías ayudan. El código de barras genético (122) ofrece la posibilidad de
identificar especies animales rápidamente por US $ 1 por muestra a partir de una secuencia de
ADN pequeña pero única. El código de barras para plantas es un poco más difícil. Para la gran
mayoría de las especies desconocidas en taxones animales con pocos especialistas taxonómicos,
este seguramente se convertirá en el método predominante para descubrir nuevas especies.
Plantea la idea controvertida de que muchas especies pueden llegar a ser conocidas por un
número derivado de códigos de barras y no, o no solo, de descripciones convencionales (123). El
potencial para encontrar nuevas especies y desenredar grupos de especies crípticas (124) también
se está realizando. Menos apreciado es que ahora es posible el código de barras rentable por lotes
de especies. Los nuevos y poderosos métodos estadísticos (125) estiman cuántas especies pueden
estar presentes en un área y cómo estas se superponen con otras muestras al aumentar los
esfuerzos de muestreo. Combinado con el código de barras por lotes, existe la promesa de
estimaciones rigurosas de qué fracciones de especies no descritas están presentes en áreas de
muestra deficiente, la forma más directa de estimar cuántas especies hay.

Incluso para las especies mapeadas, subsisten incertidumbres sustanciales. El mayor número
aparente de especies de vertebrados en América del Sur (fig. S1) está cerca de los centros de
investigación, al igual que muchos registros de GBIF. La consecuencia más importante de tener un
mapa de distribución de especies públicas es que desafía a los observadores a confirmarlo o
enmendarlo.

Aunque GBIF (116) es el repositorio de información en el que se alimentan otras fuentes, la


diversidad de esas fuentes merece comentarios. Incluyen organizaciones profesionales, como
Tropicos (126), con 4.2 millones de especímenes. El crecimiento más rápido en la comprensión de
las distribuciones de las especies proviene de un gran número de aficionados. Los observadores de
aves son los más numerosos: eBird (127) se convirtió en un depósito internacional en 2010 y ya
tiene más de 100,000 observadores y más de 100 millones de observaciones. Permite el mapeo a
escala fina y los cambios mes a mes en la distribución. Dicha riqueza de datos desvía las
evaluaciones de la biodiversidad (128), lo que motiva los esfuerzos para los taxones menos
populares.

Para ser útiles, las observaciones requieren identificaciones, y la identificación de organismos


requiere capacitación y habilidad. Los recientes avances en la tecnología para compartir fotos y las
redes sociales brindan nuevas oportunidades. Aplicaciones como iNaturalist (129) permiten la
división del trabajo entre observadores aficionados que cargan observaciones de campo
misteriosas desde teléfonos inteligentes e identificadores expertos que luego catalogan estas
observaciones de las fotos proporcionadas. La cooperación entre aficionados y expertos ahora
produce grandes volúmenes de datos de calidad para diversos taxones. iNaturalist ya ha registrado
más de medio millón de registros y se ha convertido en la aplicación preferida para incorporar
datos de fuentes múltiples en las encuestas nacionales de biodiversidad en México y en otros
lugares. El estudio Reef Life Survey está generando avances similares para la biodiversidad marina
(130).

Los datos de fuentes múltiples, especialmente cuando se incluyen datos sobre el esfuerzo de
muestreo, brindan oportunidades sustanciales para monitorear una amplia gama de especies a lo
largo del tiempo y en amplias áreas geográficas: exactamente los requisitos necesarios para
evaluar los diversos escenarios para una futura extinción

Los números y tipos de bases de datos en línea han aumentado dramáticamente en los últimos
años y continuarán haciéndolo. Las estimaciones globales de la cobertura terrestre a partir de
sensores remotos [p. Ej., (131)] se diversificaron con la apertura en 2009 del archivo Landsat del
Servicio Geológico de EE. UU. Y los esfuerzos subsiguientes para recopilar y calibrar depósitos
globales de imágenes de Landsat que se remontan a principios de los años 70 (132, 133) .
Aún más prometedor es la combinación de fuentes de datos. Los estudios ahora permiten realizar
evaluaciones detalladas del estado actual de las especies mediante el recorte de los mapas de
rango disponibles utilizando estimaciones de altitud remotas y hábitats restantes (134) y
conectando directamente a los modelos de metapoblación de rangos fragmentados (45). La Figura
6 proporciona un ejemplo de la medida en que las especies ' los rangos se han perdido y
fragmentado por la deforestación, y cuando esto sucedió. También muestra dónde queda el
bosque fuera de las áreas protegidas, cómo se ha perdido dentro de ellas y el potencial de los
datos de fuentes múltiples para monitorear las distribuciones de las especies.

EVOLUCIÓN DE LOS ENCUENTROS DE DARWIN Y SUS PUNTOS REVELADOS POR LA SECUENCIACIÓN


DE GENOMAS

Los pinzones de Darwin, que habitan el archipiélago de las Galápagos y la Isla del Coco,
constituyen un modelo icónico para los estudios de especiación y evolución adaptativa. Aquí
presentamos los resultados de la re-secuenciación del genoma completo de 120 individuos que
representan a todas las especies de pinzones de Darwin y dos parientes cercanos. El análisis
filogenético revela importantes discrepancias con la taxonomía basada en el fenotipo.
Encontramos amplia evidencia de flujo de genes interespecíficos a lo largo de la radiación. La
hibridación ha dado lugar a especies de ascendencia mixta. Un haplotipo de 240 kilobases que
abarca el gen ALX1 que codifica un factor de transcripción que afecta el desarrollo craneofacial
está fuertemente asociado con la diversidad de formas de pico en las especies de pinzón de
Darwin, así como en el pinzón terrestre medio (Geospiza fortis), una especie que ha
experimentado una rápida evolución de forma de pico. En respuesta a los cambios ambientales. El
haplotipo ALX1 ha contribuido a la diversificación de las formas del pico entre los pinzones de
Darwin y, por lo tanto, a una mayor utilización de los recursos alimentarios.

Las radiaciones adaptativas son particularmente informativas para comprender las bases
ecológicas y genéticas de la biodiversidad1,2. Esas causas se identifican mejor en las radiaciones
jóvenes, ya que representan las primeras etapas de la diversificación cuando las transiciones
fenotípicas entre las especies son pequeñas e interpretables y las extinciones probablemente sean
mínimas3. Los pinzones de Darwin son un ejemplo clásico de una radiación adaptativa tan
joven3,4. Se han diversificado en tamaños y formas de picos, hábitos de alimentación y dietas para
adaptarse a diferentes recursos alimenticios4,5 (Tabla de datos ampliada 1). La radiación está
totalmente intacta, a diferencia de la mayoría de las otras radiaciones, ninguna de las especies se
ha extinguido como resultado de las actividades humanas4.

Catorce de las especies actualmente reconocidas evolucionaron de un ancestro común en el


archipiélago de las Galápagos (Fig. 1a) en los últimos 1.5 millones de años según el ADN
mitocondrial (ADNmt) que data6; una decimoquinta especie habita en la isla de los cocos. La
radiación avanzó rápidamente como resultado del fuerte aislamiento del continente
sudamericano, la generación de nuevas islas por la actividad volcánica, las oscilaciones climáticas
causadas por el fenómeno de El Nin˜o y los cambios en el nivel del mar asociados con los ciclos
glaciares e interglaciales en el último millón de años. esto llevó a repetidas alternancias de
formación de islas y coalescencia7,8.

La taxonomía tradicional de los pinzones de Darwin se basa en la morfología3, y ha sido apoyada


en gran medida por observaciones de aves reproductoras4,5 y análisis genético6,9. Sin embargo,
el orden de ramificación de varios taxones recientemente divergidos no está resuelto6 y el análisis
genético de la filogenia se ha limitado a ADNmt y algunos loci de microsatélites. Algunos genes
candidatos para el desarrollo del pico se expresan diferencialmente en especies con diferentes
morfologías de pico10–12, pero los loci que controlan la variación genética en la diversidad del
pico entre los pinzones de Darwin aún no se han descubierto.

Aquí presentamos los resultados de la re-secuenciación del genoma completo de 120 individuos
que representan todas las especies de pinzones de Darwin y dos tanagers estrechamente
relacionados, Tiaris bicolor y Loxigilla noctis13. Para algunas especies recolectamos muestras de
múltiples islas (Fig. 1a). Analizamos exhaustivamente los patrones de diversidad genómica intra e
interespecífica y las relaciones filogenéticas entre las especies. Encontramos evidencia
generalizada de flujo de genes interespecíficos que puede haber mejorado la diversificación
evolutiva a lo largo de la filogenia, e informamos del descubrimiento de un lugar con un efecto
importante en la forma del pico.

Gran diversidad de nucleótidos.

Generamos una cobertura de secuencia de aproximadamente 103 por ave individual utilizando 2 3
100 pares de bases (pb) lecturas de extremos pareados (Datos extendidos, Fig. 1). Las lecturas se
alinearon con el ensamblaje del genoma de un pinzón de tierra mediano (G. fortis) 14.
Identificamos los andamios unidos por Z y W en función de las diferencias significativas en la
profundidad de lectura entre machos (ZZ) y hembras (ZW) (Tabla complementaria 1 ) y generó una
secuencia de ADNmt de G. fortis a través de una bioinformática combinada y un enfoque
experimental. El llamamiento a la variante estricta reveló aproximadamente 45 millones de sitios
variables dentro o entre poblaciones. Encontramos una cantidad considerable de diversidad
genética dentro de cada población, en el rango de 0,3 3 1023 a 2,2 3 1023 (Tabla de Datos
Extendidos 2), similar a la reportada en otras poblaciones de aves15, incluidas las poblaciones de
islas del pinzón de cebra16. Utilizamos estas estimaciones de diversidad para estimar los tamaños
efectivos de la población de las especies de pinzones de Darwin dentro de un rango de 6,000 a
60,000 (texto complementario). Se observó un amplio intercambio de variaciones genéticas entre
las poblaciones, en particular entre los pinzones del suelo y los árboles, casi sin diferencias fijas
entre las especies en cada grupo (Datos extendidos, Fig. 2)

Filogenia basada en el genoma

De acuerdo con la taxonomía clásica de los pinzones de Darwin, respaldados por datos
morfológicos y mitocondriales (citocromo b), los pinzones de warbler fueron los primeros en
ramificarse, y los pinzones de tierra y árboles constituyen la división principal más reciente3,6,9.
Nuestro árbol filogenético de máxima probabilidad basado en secuencias de genomas
autosómicos generalmente es consistente con la taxonomía actual, pero muestra varias
desviaciones interesantes (Fig. 1b). Primero, la Geospiza difficilis que ocurre en seis islas diferentes
forma un grupo polifilético separado en tres grupos distintos: (1) poblaciones que ocupan las
tierras altas de Pinta, Santiago y Fernandina, (2) poblaciones que ocupan las islas bajas de Wolf y
Darwin en el noroeste3,6 , 9 y (3) la población de Genovesa en el noreste. Esto es coherente con
una versión anterior de la taxonomía, en la que estos tres grupos se clasificaron como especies
distintas en función de las diferencias morfológicas17,18.
En segundo lugar, Geospiza conirostris en España mostró la mayor similitud genética con otra
especie, Geospiza magnirostris, mientras que G. conirostris en Genovesa se agrupó con Geospiza
scandens (Fig. 1b). Aquí, la similitud fenotípica es paralela a la similitud genética; G. conirostris en
Genovesa tiene un pico puntiagudo similar a G. scandens, mientras que los de Espan˜ola tienen un
pico romo más similar a los picos de G. magnirostris (Datos ampliados Fig. 3).

Una red construida a partir de secuencias autosómicas del genoma indica señales conflictivas en
las ramas internas de los pinzones del suelo y del árbol que pueden reflejar la clasificación
incompleta del linaje y / o el flujo de genes (Datos ampliados, Fig. 3). El orden de bifurcación
exacto de los pinzones de suelo y de árbol más recientemente evolucionados debe interpretarse
con precaución, ya que puede cambiar con un muestreo adicional. Dado que nuestros datos
revelaron algunas discrepancias importantes con la taxonomía basada en el fenotipo, proponemos
una taxonomía revisada para el pinzón de fondo afilado (G. difficilis) y el cactusfinch grande (G.
conirostris) (Texto suplementario y datos extendidos, Fig. 4) , pero utilizará los nombres actuales
en el texto.

Fechamos las divisiones filogenéticas sobre la base de la divergencia del genoma (Fig. 2a), y
comparamos estas estimaciones con las obtenidas mediante el mtDNA (datos ampliados Fig. 5a y
texto suplementario). Inferimos que la división más basal, entre pinzones de la curruca (Certhidea
sp .) y otros pinzones, ocurrieron hace unos 900.000 años. Las rápidas radiaciones de los pinzones
del suelo y de los árboles comenzaron hace unos 100.000-300.000 años. Aunque estas
estimaciones se basan en datos de todo el genoma, deberían considerarse tiempos mínimos, ya
que no tienen en cuenta el flujo genético.

Extenso flujo de genes interespecies

Las discrepancias entre las filogenias basadas en la morfología y las secuencias del genoma pueden
deberse a la evolución convergente y / o al flujo de genes entre especies. Encontramos evidencia
de introgresión de tres fuentes: pruebas ABBA-BABA, discrepancias entre árboles filogenéticos
basados en loci ligados al sexo y autosómicos, y mtDNA (Texto Suplementario y Datos Extendidos,
Fig. 5a).

Primero, se usó el estadístico19 asociado con la prueba ABBA-BABA para comparar dos
poblaciones de G. difficilis de Pinta y Wolf, y G.magnirostris de Genovesa, usando L. noctis como
grupo externo; G.magnirostris también ocurre en Wolf, pero nos faltaron muestras de esa
población. El análisis confirmó que G. difficilis en Wolf tiene una relación genética más cercana con
G. magnirostris que con G. difficilis en Pinta (Fig. 2b). Pero hay evidencia de flujo de genes entre G.
difficilis en Wolf y Pinta (P 5 5 3 102113), porque la asimetría sustancial en las relaciones genéticas
no puede explicarse por la clasificación incompleta del linaje. Sin embargo, la estadística D no
distingue la mezcla de la subdivisión ancestral19. Concluimos que las poblaciones de G
estrechamente relacionadas. difficilis en Wolf y Darwin son una especie de ascendencia mixta
donde la mayor parte del genoma se origina en G. magnirostris o un pariente cercano (Tabla
complementaria 2), mientras que una proporción considerable del genoma, posiblemente
incluyendo variantes genéticas que afectan caracteres fenotípicos, se deriva de G. difficilis. De
manera similar, G. difficilis en Genovesa muestra una relación genética más cercana con los
pinzones de otros suelos y árboles que con G. difficilis en Pinta, pero también encontramos
evidencia de flujo genético entre los dos grupos previamente clasificados como G. difficilis (P 5 3 3
10287 Tabla Suplementaria 2).

A continuación, investigamos el flujo de genes que afectan a las poblaciones de G. conirostris en


Genovesa y España, que aparecen como especies separadas en nuestro análisis filogenético. El
análisis ABBA-BABA confirmó que G. Conirostris en España muestra una relación genética más
cercana conG. magnirostristhan toG. conirostris en Genovesa (Datos ampliados, Fig. 6a), pero
también proporcionó pruebas del flujo de genes entre G. conirostris en Espan˜ola y G. conirostris
en Genovesa, lo que puede explicar algunas de sus similitudes fenotípicas y su clasificación previa
como una sola especie.

Dada la evidencia de una hibridación relativamente reciente, exploramos la posibilidad de una


hibridación más antigua entre pinzones de Reinita (Certhidea fusca y Certhidea olivacea) y otros
pinzones. El análisis ABBA - BABA proporcionó evidencia del flujo de genes entre C. fusca y los
otros pinzones (P 5 7 3 102199; Datos ampliados, Fig. 6b). Este patrón de flujo de genes fue
evidente para todos los pinzones no curanderos, lo que implica que ocurrió antes de la radiación
de los pinzones no curanderos (Tabla complementaria 2).

Los árboles basados en sitios autosómicos (Fig. 1b) y vinculados en Z (Datos ampliados Fig. 5b) no
son completamente congruentes. El árbol basado en polimorfismos ligados a Z indicó que G.
difficilis presente en las tierras altas de Pinta, Fernandina y Santiago está más estrechamente
relacionada con Platyspiza crassirostris y emergió antes de que el pinzón Cocos se separara del
suelo y los pinzones de los árboles, mientras que el árbol autosómico indica Un orden invertido
para el surgimiento de las dos especies. Esta discrepancia puede explicarse potencialmente por el
flujo de genes entre G. La difficilis y los pinzones de los árboles y del suelo después del pinzón de
Cocos se aislaron reproductivamente de los pinzones de las Galápagos, que afectaron a los loci
ligados a Z y autosómicos en diferentes grados. Es una observación común en especies
estrechamente relacionadas que hay más intercambio entre especies de polimorfismos de
secuencia en loci autosómicos que en loci 20 ligados al sexo. Esta interpretación del estado
filogenético de G. difficilis (grupo de tierras altas) está respaldada por los árboles basados tanto en
mtDNA como en W (Extended Data Fig. 5), lo que sugiere que G. difficilis divergió del antepasado
de otros pinzones de tierra y árboles antes La aparición del pinzón cocos.

Finalmente, nuestro análisis de la historia demográfica utilizando el modelo coalescente de


Markovian (PSMC) secuencialmente por pares21 fue consistente con un extenso flujo de genes
interespecies entre los pinzones terrestres, ya que han mantenido tamaños de población efectivos
más grandes que las otras especies (Texto Suplementario y Datos Extendidos, Fig. 6c, re).

Un lugar importante que controla la forma del pico.

La diferencia morfológica más notable entre los pinzones de Darwin se refiere a la forma del pico
(Datos extendidos, Fig. 3). Se realizó una exploración de todo el genoma en base a poblaciones
que están estrechamente relacionadas pero que muestran diferentes morfologías de pico: G.
magnirostris y g. conirostris en España tienen picos contundentes, mientras que G. conirostris en
Genovesa y G. difficilis en Wolf tienen picos puntiagudos. Usamos ventanas de 15 kilobases (kb) no
superpuestas para identificar regiones con los índices de fijación más altos (FST) entre grupos. La
distribución de FST se transformó en Z (ZFST) y se identificaron regiones con valores
sorprendentes de ZFST (Fig. 3a). Entre las 15 regiones más significativas, seis genes alojados
anteriormente asociados con mamíferos o aves con desarrollo craneofacial y / o pico, incluyendo
calmodulina (CALM) 11, homeobox goosecoid (GSC) 22, retinol deshidrogenasa 14 (RDH14) 23,
homeobox ALX1 (ALX1) 24,25, factor de crecimiento de fibroblastos 10 (FGF10) 26 y horquilla C1
(FOXC1) 27. Un estudio previo demostró la expresión diferencial de CALM entre pinzones con
diferentes tipos de pico11. Otros dos estudios informaron la expresión diferencial de la proteína
bonemorfogenética 4 (BMP4) 10,12, pero no observamos valores elevados de ZFST cerca de este
locus, lo que sugiere que la expresión diferencial está controlada por otros loci.

La búsqueda más sorprendente fue una región de 240 kb con valores altos de ZFST, incluida la
ventana con la puntuación más alta de ZFST (9.46) en general (Fig. 3a, b). La región se superpone a
parte de LRRIQ1 (repeticiones ricas en leucina y el motivo IQ que contiene 1), el gen ALX1
completo y aproximadamente 130 kb en sentido descendente de ALX1. Ningún informe anterior
indica que LRRIQ1 tiene un papel durante el desarrollo en vertebrados. Por el contrario, ALX1 es
un excelente candidato para la variación en la morfología del pico. Codifica una proteína de
homeodominio de tipo pareado que desempeña un papel crucial en el desarrollo de estructuras
derivadas del mesénquima craneofacial, el primer arco branquial y el brote de la extremidad24, y
en la migración de células de la cresta neural craneal, muy relevante para el desarrollo del pico25.
La pérdida de ALX1 en humanos causa la interrupción del desarrollo craneofacial temprano24.

Todos los individuos en la categoría de pico romo fueron homocigotos para un haplotipo asociado
con pico romo (denotado B), excepto un individuo heterocigoto de G. conirostris de España.
Además, a excepción de un ave heterocigota de Genovesa, todos los 19 individuos con G. difficilis
no incluidos en la exploración FST eran homocigotos para un haplotipo de pico puntiagudo (P),
consistente con su apariencia fenotípica (pinzones de tierra de pico afilado). Esto es notable
porque todo el genoma, G. difficilis en Wolf, Darwin y Genovesa están más estrechamente
relacionados con el G. magnirostris de pico romo que con el G. difficilis de Pinta (Fig. 2b).

Un árbol filogenético basado en esta región reveló una profunda divergencia entre los haplotipos
B y P que deben haber ocurrido poco después de la división entre los pinzones de la curruca y
otros pinzones de Darwin (Fig. 3c). Parte desde el pico romoG. magnirostris y g. Conirostris en
España, todos los individuos excepto tres eran homocigotos para los haplotipos de P, los tres
restantes eran heterocigotos. Los dos G. fortis de Daphne Major Island fueron homocigotos, pero
para diferentes haplotipos (BB y PP; Fig. 3c). Las longitudes de rama cortas entre los haplotipos B
son consistentes con un barrido selectivo. Hubo 335 diferencias fijas entre los haplotipos B y P (Fig.
3d, panel superior), que asignamos como derivados o ancestrales sobre la base de la comparación
con la secuencia del grupo externo (L. noctis). Los alelos derivados en el haplotipo B se agregaron
cerca de ALX1, incluida la región descendente (Fig. 3d, panel central). Además, 8 de estas 335
diferencias fijas ocurrieron en sitios conservados, y el haplotipo B llevó el alelo derivado a siete de
ellos (Fig. 3d, panel inferior). Cuatro alelos derivados se produjeron en sitios correspondientes a
los sitios de unión al factor de transcripción en el genoma humano28. Otros dos cambios
constituyen mutaciones de sentido erróneo (L112P y I208V) en los residuos de aminoácidos ALX1
que se encuentran altamente conservados entre aves y mamíferos (Datos extendidos, Fig. 7), y el
análisis de 'Clasificación de intolerantes de tolerantes' (SIFT) 29 clasificó a ambos como dañinos (
puntuación 0.03 para ambos). La proporción de sustituciones sinónimas y sinónimas entre los
alelos P y B es alta (2/1 5 2.00) en comparación con la proporción observada entre el alelo P
ancestral y el pinzón cebra ortólogo (2/14 5 0.14) y humano (21 / 122 5 0.17) secuencias, lo que
sugiere que una o ambas de estas mutaciones sin sentido no son neutrales.

El hecho de que ALX1 sea polimórfico en G. fortis (Fig. 3c, d, panel superior) es particularmente
interesante, ya que las observaciones de campo han demostrado que existe una diversidad
considerable en la forma del pico en esta especie5,30. Genotipamos un genotipo adicional de
62G.fortis aves de DaphneMajor Island para un diagnóstico de polimorfismo de un solo nucleótido
(SNP), y observamos una asociación significativa con la forma del pico (P 5 8.8 3 1025, Fig. 3e). Los
homocigotos PP solían tener picos puntiagudos proporcionalmente largos, los homocigotos BB
tenían picos contundentes proporcionalmente profundos, mientras que los heterocigotos (BP)
tenían formas de pico intermedio. También comparamos las frecuencias de haplotipos entre G.
fortisindividuals en Daphne Major Island con las de Santa Cruz, que tienen un pico más grande y
romo en promedio31, posiblemente como resultado de la hibridación introgresiva con G.
magnirostris4,5. Encontramos que el Bhaplotipo es más frecuente en Santa Cruz que en
DaphneMayor (0,74, n 5 21 versus 0,49, n 5 62; P 5 0,007, prueba exacta de Fisher).

La selección natural sobre el tamaño y la forma del pico de G. fortis en la isla Daphne Major ha
llevado a un cambio evolutivo en las últimas décadas5,30. Además, la variación genética en la
forma del pico se ha incrementado a través de la hibridación introgresiva5,30 con dos especies de
Geospiza, scandens y fuliginosa, que tienen picos relativamente puntiagudos. Por lo tanto,
esperamos que los híbridos y retrocruzamientos en la población de G. fortis tengan una frecuencia
relativamente alta del haplotipo P. Genotipamos un genotipo adicional de 25 G. fortis en ALX1, los
agregamos a la muestra de 62 (Métodos) y comparamos las frecuencias de haplotipos en ocho
híbridos (incluidos los retrocruzas) y 79 no híbridos. ALX1-P tuvo una frecuencia de 0.75 entre los
híbridos y 0.44 entre los demás, lo cual es estadísticamente significativo en la dirección esperada
(P = 0.03, prueba exacta de Fisher). Por lo tanto, los alelos ALX1-P introducidos por hibridación
introgresiva probablemente contribuyeron a la evolución de picos más puntiagudos en 1987
después de la selección natural como resultado de un cambio en el suministro de alimentos en la
sequía 1985–8630.

Discusión

Nuestra filogenia revisada y fechada de los pinzones de Darwin muestra que la radiación
adaptativa tuvo lugar en el último millón de años, con una rápida acumulación de especies
recientemente (Texto Suplementario). Hemos caracterizado genómicamente toda la radiación,
que ha revelado una conexión sorprendente entre la evolución pasada y presente. La evidencia de
hibridación introgresiva, que se ha documentado como un proceso contemporáneo, se encuentra
en toda la radiación. La hibridación ha dado lugar a especies de ascendencia mixta, en el pasado
(este estudio) y en el presente30. Ha influido en la evolución de un rasgo fenotípico clave: la forma
del pico. Se ha descrito una hibridación introgresiva similar que afecta un rasgo adaptativo
(mimetismo) en Heliconius butterflies32. El grado de continuidad entre la evolución histórica y la
contemporánea es inesperado porque la hibridación introgresiva no juega ningún papel en los
relatos tradicionales de las radiaciones adaptativas de los animales1,2. Para las radiaciones
jóvenes complementa el papel más conocido de la selección natural.

Charles Darwin observó por primera vez la diversidad de formas de pico entre los pinzones de las
Galápagos. Nuestro estudio genómico ahora ha revelado algunas de las variaciones genéticas
subyacentes que explican esta diversidad. El descubrimiento de unas 15 regiones con una fuerte
diferenciación genética entre grupos de pinzones con picos romos o puntiagudos indica una base
poligénica para la diversidad del pico. Presentamos evidencia de que el locus ALX1 contribuye a la
diversidad del pico, dentro y entre las especies. El haplotipo ALX1-B derivado asociado a los picos
romos tiene una larga historia evolutiva (cientos de miles de años), debido a que su origen es
anterior a la radiación de los pinzones vegetarianos, de árboles y de tierra (Fig. 3c). Este haplotipo
es fijo o casi fijo en dos pinzones terrestres con picos romos, G. magnirostris yG. conirostris en
Espan˜ola, y co-segrega con variación en la forma del pico en G. fortis. Como se documentó
previamente en animales domésticos33 y poblaciones naturales34, el haplotipo podría haber
evolucionado acumulando cambios en la codificación y regulatorios que afectan la función ALX1.
La selección natural y la introgresión que afectan a este lugar han contribuido a la diversificación
de las formas de los picos entre los pinzones de Darwin y, por lo tanto, a su mayor utilización de
los recursos alimenticios en las Galápagos.

También podría gustarte