Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCCIÓN
El libro de Charles Darwin Sobre el origen de las especies que apareció en Londres en 1859 (1) fue
el primer relato plausible y detallado de la evolución biológica publicado, junto con los breves
esbozos simultáneos e independientes de Darwin y Alfred Russell Wallace publicados el año
anterior (2 –3). Por supuesto, Darwin no descubrió la evolución y ni siquiera ofreció la primera
descripción coherente de la evolución; podría decirse que ese honor pertenece a Jean-Baptiste
Lamarck, cuya obra magna Philosophie Zoologique (4) se publicó, sin duda, en el año de
nacimiento de Darwin. Sin embargo, la imagen de la evolución de Lamarck se basó en un impulso
innato de los organismos en evolución hacia la perfección, una idea que no puede ser aceptable
para una mente racionalista. Además, Lamarck no proclamó el carácter universal de la evolución:
postuló múltiples actos de creación, aparentemente, uno para cada especie.
Darwin fue el primero en presentar una imagen racional, mecanicista y, posiblemente, magnífica
del origen de toda la diversidad de formas de vida "desde un comienzo tan simple",
probablemente, desde un único antepasado común (1). La visión de Darwin de la evolución de la
vida fue suficientemente completa y poderosa para ganar o, al menos, afectar profundamente a la
mente de la mayoría de los biólogos (y de los científicos en general, y del público educado en
general), de modo que toda la investigación en biología durante el último 150 años desarrollados
dentro del marco establecido por el Origen (incluso cuando se oponen a las ideas de Darwin). La
visión de Darwin carecía del fundamento esencial en la genética porque los mecanismos de la
herencia eran desconocidos en su época (el trabajo de Mendel pasó desapercibido, mientras que
las propias ideas de Darwin en esta área fueron menos productivas). La base genética de la
evolución se estableció después del redescubrimiento de las leyes de Mendel, con el desarrollo de
la genética de poblaciones en el primer tercio del siglo XX, principalmente, a través del trabajo
pionero de Fisher, Wright y Haldane (5–7). La nueva y avanzada comprensión de la evolución,
informada por el trabajo teórico y experimental en genética, se consolidó en la Síntesis Moderna
de la biología evolutiva, generalmente asociada con los nombres de Dobzhansky, Julius Huxley,
Mayr y Simpson (8–11). Aparentemente, la Síntesis Moderna (neoDarwinismo) adoptó su forma
madura durante la celebración del centenario de 1959 para el Origen en Chicago (12–14). Ahora,
50 años después de la consolidación de la Síntesis Moderna, la biología evolutiva sin duda se
enfrenta a un nuevo desafío importante y, al mismo tiempo, la perspectiva de un nuevo avance
conceptual (15). Si la síntesis moderna puede describirse sucintamente como darwinismo en la luz
de la genética (a menudo denominado neodarwinismo), entonces, la nueva etapa es la biología
evolutiva a la luz de la genómica. En este artículo, intento delinear los cambios a los principios
básicos de la biología evolutiva provocados por la genómica comparativa y funcional y sostengo
que, en muchos aspectos, la etapa genómica podría ser una desviación más radical del
neodarwinismo de lo que fue este último. del darwinismo clásico. Por supuesto, para hacerlo,
primero es necesario recapitular los conceptos principales de la evolución propuestos por Darwin
y enmendados por los arquitectos de la Síntesis Moderna. En el resto del artículo, vuelvo a cada
uno de estos puntos.
(i) La variación aleatoria no dirigida es el proceso principal que proporciona el material para la
evolución. Darwin fue el primero en permitir el azar como un factor importante en la historia de la
vida, y podría decirse que fue uno de sus mayores descubrimientos.
(ii) La evolución procede de la fijación de las raras variaciones beneficiosas y la eliminación de las
variaciones perjudiciales: este es el proceso de selección natural que, junto con la variación
aleatoria, es la principal fuerza motriz de la evolución según Darwin y la Síntesis Moderna. La
selección natural que es, obviamente, similar e inspirada por la "mano invisible" (del mercado) que
gobernaba la economía según Adam Smith, fue el primer mecanismo de evolución propuesto que
era simple, plausible y no requería ningún misterio. tendencias innatas. Como tal, esta fue la
segunda visión clave de Darwin. Los fundadores de la genética de poblaciones, en particular,
Sewall Wright, enfatizaron que el azar podría desempeñar un papel importante en la fijación de los
cambios durante la evolución, no solo en su aparición, a través del fenómeno de la deriva genética
que conlleva una fijación aleatoria de cambios neutros o incluso nocivos. La teoría de la población
genética indica que la deriva es particularmente importante en poblaciones pequeñas que
atraviesan cuellos de botella (6,16). Sin embargo, la Síntesis Moderna, en su forma "endurecida"
(13), efectivamente, rechazó la deriva como una fuerza evolutiva importante, y se adhirió a un
modelo de evolución puramente adaptacionista (17). Este modelo conduce inevitablemente al
concepto de "progreso", mejora gradual de "órganos" durante la evolución, una idea que Darwin
respaldó como una tendencia general, a pesar de su claro entendimiento de que los organismos
están menos que perfectamente adaptados, como lo demuestran los órganos rudimentarios. y a
pesar de su aborrecimiento de cualquier apariencia de un esfuerzo innato por la perfección de los
ilk lamarckianos.
(iii) Los cambios benéficos que son fi jados por la selección natural son “infinitamente pequeños”,
de modo que la evolución se produce a través de la acumulación gradual de estas pequeñas
modificaciones. Darwin insistió en el gradualismo estricto como un elemento esencial de su teoría:
«La selección natural puede actuar solo mediante la preservación y acumulación de
modificaciones hereditarias infinitamente pequeñas, cada beneficio para el ser conservado ... Si
pudiera demostrarse que existía algún órgano complejo, que no podría haber sido formada por
numerosas modificaciones sucesivas y leves, mi teoría se derrumbaría absolutamente. '[(1),
capítulo 6]. Incluso algunos contemporáneos de Darwin creían que era una restricción innecesaria
en la teoría. En particular, las primeras objeciones de Thomas Huxley son bien conocidas: incluso
antes de que la publicación de Origin Huxley escribiera a Darwin "Se ha cargado de una dificultad
innecesaria al adoptar Natura no facit saltum sin reservas" (18).
(iv) Un aspecto de la biología evolutiva clásica que se relaciona pero no es idéntico al gradualismo
de principios es el uniformismo (absorbido por Darwin de la geología de Lyell), es decir, la creencia
de que los procesos evolutivos se mantuvieron, esencialmente, los mismos a lo largo de la historia
de vida.
(v) La evolución de la vida se puede presentar como un "gran árbol", como se resume en la
ilustración única y famosa del Origen [(1), Capítulo 4].
(vi) Un corolario del concepto del árbol único de la vida (TOL) que, sin embargo, merece el estatus
de un principio separado: toda la diversidad existente de formas de vida evolucionó a partir de un
único ancestro común [o muy pocas formas ancestrales, bajo la cautelosa fórmula de Darwin (1),
capítulo 14] que mucho más tarde fue apodado el Último Ancestro (Celular) Universal Común
(LUCA) (19).
La filogenia tradicional que desató el concepto de TOL de Darwin se basó en comparaciones de las
características diagnósticas de la morfología de los organismos, como, por ejemplo, la estructura
del esqueleto en animales y la arquitectura de las flores en plantas (20). La idea de que el sustrato
molecular real de la evolución que experimenta los cambios a los que se enfrenta la selección
natural (los genes, en pocas palabras) podría compararse con el propósito de las reconstrucciones
de la filogenia no entró en la mente de los biólogos evolutivos por la razón obvia de que (al lado de
) no se sabía nada sobre la naturaleza química de ese sustrato y la forma en que codificaba el
fenotipo de un organismo. Además, el paradigma adaptacionista de la biología evolutiva parecía
implicar que los genes, independientemente de su naturaleza molecular, no se conservarían bien
entre organismos distantes, dadas las principales diferencias fenotípicas entre ellos, como enfatizó
en particular Mayr, uno de los principales arquitectos de la Síntesis Moderna (21).
La idea de que la secuencia de bases de ADN podría emplearse para la reconstrucción evolutiva
parece haber sido expresada por primera vez en forma impresa por Crick, adecuadamente, en el
mismo artículo seminal donde formuló la hipótesis del adaptador (22). Los principios reales y la
primera implementación del análisis evolutivo molecular fueron dados unos años más tarde por
Zuckerkandl y Pauling, quienes falsificaron directamente la conjetura de Mayr al mostrar que las
secuencias de aminoácidos de varias proteínas disponibles en ese momento, como el citocromo c
y las globinas, Muy conservado incluso entre animales distantes (23,24). Zuckerkandl y Pauling
también propusieron el concepto de reloj molecular, una tasa de evolución relativamente
constante de la secuencia que predijeron que sería característica de cada proteína en ausencia de
cambio funcional. En los próximos años, principalmente, a través de los esfuerzos de Dayho y sus
colaboradores, se ha demostrado que la conservación de secuencias de proteínas se extiende a las
formas de vida más diversas, desde bacterias hasta mamíferos (25–27).
Podría decirse que el avance conceptual más importante en biología evolutiva después de la
Síntesis Moderna fue la teoría neutral de la evolución molecular que generalmente se asocia con
el nombre de Kimura (35,36) aunque una teoría similar fue desarrollada de forma simultánea e
independiente por Jukes y King (37). ). Originalmente, la teoría neutral se derivó como un
desarrollo de las ideas genéticas de la población de Wright sobre la importancia de la deriva
genética en la evolución. Según la teoría neutral, una mayoría sustancial de las mutaciones que se
fijan en el curso de la evolución son selectivamente neutrales, de modo que la fijación se produce
a través de la deriva aleatoria. Un corolario de esta teoría es que las secuencias de genes
evolucionan aproximadamente en forma de reloj (en apoyo de la hipótesis del reloj molecular
original de Zuckerkandl y Pauling), mientras que las mutaciones bene fi ciosas episódicas sujetas a
selección natural son lo suficientemente raras como para que se las pueda descartar de forma
segura para una descripción cuantitativa del proceso evolutivo. Por supuesto, la teoría neutral no
debe tomarse para significar que la selección no es importante para la evolución. Lo que la teoría
sostiene en realidad es que el modo de selección dominante no es la selección darwiniana positiva
de mutaciones adaptativas, sino la selección estabilizadora o purificadora que elimina las
mutaciones deletéreas mientras permite la fijación de mutaciones neutrales por deriva (17).
Los estudios subsiguientes refinaron la teoría y la hicieron más realista en el sentido de que, para
ser corregidos, una mutación no necesita ser literalmente neutral, sino que solo debe ejercer un
efecto perjudicial que sea lo suficientemente pequeño como para escapar de la eliminación
eficiente mediante la purificación de la selección; La teoría (38). Las mutaciones que se "ven" al
purificar la selección como nocivas críticamente dependen del tamaño de las poblaciones
efectivas: en poblaciones pequeñas, la deriva puede arreglar incluso mutaciones con un efecto
deletéreo significativo (16). La principal prueba empírica de la teoría (casi) neutral proviene de las
mediciones de la constancia de las tasas evolutivas en las familias de genes. Aunque se observó
repetidamente que el reloj molecular está significativamente dispersado en exceso (39,40), tales
pruebas sugieren fuertemente que la fracción de mutaciones neutrales entre las fi jadas es, de
hecho, sustancial (36). La teoría (casi) neutral es una desviación importante del paradigma
seleccionista de Síntesis Moderna, ya que postula explícitamente que la mayoría de las mutaciones
fijadas durante la evolución no se ven afectadas por la selección darwiniana (positiva) (Darwin
parece haber presagiado el paradigma neutralista al señalar que selectivamente los caracteres
neutrales servirían mejor para propósitos de clasificación (1); sin embargo, no dio más detalles
sobre esta idea y no se ha convertido en parte de la Síntesis Moderna).
Es importante destacar que en las elaboraciones posteriores de la teoría neutral, Kimura y otros se
dieron cuenta de que las mutaciones que eran (casi) neutrales en el momento de la fijación no
eran indiferentes a la evolución. Por el contrario, tales mutaciones comprendieron el grupo de
variación que puede ser aprovechado por la selección natural en condiciones cambiadas, un
fenómeno que podría ser potencialmente importante para la macroevolución (17,41).
Aunque esto rara vez se estableció explícitamente, la genética clásica ciertamente implica que
(casi) todas las partes del genoma (todos los nucleótidos en términos moleculares más modernos)
tienen una función específica. Sin embargo, esta comprensión implícita se puso en duda en los
años 60 y 70 debido a la acumulación de datos sobre la falta de una correspondencia directa entre
la complejidad genómica y fenotípica de los organismos. Se demostró que los organismos de
aproximadamente la misma complejidad fenotípica a menudo tenían genomas que diferían en
tamaño y complejidad en órdenes de magnitud (la llamada paradoja del valor c) (42,43). Esta
paradoja fue resuelta conceptualmente por dos ideas fundamentales relacionadas, las de los
genes del ego y el ADN basura. El concepto del gen del ego fue desarrollado por primera vez por
Dawkins en su libro clásico del mismo nombre (44). Dawkins se dio cuenta, en una sorprendente
desviación del paradigma centrado en el organismo de la Síntesis Moderna, de que la selección
natural podía actuar no solo a nivel del organismo en su conjunto sino también a nivel de un gen
individual. Bajo una formulación algo provocativa de esta visión, el genoma y el organismo son,
simplemente, vehículos para la propagación de genes. Este concepto fue avanzado por Doolittle y
Sapienza (45), y por Orgel y Crick (46), quienes propusieron que gran parte del ADN genómico (al
menos, en organismos complejos) consistía en varias clases de repeticiones que se originan. a
partir de la replicación de elementos del mar (parásitos finales, según Orgel y Crick). En otras
palabras, desde el punto de vista del organismo, gran parte de su ADN genómico debe
considerarse basura. Esta visión del genoma difiere dramáticamente de la imagen implícita en el
paradigma seleccionista según el cual la mayoría, si no todos, los nucleótidos en el genoma se
verían afectados por la selección (purificadora o positiva) que actúa a nivel del organismo. Un
desarrollo importante relacionado conceptualmente fue el descubrimiento, primero en plantas
por McClintock en la década de 1940 (47), y posteriormente, en animales (48), de "genes
saltarines", más tarde conocidos como elementos móviles, es decir, elementos genéticos que eran
propensos. A menudo cambian su posición en el genoma. La demostración de la ubicuidad de los
elementos móviles sugería la imagen de genomas altamente dinámicos, genomas siempre
cambiantes incluso antes del advenimiento de la genómica moderna (49,50).
el potencial para desarrollar una nueva función (un fenómeno que luego se denomina
neofuncionalización). Claramente, la aparición de un nuevo gen como resultado de una
duplicación, y mucho menos la duplicación de una región genómica que incluye múltiples genes o
la duplicación del genoma completo, está lejos de ser cambios "infinitos", y si eventos tan grandes
son realmente importantes para la evolución, El paradigma gradualista entra en peligro.
Gould y Lewontin montaron una crítica radical del programa adaptacionista de biología evolutiva
en el famoso documento "Spandrels of San Marco" (53). Gould y Lewontin describieron
sarcásticamente a la cosmovisión adaptacionista como el paradigma panglossiano, después del
famoso personaje de la Candide de Voltaire, quien insistió en que "todo fue mejor en el mejor de
los mundos" (incluso los desastres más grandes). Gould y Lewontin enfatizaron que, en lugar de
apresurarse a inventar "justamente" historias de adaptaciones plausibles, los biólogos evolutivos
deberían buscar explicaciones de las características observadas de la organización biológica bajo
un enfoque pluralista que tenga en cuenta no solo la selección sino también las restricciones
intrínsecas, la deriva aleatoria y otros factores. La metáfora de los spandrel sostiene que muchos
elementos funcionalmente importantes de la organización biológica no evolucionaron como
dispositivos específicos para realizar sus funciones actuales, sino que son productos de
restricciones arquitectónicas no adaptativas, como los spandrel que inevitablemente aparecen en
los arcos de las catedrales y otros edificios. Ser empleado para diversas funciones, como la
vivienda elementos clave de las imágenes que adornan la catedral. El proceso de utilización de
spandrels para funciones biológicas recibió el nombre de exaptación especial y fue propuesto por
Gould como una importante ruta de evolución (54).
Quizás, el desarrollo en biología que tuvo el efecto más profundo en los cambios en nuestra
comprensión de la evolución fue la extensión de la investigación evolutiva en el ámbito de las
bacterias (y las arqueas) y los virus. El relato de la evolución de Darwin y todos los desarrollos en
biología evolutiva en las siguientes décadas trataron exclusivamente con animales y plantas, con
eucariotas (Protista) y bacterias (Monera) unicelulares colocadas nominalmente cerca de la raíz
del TOL por Haeckel y sus sucesores (56) . Aunque en la década de 1950, el análisis genético de
bacteriófagos y bacterias estaba muy avanzado, lo que hace evidente que estas formas de vida
tenían genomas en evolución (57), la Síntesis Moderna no notó estos desarrollos. Que las bacterias
(y mucho menos los virus) evolucionen bajo los mismos principios y por los mismos mecanismos
que los animales y las plantas, no es de ninguna manera evidente dadas todas sus sorprendentes
diferencias biológicas de organismos multicelulares, y específicamente, porque carecen de la
reproducción sexual regular y el aislamiento reproductivo. Eso es crucial para la especiación en
animales y plantas.
Efectivamente, los procariotas se hicieron "visibles" para los biólogos evolutivos en 1977, con el
innovador trabajo de Woese y sus colegas sobre la filogenia de ARNr que condujo a la
identificación de arqueas y los principales grupos de bacterias (28,29,58). Poco después, el campo
de la genómica comparativa y evolutiva nació a medida que se disponía de múltiples secuencias
genómicas completas de diversos virus pequeños. A pesar de la rápida evolución de la secuencia
que es característica de los virus, esta investigación genómica comparativa temprana tuvo éxito en
la delineación de conjuntos de genes que se conservan en grandes grupos de virus (59–62).
Además, se hizo evidente un principio general: mientras que algunos genes se conservaban a
través de una sorprendente variedad de virus, las arquitecturas genómicas, las estructuras
viriónicas y las características biológicas de los virus mostraban una plasticidad mucho mayor, por
lo que el intercambio de genes, incluso entre virus muy diferentes, surgió como una Factor
importante de la evolución (62).
Endosimbiosis
Más allá de la genómica y la metagenómica, uno de los distintivos de la primera década del nuevo
milenio es el progreso de la investigación en genómica funcional y biología de sistemas. Estos
campos ahora producen datos genómicos de alta calidad sobre la expresión de genes,
interacciones genéticas y proteína-proteína, localización de proteínas dentro de las células y más,
abriendo nuevas dimensiones del análisis evolutivo, lo que a veces se llama Biología de Sistemas
Evolutivos (80–82). Este nuevo campo de investigación tiene el potencial de proporcionar
información sobre las conexiones de todo el genoma entre la evolución de la secuencia y otras
variables, como la tasa de expresión, y para iluminar los componentes selectivos y neutros de la
evolución de estos aspectos del funcionamiento del genoma.
A continuación, intento sintetizar brevemente las ideas principales de la genómica evolutiva, con
énfasis en las formas en que estos nuevos hallazgos afectan los principios centrales de la biología
evolutiva, en particular, con respecto a las contribuciones relativas de los procesos aleatorios
selectivos y neutrales.
Una observación fundamental apoyada por todo el cuerpo de evidencia acumulada por la
genómica evolutiva es que las secuencias y estructuras de los genes que codifican proteínas y ARN
estructurales están, en general, altamente conservadas a través de vastos tramos evolutivos. Con
la presente colección de genomas secuenciados, se encuentran ortólogos en taxones distantes
para la mayoría sustancial de las proteínas codificadas en cada genoma (83). Por ejemplo, la
secuenciación reciente del genoma de animales primitivos, la anémona de mar y Trichoplax, reveló
una conservación extensa del repertorio genético en comparación con los mamíferos o aves, con
la implicación de que la vida útil característica de un gen animal incluye (al menos) cientos de
millones de años ( 84–86). Los resultados de un extenso análisis comparativo de genomas de
plantas, hongos y procariotas son totalmente compatibles con esta conclusión (87,83). Además,
las reconstrucciones evolutivas profundas sugieren que los antepasados de cientos de genes
existentes ya estaban presentes en LUCA (88-92). Las reconstrucciones conservadoras de los
conjuntos de genes de los ancestros comunes de los dos dominios de procariotas, bacterias y
arqueas, parecen indicar que estas formas ancestrales que, probablemente, existieron hace más
de 3 mil millones de años, eran comparables en complejidad genética, al menos, a la Más simple
de los procariontes de vida libre modernos (88,93). Desde una perspectiva de la biología evolutiva,
parece que las secuencias de muchos genes que codifican las funciones celulares centrales,
especialmente la traducción, la transcripción, la replicación y las vías metabólicas centrales, están
sujetas a una fuerte selección purificadora que se mantuvo durante largos intervalos de tiempo,
en muchas ocasiones, A lo largo de los 3.500 millones de años de historia de la vida celular.
Incluso en mayor medida que la composición génica de los genomas, la arquitectura del genoma,
es decir, la disposición de los genes en un genoma muestra inestabilidad evolutiva en comparación
con las secuencias genéticas (99). Con la excepción de la organización de pequeños grupos de
genes vinculados funcionalmente en operones que, en algunos casos, son compartidos por
bacterias y arqueas relacionadas de manera distante, en parte, probablemente, debido a la gran
cantidad de HGT (ver más abajo), hay, en general, relativamente poca conservación del orden
genético incluso entre organismos estrechamente relacionados (100,101). En particular, en
procariotas, la conservación a largo plazo del orden de los genes desaparece completamente
incluso en algunos grupos de genomas estrechamente relacionados que conservan una
correspondencia casi uno a uno de genes ortólogos y más del 99% de identidad de secuencia
media entre proteínas ortólogas (75). Así, en
procariotas, la organización de genes más allá del nivel de los operones está determinada, en su
mayoría, por un extenso proceso aleatorio, en particular, a través de inversiones centradas en el
origen de la replicación (75,102,103). Los eucariotas muestran una conservación algo mayor de la
sintenia genómica de largo alcance pero, incluso en este caso, hay pocos elementos compartidos
de la arquitectura del genoma entre, por ejemplo, diferentes filos animales, y ninguno entre los
diferentes reinos (99).
La variabilidad de las arquitecturas genómicas presenta un dilema interesante para los biólogos
evolutivos: ¿los organismos poseen arquitecturas genómicas únicas que están específicamente
adaptadas para satisfacer las demandas funcionales únicas de los organismos respectivos, o es la
evolución de la arquitectura genómica un proceso mayormente neutral? A pesar de que se
observó repetidamente la agrupación local de genes relacionados funcionalmente y otros
patrones sugestivos de coexpresión génica funcionalmente relevantes, estas tendencias son
relativamente débiles y de ninguna manera ubicuas (104,105). Por lo tanto, el factor dominante en
la evolución de la arquitectura del genoma parece ser un cambio aleatorio, no adaptativo en lugar
de una selección purificadora o positiva.
Incluso mucho antes de la era genómica, los microbiólogos se dieron cuenta de que las bacterias
tenían la capacidad de intercambiar información genética a través de la HGT, en algunos casos,
produciendo resultados de gran importancia, como la resistencia a los antibióticos (106). Se han
dilucidado múltiples mecanismos moleculares de HGT, incluido el intercambio de plásmidos, la
transducción (HGT mediada por bacteriófagos) y la transformación (107). A pesar de estos
descubrimientos, el HGT fue visto generalmente como un fenómeno menor que es importante
solo en circunstancias especiales y, en cualquier caso, no se consideró que pusiera en peligro el
concepto de TOL que podría ser reconstruido por el análisis filogenético del rRNA y otros genes
conservados. Esta creencia fundamental fue cuestionada por los primeros resultados de las
comparaciones genómicas de bacterias y arqueas que indicaron que, al menos, en algunos
genomas procarióticos, una importante fracción de genes se adquirió a través de HGT
demostrable. Las islas de patogenicidad y las islas de simbiosis similares que comprenden más del
30% del genoma en muchas bacterias patógenas y simbióticas son el principal ejemplo (108-110).
Además, el análisis comparativo de los genomas de las bacterias hipertermofílicas y las arqueas
sugirió que incluso el HGT entre dominios puede ser extenso dado hábitats compartidos (111,112).
Puede ser difícil demostrar el HGT de forma inequívoca, y en particular, diferenciarse de la pérdida
extensa de genes, por lo que aún se discute el alcance de la movilidad genética horizontal entre
procariotas (113-115). Sin embargo, a medida que la base de datos genómica crece, los análisis
extensivos comparativos-genómicos y filogenéticos conducen cada vez más a la conclusión de que
el HGT es prácticamente omnipresente en el mundo procariótico en el sentido de que hay muy
pocos conjuntos de genes ortólogos, si es que hay alguno, cuya historia esté libre de HGT (116,117
). La tasa de HGT difiere sustancialmente para diferentes genes dependiendo de las funciones de
los genes, en parte, de acuerdo con la llamada hipótesis de complejidad que postula que podrían
existir barreras para el HGT de genes que codifican subunidades de complejos de proteínas debido
a un desequilibrio de la dosificación y la mezcla de subunidades heterólogas resultantes de Tales
eventos podrían ser perjudiciales (118,119). Sin embargo, los análisis filogenéticos indican que
incluso dichos genes, por ejemplo, los de las proteínas ribosómicas y las subunidades de la ARN
polimerasa, no son inmunes al HGT (120-122).
Los eucariotas son diferentes de los procariotas con respecto al papel desempeñado por HGT en la
evolución del genoma. En los eucariotas multicelulares, donde las células de la línea germinal son
distintas del soma, el HGT parece ser raro (125) aunque no imposible (126). En ciertas
circunstancias especiales, como la persistencia de bacterias endosimbióticas en animales, la
transferencia de grandes segmentos de genomas bacterianos al genoma del huésped es
ciertamente común (127,128). Los eucariotas unicelulares parecen adquirir genes bacterianos e
intercambiar genes entre ellos en ocasiones relativamente frecuentes (129-131). Mucho más
crucial, sin embargo, es la principal contribución de los genomas de los endosimbiontes a los
complementos genéticos de todos los eucariotas. El descubrimiento de orgánulos similares a las
mitocondrias y genes de origen mitocondrial aparente en todos los eucariotas unicelulares bien
caracterizados, esencialmente, establece que el último ancestro común de los eucariotas
existentes ya poseía el endosimbionte mitocondrial (132,133). En términos de su aparente
afinidad filogenética, los genes eucarióticos que poseen ortólogos procarióticos fácilmente
identificables se dividen marcadamente en genes de probable origen arqueal (principalmente,
pero no exclusivamente, componentes de sistemas de procesamiento de información) y aquellos
de probable origen bacteriano (en su mayoría, enzima metabólica y componentes de diversas
estructuras celulares) (134,135). A menudo se asume que, en general, la mayoría de los genes
"bacterianos" ancestrales en los eucariotas son de origen mitocondrial, pero esto es difícil de
demostrar directamente porque, en el análisis filogenético, estos genes se agrupan con diversos
grupos de bacterias (134). Estos hallazgos son difíciles de interpretar porque la composición génica
del endosimbionte y su huésped no se conocen, y es posible que uno o ambos hayan acumulado
numerosos genes de diversas fuentes (136). Un punto de incertidumbre aún mayor es el escenario
real del origen de los eucariotas [una discusión detallada de este tema principal está fuera del
alcance de este artículo; consulte revisiones y discusiones recientes (133,137–140)]. En pocas
palabras, las hipótesis competitivas y debatidas son las siguientes:
Las observaciones de HGT extensas, ubicuas y que se producen a través de múltiples rutas
descritas anteriormente conducen a una generalización fundamental: los genomas de todas las
formas de vida son colecciones de genes con diversas historias evolutivas. El corolario de esta
generalización es que el concepto TOL debe revisarse o abandonarse sustancialmente debido a
que una sola topología de árbol o incluso topologías congruentes de árboles para varios genes
altamente conservados no pueden representar la historia de todos o incluso la mayoría de los
genes (146–149). ). Por lo tanto, una representación adecuada de la historia de la vida es una red
de intercambios genéticos en lugar de un solo árbol, y en consecuencia, la hipótesis TOL "fuerte",
es decir, la existencia de un "árbol de especies" para toda la historia de la vida celular, se falsifica.
Por los resultados de la genómica comparativa.
Ciertamente, esta conclusión no debe tomarse como una indicación de que el concepto de árbol
evolutivo introducido por Darwin (1) debe abandonarse por completo. Primero, los árboles tienen
el potencial de representar con precisión la evolución de familias de genes individuales. En
segundo lugar, existen, sin lugar a dudas, partes expansivas de la historia de la vida para las cuales
se pueden obtener árboles congruentes para grandes conjuntos de genes ortólogos y, por
consiguiente, la topología de consenso de estos árboles se califica como un árbol de especies. La
evolución de los principales grupos de eucariotas, como los animales o las plantas, es el caso más
obvio, pero la evolución similar a un árbol parece aplicarse también a muchos grupos de
procariotas a profundidades filogenéticas relativamente poco profundas. La pregunta sigue abierta
si la evolución de la vida en su totalidad se describe mejor como:
(i) un árbol de consenso de genes altamente conservados que representa una "tendencia central"
en la evolución, con eventos de HGT, incluidos los masivos asociados con la endosimbiosis, que
comprenden conexiones horizontales entre las ramas de los árboles [Figura 1A; (150)], o
(ii) una red compleja donde las fases de la evolución similar a un árbol (con conexiones
horizontales) se entremezclan con las fases del "Big Bang" de un intercambio horizontal rampante
de información genética que no puede representarse en principio como árboles [Figura 1B; (151)].
Los virus y varios otros replicones automáticos (definidos como elementos genéticos que no
codifican un sistema de traducción completo), como diversos plásmidos y transposones,
comprenden un grupo genético interconectado que se conoce de forma diversa como el
mobilome, la virosfera o el mundo de los virus (76,162– 164). La identidad del mundo de los virus
se manifiesta en la existencia de un conjunto de "genes distintivos" que codifican proteínas con
funciones clave en la reproducción de los elementos del ego (incluidas las proteínas de la cápside
viral) y están presentes en elementos extremadamente diversos que se propagan en una amplia
variedad de hospedadores, pero no en formas de vida celulares. La existencia de un conjunto
distinto de genes distintivos que incluye, entre otros, ARN y ADN polimerasa dependientes de
ARN, enzimas de replicación que, probablemente, son anteriores al genoma de ADN grande,
sugiere fuertemente que el mundo del virus coexiste con formas de vida celular a lo largo de su
historia, y posiblemente, incluso se origina a partir de un conjunto primordial, precelular de
elementos genéticos (164).
Aunque distinto, el mundo viral interactúa constantemente con el grupo genómico de formas de
vida celular, como lo demuestra el movimiento constante de genes entre bacteriófagos
transductores, plásmidos y cromosomas bacterianos (83), o la captura de genes celulares
(protooncogenes) por retrovirus animales ( 165). Las observaciones recientes de la transferencia
de genes mediada por bacteriófagos entre bacterias relacionadas distantes, incluso sin la
propagación de fagos en el organismo receptor, sugieren que el flujo de genes mediado por
replicones egoístas podría ser más extenso de lo que se sospecha hasta ahora (166). Es importante
destacar que las partes de los elementos móviles con frecuencia son reclutadas (eliminadas) por
los genes hospedadores como elementos reguladores (167,168) y, en algunos casos, partes de
secuencias de codificación de proteínas (169). Los casos individuales de exaptación de genes
completos de elementos móviles también se conocen como ejemplificados sorprendentemente
por la evolución del gen hedgehog, un regulador clave del desarrollo animal, a partir de una
inteína (170,171).
Todos los genomas procariotas, sin excepción, contienen trazas de integración de múltiples
plásmidos y fagos. Incluso de manera más reveladora, los genomas arqueales suelen tener varias
versiones de un operón que codifica componentes clave de la maquinaria de partición de
plásmidos y, a menudo, poseen más de un origen de replicación (172). Por lo tanto, la fusión de
distintos replicones parece ocurrir rutinariamente en procariotas, y en el transcurso de la
evolución, dicha fusión podría haber sido un factor importante en la configuración de la
arquitectura observada de los cromosomas procarióticos (83,173).
La naturaleza del Último Ancestro Común Universal y las primeras transiciones evolutivas La
genómica comparativa reivindica la conjetura de Darwin sobre el origen de todas las formas de
vida existentes de un único antepasado común. De hecho, las reconstrucciones evolutivas sugieren
que cientos de genes conservados, muy probablemente, se remontan a LUCA (88,89–91). Más
específicamente, estas reconstrucciones indican que LUCA ya poseía un sistema completo de
traducción que no era dramáticamente diferente de (al menos) las versiones más simples de la
maquinaria de traducción moderna (es decir, que consistía de aproximadamente 100 moléculas de
ARN y proteínas) como el sistema de transcripción central y varias vías metabólicas centrales,
como las de la biosíntesis de nucleótidos de purina y pirimidina (90). Sin embargo, los conjuntos de
genes asignados a LUCA en estas reconstrucciones carecen de ciertos componentes esenciales de
la maquinaria celular moderna. En particular, los componentes centrales de la maquinaria de
replicación del ADN son no homólogos (o, al menos, no ortólogos) en bacterias, por un lado, y en
arqueas y eucariotas, por otro lado (176). En otra brecha aguda, los lípidos de la membrana tienen
estructuras distintas y, por consiguiente, las enzimas de biogénesis de la membrana no son
homólogas (no ortólogas) (177).
Estos vacíos principales en el conjunto de genes reconstruidos de LUCA apoyan la idea de que
diferentes sistemas celulares "cristalizaron" de forma asíncrona y sugieren "transiciones de fase"
en las fases iniciales de la evolución celular (151,178). Una clase de hipótesis sostiene que LUCA
era radicalmente diferente de las células modernas, posiblemente, no una célula en absoluto, sino
más bien un conjunto de elementos genéticos que empleaban diversas estrategias de replicación y
expresión, y podrían haber poblado compartimentos inorgánicos como los que se ven en los
respiraderos hidrotermales ( 179,180). Bajo estos escenarios, los sistemas y las membranas de
replicación de ADN de tipo moderno evolucionaron al menos dos veces de manera independiente
en dos dominios de la vida (suponiendo un origen simbiogenético para los eucariotas). En este
caso, el concepto mismo de un LUCA distinto se vuelve ambiguo, y podría ser más apropiado
hablar de LUCAS, el último estado ancestral común universal (181). La clase alternativa de
escenarios postula que LUCA era una célula de tipo moderno con las variedades arqueas o
bacterianas de los sistemas de replicación de ADN y las membranas, o incluso los sistemas mixtos
(177,182). Esta clase de escenarios implica que hubo cambios de un tipo a otro en la evolución de
cada uno de estos sistemas celulares clave o pérdida diferencial de los genes respectivos.
Cuantificación de la selección y del ADN basura en todo el genoma: regímenes evolutivos distintos
para genomas diferentes
Hay diferencias importantes en los diseños del genoma entre diferentes líneas de evolución de la
vida. Los procariotas y, especialmente, los virus tienen genomas 'de pared a pared' que consisten,
principalmente, de genes que codifican proteínas y ARN estructurales, con regiones no
codificantes que comprenden, con algunas excepciones, no más del 10-15% de los genómicos
ADN. Los genomas de eucariotas unicelulares tienen densidades de genes características más
bajas pero, en general, no se alejan demasiado de los principios procarióticos, con la mayor parte
del ADN dedicado a la codificación de proteínas, a pesar de la arquitectura distinta del gen intrón-
exón. Los genomas de los eucariotas multicelulares son drásticamente diferentes, ya que solo una
minoría (una pequeña minoría en los vertebrados) del ADN genómico está compuesta por
secuencias que codifican proteínas o ARN estructurales. En general, en toda la gama de formas de
vida, existe una notable dependencia exponencial negativa entre la densidad de los genes
codificadores de proteínas y el tamaño del genoma, aunque también se observan desviaciones
significativas de esta dependencia general, particularmente en procariotas (Figura 2).
Esta dramática diferencia en la organización del genoma entre los genomas de (la mayoría) de los
organismos unicelulares y multicelulares exige una explicación, y la más simple y plausible está
dada por la teoría de la población genética, según la cual la intensidad de la selección purificadora
que afecta a una población es proporcional a la población. Tamaño efectivo de la población. La
fijación de secuencias no codificantes, como intrones o elementos móviles es, en el mejor de los
casos, neutral pero, más probablemente, al menos, algo perjudicial, aunque solo sea por la carga
adicional sobre la maquinaria de replicación. Por lo tanto, la acumulación extensa de tales
secuencias es posible solo en poblaciones relativamente pequeñas en las que la intensidad de la
selección purificadora cae por debajo del "umbral de complejificación". Más específicamente, la
teoría predice que todas las mutaciones con coeficiente (s) de selección menos de 10–6 se
acumularían como neutrales en genomas de eucariotas multicelulares, y muchos casos de
inserción de secuencias no codificantes se asocian con valores tan bajos (16,183,184) .
Teniendo en cuenta el estudio a escala del genoma de la evolución, la siguiente serie de preguntas
importantes tiene que ver con la distribución de los coeficientes de selección entre genomas: la
cantidad de ADN no codificante es realmente basura, ¿cuál es la presión de la selección
purificadora en diferentes genes, ¿Y cuán común es realmente la selección positiva (darwiniana)?
Aunque la medición de la selección de genes individuales, y mucho menos los sitios individuales,
especialmente en regiones no codificantes es técnicamente difícil (185,186), se han informado
varios análisis de todo el genoma. Un análisis exhaustivo del conjunto de proteínas humanas que
combinó datos sobre mutaciones patógenas, SNP no sinónimos y divergencia en ortólogos de
chimpancé humanos llevó a la estimación de que solo el 12% de los residuos de aminoácidos están
asociados con s <10–5, mientras que aproximadamente la mitad de los sitios tienen valores entre
10–4 y 10–2 (187). Por lo tanto, la mayoría de las secuencias de proteínas parecen estar sujetas a
una selección purificadora sustancial. Un estudio complementario sobre los regímenes de
evolución de múltiples grupos de bacterias y arqueas estrechamente relacionadas también reveló
una selección purificadora típicamente fuerte, con las medias genómicas amplias de las relaciones
dN / dS (la proporción de tasas de sustitución de nucleótidos no sinónimos a sinónimos, que es la
tradicional medida de selección en secuencias codificantes de proteínas) entre 0.02 y 0.2 (dN / dS
<< 1 es la firma de selección purificadora) (75).
Una búsqueda en todo el genoma de selección positiva (medida como la relación dN / dS gen-
específica) en genes codificantes de proteínas de seis especies de mamíferos reveló 400 genes
(2,5%) que parecen haber experimentado una selección positiva en al menos una rama de la
filogenética árbol de las especies analizadas; los valores para la mayoría de las ramas individuales
eran muy pequeños (188). Estas estimaciones, aunque conservadoras, muestran que, al menos, en
los mamíferos, la selección positiva que afecta a la secuencia génica completa es bastante rara,
aunque muchos genes que, en general, están sujetos a una selección purificadora probablemente
incluyan sitios seleccionados positivamente. Los análisis exhaustivos de los sitios de codificación
de aminoácidos en 12 genomas de Drosophila arrojaron resultados muy diferentes, lo que sugiere
que una fracción sustancial y, quizás, la mayoría de los reemplazos de aminoácidos se deben a la
selección positiva, aunque los efectos beneficiosos de la mayoría de estos reemplazos parecen ser
Bastante pequeño (189,190). En particular, la distribución de sitios seleccionados positivamente
no es aleatoria entre las categorías funcionales de genes, ya que los genes involucrados en la
inmunidad y otras funciones de defensa, la reproducción y la percepción sensorial son
particularmente susceptibles de selección positiva; esta distribución parecía ser estable entre
animales muy diferentes, incluyendo mamíferos, moscas y nematodos (188,189,191).
Una pregunta candente en los estudios evolutivos de todo el genoma, especialmente, para los
mamíferos con sus genomas enormes, qué fracción del ADN no codificante es basura "real" y
cuánto está sujeta a restricciones funcionales aún desconocidas. La posibilidad de que, a pesar de
la falta de conservación evolutiva detectable, una gran fracción si no la mayoría del ADN humano
es, de hecho, funcionalmente importante y, por lo tanto, mantenida por selección a menudo se
discute, especialmente, a la luz de las demostraciones de que un gran número de Se transcribe la
fracción del genoma (192–194). El descubrimiento de las llamadas secuencias ultraconservadas
que parecen estar sujetas a una selección purificadora excepcionalmente fuerte (195,196) es
compatible con esta idea. Además, una fracción considerable del ADN "basura" podría estar
involucrada en roles funcionales que conllevan solo una conservación limitada de la secuencia,
pero sin embargo son importantes, en particular, para el mantenimiento y remodelación de la
estructura de la cromatina, como las regiones de unión de la matriz / sca ff old (SARs / MARs) (
197,198). Sin embargo, un análisis reciente de todo el genoma de la distribución de la inserción y
las deleciones (en comparaciones de genomas humanos, de ratón y de perro) sugiere que solo el
3% del ADN de eucromatina humana está bajo restricciones selectivas (199). Dado que las
secuencias de codificación proteica comprenden solo el 1.2% de la eucromatina, estos resultados
indican que la mayoría de las secuencias de ADN funcionalmente importantes en los mamíferos no
codifican proteínas, sino que también reivindican las conjeturas iniciales de que la mayor parte del
genoma humano no es funcional, es decir, Después de todo, basura (45,46). Por supuesto, debe
tenerse en cuenta que cualquier definición de basura está condicionada a que la basura de ayer se
pueda reclutar para un papel funcional. En contraste, las comparaciones entre especies de
regiones genómicas no codificantes en Drosophila indican que la mayoría (70% o más de los
nucleótidos) de estas secuencias evolucionan bajo restricciones selectivas, y una fracción
significativa (hasta el 20%) parece ser afectada por aspectos positivos. selección (200–202).
Ciertamente, estos estudios se basan en diferentes supuestos simplificadores (que no pueden
discutirse aquí en detalle), por lo que la conclusión sobre diferencias importantes en regímenes
selectivos entre diferentes linajes debe evaluarse con cautela y está sujeta a validación adicional.
Sin embargo, el hecho mismo de que los organismos con tamaños comparables de los conjuntos
de genes y los niveles de complejidad organizativa, como los insectos, por un lado, y los
mamíferos, por otro lado, difiere tan dramáticamente en términos de densidad de genes y la
cantidad de la "basura" genómica aparente (Figura 2) sugiere que sus genomas evolucionan bajo
diferentes presiones selectivas.
Teniendo en cuenta la amplia aparición de WGD en múltiples linajes eucariotas, es notable que
hasta el momento no se hayan detectado tales eventos mediante el análisis de los numerosos
genomas procarióticos disponibles, aunque se observó repetidamente poliploidía transitoria
(227,228). Posiblemente, la ausencia de WGD detectable en procariotas se debe a la selección
purificadora eficiente que actúa en una gran población procariótica (ver más abajo) y conduce a la
eliminación rápida de genes duplicados que borrarán los rastros de WGD en caso de que ocurra tal
evento.
Sin lugar a dudas, los eucariotas multicelulares, como los animales y las plantas, se caracterizan
por una complejidad organizacional mucho mayor que las formas de vida unicelulares, y en el
espíritu de la Síntesis Moderna, esta complejidad se ve generalmente como resultado de
numerosos cambios adaptativos impulsados por la selección natural. y, al ser considerado así,
puede verse como una manifestación del "progreso" en la evolución. La correspondencia entre la
complejidad organizativa y la complejidad genómica es un tema abierto, en parte, porque la
complejidad genómica no es fácil de definir. Una definición simple y plausible puede ser el número
de nucleótidos que transportan información funcionalmente relevante, es decir, están ectados por
selección (229,230). Bajo esta definición, los genomas de los eucariotas multicelulares, por
supuesto, son mucho más complejos que los genomas de formas unicelulares, y esta mayor
complejidad genómica se traduce también en complejidad funcional.
De hecho, se demostró que los genomas ricos en intrones típicamente poseen señales de
empalme débiles, mientras que los genomas pobres en intrones (en su mayoría, los de eucariotas
unicelulares) tienen uniones de empalme estrechas, probablemente, lo que garantiza una alta
fidelidad de empalme (235). Recientes estudios detallados demostraron una baja fidelidad al
empalme en los organismos ricos en intrones, de modo que se producen numerosas variantes mal
empalmadas y, en su mayoría, se destruyen por el sistema de decaimiento mediado sin sentido
(NMD) (236). Las reconstrucciones evolutivas sugieren fuertemente que los eucariotas antiguos,
incluido el último ancestro común de las formas existentes, poseían altas densidades de intrones
comparables a las de los genomas modernos más intrínsecos, como los vertebrados (237–239) y,
por inferencia, tenían señales de empalme débiles que producían numerosas transcripciones
alternativas (235). La conservación de la maquinaria NMD en todos los eucariotas (240) es
totalmente compatible con esta hipótesis. Por lo tanto, parece que el empalme alternativo surgió
como un "defecto genómico" del cual los organismos respectivos no pudieron deshacerse,
presumiblemente, debido a una selección purificadora débil, y desarrollaron un mecanismo
especial para enfrentarlo, a saber, la NMD. Poco a poco, también desarrollaron formas de utilizar
este spandrel para múltiples funciones.
La explicación anterior del origen del empalme alternativo podría resumir la teoría genética
poblacional no evolucionista de la evolución de la complejidad genómica que fue recientemente
expuesta por Lynch (16,183,184). Como ya se mencionó en la sección anterior, el principio central
de la teoría es que los cambios genéticos que conducen a un aumento de la complejidad, como las
duplicaciones de genes o las inserciones de intrones, son ligeramente perjudiciales y, por lo tanto,
se pueden corregir a una velocidad apreciable solo cuando se purifica la selección. En una
población es débil. Por lo tanto, dado que la fuerza de la selección purificadora es proporcional al
tamaño efectivo de la población, solo es posible un aumento sustancial de la complejidad
genómica durante los cuellos de botella de la población. Bajo este concepto, la complejidad
genómica no es, originalmente, adaptativa, sino que es provocada por procesos evolutivos neutros
cuando la selección purificadora no es efectiva. En otras palabras, la complejificación comienza
como un "síndrome genómico", aunque las características complejas (spandrels) posteriormente
se cooptan para varias funciones y quedan sujetas a selección. Por el contrario, en poblaciones
altamente exitosas, como las de muchos procariotas, la selección purificadora es tan intensa que
no es posible aumentar la complejidad genómica y, de hecho, la contracción del genoma es más
probable.
Por supuesto, hay excepciones a estos principios, como los genomas bacterianos con más de
12000 genes (241), los genomas virales con proliferación extensa de genes duplicados (158) y los
genomas de eucariotas unicelulares [p. Ej. Chlamydomonas (242) o Trichomonas (243)] que, según
la mayoría de los criterios, son tan complejos como los genomas de animales o plantas
multicelulares. Además, algunos genomas procarióticos [por ejemplo, el crenarchaeon Sulfolobus
solfataricus (244)] y los genomas de eucariotas unicelulares [p. ej. Trichomonas vaginalis (243)] se
encuentra entre las personas con mayor contenido de elementos transponibles. Aparentemente,
el resultado de la evolución del genoma depende del equilibrio entre la presión de la selección
purificadora, el mismo dependiente del tamaño de la población y la tasa de mutación, la
intensidad de los procesos de recombinación, la actividad de los elementos del ego y la adaptación
a hábitats específicos (99). Un atractivo
La siguiente gran pregunta que se debe hacer con respecto a la complejidad, tanto organizativa
como genómica, es: ¿hubo una tendencia constante hacia el aumento de la complejidad durante
los 3.500 millones de años de evolución de la vida en la Tierra? La respuesta más probable es, no.
Incluso las reconstrucciones muy conservadoras de genomas ancestrales de arqueas y bacterias
indican que estos genomas eran comparables en tamaño y complejidad a los de formas modernas
relativamente simples (88,89,91,93). Además, las reconstrucciones para algunos grupos
individuales, y no solo para los parásitos, apuntan a la pérdida de genes y al encogimiento del
genoma como el modo de evolución predominante (249). Teniendo en cuenta que numerosos
grupos procarióticos, sin duda, se han extinguido en el curso de la historia de la vida, hay razones
para creer que, incluso antes de la radiación de todos los principales linajes conocidos en la
actualidad, la distribución de los tamaños del genoma y la complejidad media en procariotas fue
(casi ) lo mismo que es ahora. Por supuesto, es concebible que las formas más complejas
conocidas evolucionaran relativamente tarde en la evolución pero, de ser así, podrían explicarse
por procesos puramente estocásticos, dado que la vida, en las etapas previas a LUCAS de su
evolución, debe han comenzado 'desde un comienzo tan simple' (1250)
Al igual que la última década del siglo XX fue la época de la genómica cuando la cantidad de
secuencias del genoma se transformó en una nueva calidad, lo que permitió una generalización
novedosa, como el 'desarraigo' del TOL, la primera década del nuevo siglo se convirtió en la era De
genómica funcional y biología de sistemas. Estas disciplinas produjeron datos cada vez más fiables
de un nuevo tipo que comienzan a llenar la brecha previamente evidente entre el genoma y el
fenotipo de un organismo (en lo sucesivo, variables fenómicas). Las variables fenómicas incluyen
perfiles genómicos de niveles de expresión génica, mapas completos de proteína-proteína e
interacciones genéticas, información sobre los efectos de la inactivación de genes (la capacidad de
dispensación de genes, típicamente, se define como la esencialidad de un gen para el crecimiento
en medios ricos), y más (81,82). Los primeros análisis comparativos que se hicieron posibles
cuando se disponía de información suficiente sobre la expresión génica para múltiples organismos
revelaron una interacción entre procesos neutrales y selectivos. Si bien los niveles de expresión
entre los genes ortólogos en humanos y ratones muestran una conservación significativa (en
comparación con los pares de genes aleatorios), la divergencia en la expresión es más pronunciada
que entre las secuencias de proteínas de los ortólogos (251,252). Por lo tanto, aunque, en
términos generales, la evolución de la expresión génica es similar a la evolución de la secuencia, ya
que la selección purificadora es la fuerza limitante principal (253), el componente genuinamente
neutral y sin restricciones probablemente contribuya más a la evolución de la expresión.
Este hallazgo se ve reforzado por las observaciones de una correlación positiva entre la
divergencia de secuencias y la divergencia de los perfiles de expresión entre los genes ortólogos
humanos y de ratón (252) y las tasas comparativamente bajas de divergencia de perfiles de
expresión en genes altamente expresados (262).
La aparición del vínculo entre la tasa de evolución de la secuencia como la conexión más
prominente entre la variable evolutiva y la variable fenómica condujo a un nuevo concepto de los
principales determinantes de la evolución de la proteína. En la era pregenómica, generalmente se
asumió que la tasa de evolución de la secuencia debería ser una función de, en primer lugar, las
restricciones estructural-funcionales intrínsecas que afectan a la proteína dada y, en segundo
lugar, la importancia del papel biológico de la proteína en el organismo ( 256). Con el
advenimiento de los datos de biología de sistemas, se observó que las variables fenómicas, en
particular, la expresión génica podrían ser igual o incluso más importantes que los factores
tradicionalmente considerados (263,264). Esta realización condujo a la hipótesis de Mdransflexión
inducida por plegado incorrecto (MIM) según el nivel de expresión o, más precisamente, la tasa de
eventos de traducción es de hecho el determinante dominante de la tasa de evolución de la
secuencia. Se cree que la causa de la covariación entre la tasa de evolución de la secuencia y el
nivel de expresión es la selección de la resistencia al plegamiento incorrecto de proteínas, que es
cada vez más importante para las proteínas altamente expresadas debido a los efectos tóxicos de
las proteínas mal plegadas (265,266). La hipótesis MIM podría explicar adicionalmente la
correlación positiva bastante desconcertante pero consistente y fuerte entre las tasas de
evolución en posiciones sinónimas y no sinónimas (dN y dS, respectivamente) de secuencias
codificantes de proteínas (267). De hecho, es probable que esta correlación sea una consecuencia
de la lenta evolución en ambas clases de sitios en genes altamente expresados que, en el caso de
sitios sinónimos, probablemente se deba a la selección de codones que minimizan la mala
traducción (268,269). Simulaciones por computadora detalladas de la evolución de la proteína
sugieren que el efecto tóxico de la plegamiento incorrecto de la proteína, de hecho, podría
justificar la explicación de la covariación observada del nivel de expresión y la tasa de evolución de
la secuencia (269). Un análisis de la evolución de las proteínas multidominio reveló una
homogeneización sustancial de las tasas evolutivas específicas del dominio en comparación con el
mismo par de dominios en proteínas separadas, posiblemente atribuibles a las tasas de traducción
igualadas, pero diferencias significativas entre las tasas de evolución específicas del dominio
persistieron incluso en Proteínas multidominio (270). Por lo tanto, la hipótesis MIM generalizada
según la cual la tasa de evolución de la proteína, principalmente, depende de dos factores:
(i) Robustez intrínseca del plegado incorrecto que depende de la estabilidad y designabilidad
características de la proteína (dominio) dada.
(ii) Tasa de conversión que puede verse como un amplificador del costo de adecuación del plegado
incorrecto y, en consecuencia, de la selección de la robustez de la mala incorporación de
aminoácidos.
La biología de los sistemas evolutivos reveló una nueva capa de conexiones entre la evolución y el
funcionamiento del genoma. Es cada vez más claro que los procesos que vinculan el genoma y el
fenotipo de un organismo, en particular, la expresión génica ejercen una retroalimentación
sustancial sobre la evolución de los genes. La tasa de evolución de los genes codificantes de
proteínas podría depender más de las restricciones relacionadas con la prevención de efectos
nocivos de plegado incorrecto que de las restricciones asociadas con la función específica de la
proteína.
La escala diferencial de las clases funcionales de genes con el tamaño del genoma que se
menciona anteriormente sugiere la existencia de un conjunto completo de constantes
fundamentales de la evolución. Las relaciones entre las tasas de duplicación y las tasas de
eliminación de genes que determinan los exponentes de las leyes de poder para cada clase de
genes parecen ser las mismas para todos los linajes probados de procariotas e invariantes con
respecto al tiempo, por lo que las clases funcionales de genes parecen poseer 'Potenciales
evolutivos' universales (245,273).
CONCLUSIONES
Dos siglos después del nacimiento de Darwin, 150 años después de la publicación de su 'Origen de
las especies', y 50 años después de la consolidación de la Síntesis moderna, el análisis comparativo
de cientos de genomas de muchos taxones diversos ofrece oportunidades sin precedentes para
probar las conjeturas de ) Darwinismo y desciframiento de los mecanismos de evolución. La
genómica comparativa reveló una sorprendente diversidad de procesos evolutivos que era
inimaginable en la era pre-genómica. Además de las mutaciones puntuales que se pueden
equiparar con los 'cambios infinitosimales' de Darwin, la evolución del genoma implica
contribuciones importantes de duplicaciones genéticas y genómicas completas, grandes
eliminaciones que incluyen la pérdida de genes o grupos de genes, transferencia horizontal de
genes y regiones genómicas completas, varios tipos de reordenamientos genómicos, e interacción
entre genomas de formas de vida celulares y diversos elementos genéticos del ego. El paisaje
emergente de la evolución del genoma incluye el clásico, la selección natural darwiniana como un
componente importante, pero es mucho más pluralista y complejo de lo que conlleva la visión
directa de Darwin que se solidificó en la Síntesis Moderna (16,184). La mayoría de las secuencias
en todos los genomas evolucionan bajo la presión de la selección purificadora o, en los organismos
con los genomas más grandes, de manera neutral, con solo una pequeña fracción de mutaciones
en realidad beneficiosas y fijas por la selección natural como lo imaginó Darwin. Además, las
contribuciones relativas de las diferentes fuerzas evolutivas varían enormemente entre los linajes
del organismo, principalmente debido a las diferencias en la estructura de la población.
La Tabla 1 describe el estado de los principios centrales de la biología evolutiva clásica en la era de
la genómica evolutiva y la biología de sistemas. Todos los conceptos clásicos han sufrido una
transformación, convirtiéndose en caracterizaciones más complejas y pluralistas del proceso
evolutivo (15). Al representar el cambio en los trazos más anchos posibles, la información
primordial de Darwin sobre la interacción entre el azar y el orden (introducida por la selección
natural) sobrevivió, incluso en una forma nueva, mucho más compleja y matizada, con
contribuciones especí fi cas de diferentes tipos de procesos aleatorios y Se revelan distintos tipos
de selección. En contraste, la insistencia en la adaptación como modo principal de evolución que
se manifiesta en el Origen, pero especialmente en la Síntesis Moderna, se volvió profundamente
sospechosa, si no completamente obsoleta, dejando espacio para una nueva cosmovisión que le
da mucho más protagonismo a la no adaptativa. procesos (184).
Más allá de la asombrosa e inesperada diversidad de la organización del genoma y los modos de
evolución revelados por la genómica comparativa, ¿hay alguna posibilidad de descubrir principios
generales subyacentes? O, ¿es el único principio de este tipo el papel central del azar y la
contingencia en la evolución, elegantemente captado por Jacob (55) en su fórmula de "evolución
como retoques"? De una manera un tanto irónica, uno se inclina a preguntar: ¿es concebible una
síntesis posmoderna y, quizás, incluso a la vista?
Varios desarrollos recientes en la genómica evolutiva pueden ser candidatos para los roles de
generalizaciones de alto nivel que subyacen a la diversidad de los procesos evolutivos. Quizás, el
de mayor alcance de estos es el concepto genético poblacional de la evolución del genoma
desarrollado por Lynch (16). De acuerdo con este concepto, las características principales de los
genomas no están conformadas por la adaptación sino por procesos evolutivos estocásticos que
dependen críticamente de la intensidad de la selección purificadora, lo que, a su vez, está
determinado por el tamaño efectivo de la población y la tasa de mutación de los organismos
respectivos. . En particular, la complejidad de los genomas de los eucariotas multicelulares se
interpreta como evolucionando, principalmente, no como una adaptación que garantiza la
complejidad organizativa y funcional, sino como un "síndrome genómico" causado por una
selección purificadora ine fi ciente en poblaciones pequeñas. Algunos de los elementos de
secuencia acumulados a través de procesos neutros se reclutan para funciones biológicas que
colectivamente, de hecho, proporcionan la evolución de organismos estructuralmente y
funcionalmente complejos. A la inversa, los genomas compactos de procariotas y algunos
eucariotas unicelulares pueden no estar conformados por selección por "racionalización del
genoma", sino más bien por una mejoría efectiva incluso de secuencias ligeramente nocivas en
grandes poblaciones (83). La visión no adaptativa de la evolución de la complejidad genómica de
ninguna manera implica que no haya características complejas que evolucionen nunca como
adaptaciones directas o que la racionalización del genoma nunca pueda ser una fuerza impulsora
importante de la evolución del genoma. Sin embargo, creo que la evidencia acumulada por la
genómica evolutiva es suficiente para requerir el cambio de la hipótesis nula central de la
evolución del genoma de adaptacionista a neutral, con la carga de la prueba trasladada a los
adeptos de la adaptación generalizada (230)
El concepto del carácter sustancialmente no adaptativo de la evolución del genoma parece afectar
nuestra comprensión básica del significado de la conservación de las características genómicas.
Como ejemplo, la conservación bastante enigmática de las posiciones de una gran fracción de las
posiciones de los intrones a lo largo de la evolución de los eucariotas podría no ser una
consecuencia de una fuerte selección purificadora que causaría la eliminación de variantes en las
que se perdieron los respectivos intrones (el valor predeterminado es interpretación implícita por
la noción misma de selección purificadora y totalmente compatible con la teoría neutral). Por el
contrario, la conservación de intrones y otras características genómicas sin funciones obvias
podría ser la consecuencia de una selección purificadora débil en pequeñas poblaciones de
organismos complejos que es insuficiente para eliminar estos elementos de manera eficiente. Esto
no significa que muchos caracteres genómicos (como los genes individuales, los residuos de
aminoácidos o los nucleótidos) no se conserven durante la evolución debido a su importancia
funcional, sino que sugieren que incluso este "sagrado", principio central de la biología evolutiva ...
Lo que se conserva es funcionalmente relevante ", no es un absoluto, y la alternativa no
adaptativa debe tomarse en serio. Junto con la comprensión de que la contracción del genoma es
al menos tan común en la evolución como la expansión del genoma, y el aumento de la
complejidad genómica no es una tendencia evolutiva central, el concepto de evolución del
genoma no adaptativo implica que la idea del progreso evolutivo puede ponerse a salvo.
descansar.
A veces se argumenta que los desarrollos recientes en genómica y biología de sistemas producen
un laberinto de conexiones entre diferentes tipos de datos que son intratables en cualquier forma
explícita, eliminando así cualquier esperanza para el descubrimiento de regularidades simples y
"similares a la ley" y reduciendo gran parte de La investigación en estas áreas para el desarrollo de
algoritmos predictivos (275). Sin embargo, es exactamente este tipo de regularidades simples y
aparentemente universales que emergen del análisis conjunto de datos comparativos-genómicos y
de biología de sistemas. La distribución de las tasas de evolución a través de conjuntos de genes
ortólogos, la distribución de los tamaños de las familias de genes parálogos, la correlación negativa
entre el nivel de expresión y la tasa de evolución de la secuencia de un gen, y otras relaciones
entre las variables evolutivas y fenómicas clave parecen ser genuinas. universales de la evolucion
La simplicidad de estas regularidades universales sugiere que están moldeadas por procesos
evolutivos fundamentales igualmente simples, en lugar de por la selección de funciones
específicas. En algunos casos, ya se han desarrollado modelos explícitos de tales procesos y se ha
demostrado que se ajustan a los datos. Estos modelos no incluyen la selección en absoluto o dan
una nueva interpretación a la selección. Un buen ejemplo es la hipótesis generalizada de error en
la traducción inducida por la mala interpretación que explica la covariación de la expresión génica
y la tasa de evolución de la secuencia mediante la selección de la robustez para el plegado
incorrecto que se presenta como un determinante importante de la evolución de la proteína. El
corolario inesperado de este modelo es que la fuerza motriz principal de la selección purificadora
podría no ser el mantenimiento de una función biológica, sino la prevención de efectos nocivos no
específicos de una proteína mal plegada.
En conjunto, los desarrollos en la genómica evolutiva y la biología de sistemas aquí descritos
parecen sugerir que, aunque en la actualidad solo se están formulando elementos aislados de una
nueva síntesis "posmoderna" de la biología evolutiva, tal síntesis es ciertamente factible. Además,
es probable que adopte una forma definitiva mucho antes del 250 aniversario de Darwin.
AVANCES: Estudios recientes han aclarado dónde viven las especies más vulnerables, dónde y
cómo la humanidad cambia el planeta y cómo esto conduce a las extinciones. Estos datos son cada
vez más accesibles, lo que aporta mayor transparencia a la ciencia y la gobernabilidad. Los
catálogos taxonómicos de plantas, vertebrados terrestres, peces de agua dulce y algunos taxones
marinos son suficientes para evaluar su estado y las limitaciones de nuestro conocimiento. Sin
embargo, la mayoría de las especies no están descritas. Las especies que mejor conocemos tienen
grandes rangos geográficos y son a menudo comunes dentro de ellas. Sin embargo, la mayoría de
las especies conocidas tienen rangos pequeños, y estas especies son típicamente descubrimientos
más recientes. El número de especies conocidas con rangos muy pequeños está aumentando
rápidamente, incluso en taxones conocidos. Están geográficamente concentrados y es
desproporcionadamente probable que se vean amenazados o que ya estén extintos. Esperamos
que especies desconocidas compartan estas características. Las tasas actuales de extinción son
aproximadamente 1000 veces la tasa de extinción de fondo. Estos son más altos que los estimados
previamente y probablemente todavía se subestiman. Las tasas futuras dependerán de muchos
factores y están listas para aumentar. Finalmente, aunque ha habido un rápido progreso en el
desarrollo de áreas protegidas, tales esfuerzos no son ecológicamente representativos, ni tampoco
protegen de manera óptima la biodiversidad.
Estudios recientes aclaran dónde viven las especies más vulnerables, dónde y cómo la humanidad
cambia el planeta y cómo esto conduce a las extinciones. Evaluamos estadísticas clave sobre las
especies, su distribución y su estado. La mayoría no están descritas. Las que mejor sabemos tienen
grandes rangos geográficos y con frecuencia son comunes dentro de ellas. La mayoría de las
especies conocidas tienen rangos pequeños. El número de especies de pequeño rango está
aumentando rápidamente, incluso en taxones conocidos. Están geográficamente concentrados y
es probable que estén amenazados o extintos de manera desproporcionada. Las tasas actuales de
extinción son alrededor de 1000 veces la tasa de fondo probable de extinción. Las tasas futuras
dependen de muchos factores y están listas para aumentar. Aunque ha habido un rápido progreso
en el desarrollo de áreas protegidas, tales esfuerzos no son ecológicamente representativos, ni
tampoco protegen de manera óptima la biodiversidad.
Las preocupaciones sobre la biodiversidad surgen porque las tasas actuales de extinción son
excepcionalmente altas. En consecuencia, primero comparamos las tasas de extinción actuales con
aquellas antes de que las acciones humanas las elevaran. Las especies vulnerables están
geográficamente concentradas, por lo que a continuación consideramos la biogeografía de la
extinción de especies. Dado el carácter incompleto de la taxonomía, consideramos cómo las
especies no descritas se diferencian de las especies descritas en su rango de tamaños geográficos,
distribuciones y riesgos de extinción. Para entender si las tasas de extinción de especies serán
aumente o disminuya, revisamos cómo y dónde se expanden las amenazas y si una mayor
protección puede contrarrestarlas. Concluimos revisando las perspectivas de progreso en la
comprensión de las lagunas clave en el conocimiento actual.
La pregunta más difícil se refiere a cómo podemos comparar dichas estimaciones con aquellas en
ausencia de acciones humanas, es decir, la tasa de extinción de fondo. Tres líneas de evidencia
sugieren que una declaración anterior (14) de una tasa de "referencia" de 1 (E / MSY) es
demasiado alta.
Primero, el registro fósil proporciona evidencia directa de las tasas de fondo, pero es escaso en
tiempo, espacio y nivel taxonómico, ya que trata principalmente con géneros (16). Muchas
especies están en géneros monotípicos, mientras que las de los géneros politípicos a menudo
comparten las mismas vulnerabilidades a la extinción (17), por lo que las tasas de extinción de
especies y géneros deberían ser bastante similares. Alroy encontró que los mamíferos cenozoicos
tenían 0.165 extinciones de géneros por millón de géneros-año (18). Harnik y otros (19) calcularon
las fracciones de especies que se extinguían en diferentes intervalos. Al convertirlos a sus tasas
correspondientes, se obtienen valores para los últimos millones de años de 0,06 géneros de
extinción por millón de géneros-año para cetáceos, 0,04 para carnívoros marinos y, para una
variedad de invertebrados marinos, entre los valores de 0,001 (braquiópodos) y 0,01. (equinoides).
En segundo lugar, las filogenias de base molecular cubren muchos taxones y entornos,
proporcionando una alternativa atractiva a las deficiencias del registro fósil. Un modelo simple del
aumento observado en el número de especies St en un clado filogenético a lo largo del tiempo, t,
isSt = S0 exp [(l - m) × t], donde l y m son las tasas de especiación y extinción. En la práctica, I y M
pueden variar de maneras complejas. Estimar la tasa de diversificación promedio, l - m, requiere
solo datos modestos. Si se puede separar la extinción de las tasas de especiación utilizando
números de especies a lo largo del tiempo es controvertido (20, 21) y un área de investigación
activa que requiere datos cuidadosamente seleccionados para evitar posibles sesgos. Con el
modelo simple, el logaritmo del número de linajes [linajes a través del tiempo (LTT)] debería
aumentar linealmente con el tiempo, con una pendiente l - m, pero con una calificación
importante. En el límite de la actualidad, los taxones más recientes aún no han tenido tiempo de
extinguirse. La curva LTT debe ser cóncava y su pendiente debe aproximarse a l (20, 21). Esto
permite una estimación separada de las tasas de especiación y extinción.
Desafortunadamente, en los muchos estudios compilados por McPeek (22), el 80% de las curvas
LLT fueron convexas, donde m = 0. Si las subespecies reconocidas actualmente se consideraran
como especies, entonces una fracción mayor de las curvas LTT podría ser cóncava, m> 0. Esto
sugiere que la opinión taxonómica juega un papel de confusión y uno que no se resuelve
fácilmente, independientemente de los modelos estadísticos subyacentes. La pregunta crítica es
qué tan grande puede pasar desapercibida una tasa de extinción con estos métodos.
Generalmente, si fuera grande, predecirían las curvas cóncavas, pero eso no proporciona la
cuantificación.
Tercero, los datos sobre la diversificación neta, l - m, están ampliamente disponibles. Las plantas
(23) tienen tasas de diversificación medias de 0,06 especies nuevas por especie por millón de años,
aves 0,15 (24), varios cordados 0,2 (22), artrópodos 0,17 (22) y mamíferos 0,07 (22). Las tarifas
para clados individuales son excepcionalmente> 1. Valente y otros (25) buscaron tasas
excepcionalmente altas, encontrando> 1 para el género Dianthus (claveles, Caryophyllaceae),
Lupinus andino (Lupins, Fabaceae), Zosterops (ojos blancos, Zosteropidae) y cíclidos en África
oriental lagos
Los esfuerzos están expandiendo los datos limitados de los océanos para los cuales solo el 2% de
las especies se evalúan en comparación con el 3.6% de todas las especies conocidas (27). Peters y
otros (28) evaluaron el género de caracol Conus, Carpenter y otros (29) corales y Dulvy y otros (30)
1041 especies de tiburones y rayas. En general, unas 6041 especies marinas tienen datos
suficientes para evaluar el riesgo: el 16% está amenazado y el 9% está casi amenazado, la mayoría
por sobreexplotación, pérdida de hábitat y cambio climático (13).
El método directo de estimar las tasas de extinción rastrea el cambio de estado a lo largo del
tiempo. La mayoría de los cambios en las categorías de la Lista Roja de la UICN se deben a un
mejor conocimiento, por lo que el cálculo del Índice de la Lista Roja mide el riesgo agregado de
extinción de todas las especies en un grupo dado, eliminando dichos cambios no originales (31).
Hoffmann et al. (32) mostraron que, en promedio, 52 de las 22,000 especies de mamíferos, aves y
anfibios se movían una categoría de la Lista Roja más cerca de la extinción cada año. Si la
probabilidad de cambio entre cualquiera de las dos categorías adyacentes de la Lista Roja fuera
idéntica, se obtendría una tasa de extinción de 450 E / MSY. La probabilidad es menor para la
transición de en peligro crítico a extinto (33), sin embargo, quizás porque los primeros reciben una
atención de conservación desproporcionada.
Las tasas de extinción de los análisis de cohortes promedian alrededor de 100 E / RMS (Tabla 1).
Las tarifas locales de las regiones pueden ser mucho más altas: 305 E / MSY para peces en los ríos
y lagos de América del Norte (34), 954 E / MSY para los gasterópodos de agua dulce de la región
(35) y probablemente> 1000 E / MSY para peces cíclidos en África Lago Victoria (36)
Los estudios sobre las tasas de extinción modernas por lo general no abordan la tasa de
extinciones genéricas, pero son posibles las comparaciones directas con los fósiles. Para los
mamíferos, la tasa es de ~ 100 extinciones de géneros por millón de años géneros (13) y ~ 60
extinciones para aves (13, 37).
¿Cómo afecta el conocimiento taxonómico incompleto a estas estimaciones? Dado que muchas
especies aún no están descritas y muchas especies con rangos pequeños son descubrimientos
recientes, estas cifras seguramente se subestiman. Muchas especies se habrán extinguido o
extinguirán antes de la descripción (8, 15). Las tasas de extinción de las especies descritas después
de 1900 son considerablemente más altas que las descritas anteriormente, lo que refleja su mayor
rareza (Tabla 1). Además, una mayor fracción de las especies descritas recientemente están en
peligro crítico (Tabla 1). Las tasas de extinción y las proporciones de especies amenazadas
aumentan con el conocimiento mejorado. Esto nos advierte que las estimaciones de tasas de
extinción recientes basadas en taxones poco conocidos (como los insectos) pueden ser
subestimaciones sustanciales porque muchas especies raras no están descritas.
En resumen, las tasas de extinción actuales de ~ 100 E / MSY y la fuerte sospecha de que estas
tasas fallan en las extinciones incluso para los taxones conocidos, y ciertamente para los más
pobres, significa que las tasas de extinción actuales son mil veces más altas que la tasa de fondo
de 0.1 E / MSY.
Patrones generales— “leyes” (41): describen las distribuciones geográficas de las especies. En
primer lugar, dominan los pequeños rangos geográficos. Gaston (42) sugiere una distribución
lognormal, aunque muchos taxones tienen más especies de rango pequeño que incluso esa
distribución sesgada (Fig.1). En la Fig. 1, el 25% de la mayoría de los taxones tienen rangos <105
km2 y, para los anfibios, <103 km2.
Estos tamaños sobrestiman sustancialmente los rangos reales. La Figura 1 supone que, para las
plantas, la presencia en una de las 369 regiones de la Lista de verificación mundial de familias de
plantas seleccionadas (WCSPF) (43) significa que la especie se encuentra en toda la región.
Similarmente, la Fig. 1 asume que las especies de Conus ocurren en todo el océano dentro de sus
límites geográficos. Estos límites externos de los rangos estimados son demasiado grandes. Por
supuesto, las especies están además limitadas a hábitats específicos dentro de los límites externos
de sus rangos (44, 45).
Una segunda ley es que las especies de pequeño rango son generalmente más escasas a nivel local
que las extendidas (41). Combinadas, estas dos formas de secuencia tienen consecuencias. En
primer lugar, como era de esperar, los taxónomos generalmente describen especies extensas y
abundantes localmente antes que las pequeñas y localmente escasas (46). Incluso para
vertebrados conocidos, los taxónomos describieron más de la mitad de las especies en Brasil con
rangos <20,000 km2 después de 1975 (47).
Segundo, dado que la mayoría de las especies no están descritas, se espera que las muestras de
regiones previamente inexploradas contengan una preponderancia de ellas. De hecho, la fracción
de especies no descritas debe proporcionar estimaciones de cuántas especies hay en total (11,
12). En la práctica, las muestras pequeñas en ubicaciones dispersas incluyen especies comunes y
extendidas y algunas raras. Por ejemplo, en muestras de aproximadamente 6 millones de km2 de
tierras bajas del Amazonas, solo 227 especies representaron la mitad de los árboles individuales, lo
que sugiere que el Amazonas podría ser florísticamente bastante homogéneo. Sin embargo, las
muestras contenían 4962 especies de árboles conocidas, y muchas de ellas no pudieron
identificarse (48). El Amazonas puede contener hasta 16,000 especies (48). Solo la acumulación de
listas de especies mientras se cuantifica el esfuerzo de muestreo puede proporcionar estimaciones
convincentes de cómo la diversidad varía geográficamente y, por lo tanto, de cuántas especies hay
en total.
Las incertidumbres acerca de dónde están las especies pueden ser más limitantes que no saber
cuántas especies hay. La UICN mapea 43,000 especies (13). Casi la mitad son anfibios, aves y
mamíferos. El mapa más común, pero menos informativo para la conservación, es de riqueza de
especies. Las especies ampliamente distribuidas dominan estos mapas, mientras que la mayoría de
las especies con rangos pequeños son casi invisibles (fig. S1). Un acompañamiento esencial traza
mapas de especies de pequeño rango, como la riqueza de especies con un tamaño menor al rango
de la mediana (49) o, para regiones más definidas, endémicas de cada región. Las figuras 2 a 5
proporcionan ejemplos de mamíferos y anfibios (13, 50, 51), plantas con flores (43), peces de agua
dulce (52) y caracoles marinos del género Conus (28). Los materiales complementarios
proporcionan detalles (53). Hay mapas similares para 845 especies de coral formadoras de
arrecifes (29), peces costeros, varios depredadores marinos e invertebrados (54, 55).
Donde hay la mayoría de las especies, uno podría esperar la mayoría de las especies de todos los
tamaños de rango, tanto grandes como pequeñas. Sorprendentemente, las especies con pequeños
rangos están geográficamente concentradas. El mayor número de especies de aves vive en las
tierras bajas del Amazonas, mientras que las especies de pequeño rango se concentran en los
Andes (fig. S1). Aunque mapeados a una escala mucho más gruesa, los peces de agua dulce
también suelen alcanzar su mayor diversidad en los grandes ríos que fluyen a través de los
bosques. Una sorprendente excepción son los altos números en los lagos de la falda de África
Oriental (Fig. 4). Filipinas tiene el mayor número de especies de Conus; las concentraciones de
especies de pequeño rango están en otra parte (Fig. 5). Otros taxones marinos son similares (55).
Muchas extinciones pasadas han estado en islas, pero los patrones actuales de amenaza son
geográficamente mucho más amplios (49, 56). Especies raras, bien extendidas pero escasas (como
los principales depredadores y otros animales de gran cuerpo) o con rangos geográficos pequeños
y, con frecuencia, localmente escasos (41), dominan las listas. Las especies con rangos pequeños
son desproporcionadamente más propensas a ser amenazadas que aquellas con rangos más
grandes (49, 57). Curiosamente, para un rango de tamaño dado, una fracción más pequeña de las
especies de islas está amenazada que para las de los continentes, probablemente porque las
especies de las islas son localmente más abundantes (49).
Las concentraciones de especies amenazadas coinciden más con las concentraciones de especies
de pequeño rango que con el número total de especies y, por lo tanto, son más informativas sobre
dónde viven las especies actualmente amenazadas y dónde pueden amenazarse en el futuro (49,
50) (Fig. 2 y Fig. . S1).
Myers y otros (58) señalaron el punto vital y separado de que la destrucción del hábitat es mayor
donde viven las concentraciones más altas de especies de pequeño rango. Por así decirlo, las
especies de pequeño rango nacen vulnerables y luego tienen las mayores amenazas sobre ellas. La
definición del punto de acceso de Myers et al. Combina un número mínimo de especies de plantas
de pequeño rango y una pérdida de hábitat suficientemente alta.
Hasta hace poco, estos escenarios eran los únicos modelos empíricamente validados. Las
validaciones se centraron en vertebrados, a nivel mundial (61) o regional: el este de los Estados
Unidos (62), el Bosque Atlántico de América del Sur (63) y el sudeste insular de Asia (64). Hubo una
excelente correspondencia entre el número de especies pronosticadas para extinguirse y las que
lo hicieron (62) o, para la deforestación más reciente, con las amenazadas (61, 63, 64). Hay
discusiones sobre la teoría subyacente de tales estimaciones (65). No obstante, cuando se cuentan
todas las extinciones que pueden seguir a la deforestación (66), estas estimaciones son
conservativas.
La teoría predice que muchas más extinciones son posibles con una fragmentación severa del
hábitat (67), como confirman las observaciones (68).
La revisión de Pereira et al. Sobre las futuras extinciones proyectadas (69) clasificó y comparó
varios modelos. Sorprendentemente, los seis conjuntos de proyecciones pronosticaron un rango
cien veces mayor de tasas de extinción. Esto surgió de los diferentes factores considerados
(cambio de uso de la tierra, cambio climático o ambos), enfoques modelo, cobertura taxonómica y
escala geográfica. Dado este rango, existe una necesidad urgente de validación de proyecciones
contra extinciones documentadas hasta la fecha. Pocos estudios intentan esto. Aquí,
consideramos las perspectivas de dicha validación con los nuevos datos disponibles que pueden
reducir las incertidumbres.
La alteración del clima causará extinciones de especies, pero el rango de estimaciones es grande.
Thomas et al. (70) estimaron que entre el 15 y el 37% de varios taxones se comprometería a la
extinción en 2050 para un escenario de calentamiento de rango medio. Los estudios específicos
para aves estimaron que> 400 especies de aves terrestres de las 8750 estudiadas (4,6%)
experimentarán una reducción en el rango superior al 50% para el año 2050 (71). Para las aves
terrestres del hemisferio occidental, las estimaciones de extinción intermedias basadas en los
cambios proyectados inducidos por el clima en las distribuciones actuales oscilaron entre 1.3%
(calentamiento de 1.1 ° C) y 30% (calentamiento de 6.4 ° C) de las 3349 especies estudiadas (72).
Una evaluación global de las contracciones del rango inducido por el calentamiento esperado
estimó que 184 a 327 especies de aves montanas (de un total de 1009) perderían> 50% de su
rango y darían como resultado tamaños de rango de <20,000 km2 (73).
Cheung y otros (74) utilizaron un modelo climático global para predecir los cambios de rango, la
extinción y las intensidades de invasión basadas en el calentamiento del océano hasta 2050 para
1066 especies de peces e invertebrados marinos explotados. Predijeron que los movimientos de
rango hacia los polos conducirían a la extinción de especies en latitudes tropicales y subpolares de
4 y 7% respectivamente, con la mayoría de los reajustes de rango en el medio. Atribuyen las
menores probabilidades de extinción que en tierra (70) a una mayor libertad de movimiento en el
mar. Los mares cerrados, como el Mediterráneo, podrían atrapar grupos de especies endémicas
contra barreras insuperables (75). Tampoco consideraron ningún otro motor de extinción
potencial, como la acidificación de los océanos (76), la pesca excesiva (30) o la incapacidad de las
especies sésiles, como los corales empolladores, para moverse.
En la tierra, los efectos de la alteración del clima siguen sin estar claros por varias razones. Una
incertidumbre clave es si la perturbación del clima y la destrucción del hábitat dañan conjuntos
superpuestos de especies o especies muy diferentes, y pueden actuar de forma sinérgica. La
interrupción del clima parece ser una amenaza adicional (77). Algunos estudios combinan
explícitamente las proyecciones del área de la especie de la pérdida de especies para incorporar el
cambio climático como motor, a través de modelos de cambio de vegetación global (78), y
sugieren que el 12% de las especies se extinguirán. Otros estudios estiman que del 7 al 24% de las
especies de plantas (79) se extinguirán. Los impactos de la alteración climática son complejos. Un
metaanálisis comparó 188 pronosticados con 130 respuestas observadas de cambio climático y
sugirió que del 10 al 14% de las especies se extinguirían (80). Además, las interacciones de los
impulsores ambientales con rasgos biológicos intrínsecos (por ejemplo, rango geográfico, tamaño
corporal y tasa reproductiva) indican que las respuestas de las especies al aumento de la densidad
de la población humana serán cada vez más inciertas (81).
Otra novedad es que ninguno de los modelos de Pereira et al. (69) evaluó la viabilidad de la
población y la idoneidad del hábitat. Más bien, toman enfoques indirectos, como una fracción de
su rango actual, como en (70). Los enfoques que incorporan la viabilidad proporcionan bases
empíricas sólidas para estimar el riesgo de extinción (82). Sin embargo, algunos estudios
regionales los han empleado, incluido un estudio sobre Proteaceae de Sudáfrica (83).
Por encima de todo, hay pocas pruebas empíricas. Los métodos anteriores suponen que las
especies se mueven hacia el polo, a elevaciones más altas o a profundidades más profundas para
permanecer en sus envolturas climáticas. Usando repeticiones fortuitas de las encuestas
realizadas hace décadas, diversos estudios encuentran retrasos sustanciales en los movimientos
en pendiente ascendente de plantas (84), insectos (85) y aves (86). Estos cuestionan el destino de
las especies que ahora viven fuera de las envolturas del clima pasado. Además, los pocos estudios
que consideran las predicciones de cambios en los rangos geográficos desde el pasado hasta el
presente y luego los calibran con respecto a los rangos actuales no siempre encuentran
coincidencias convincentes (87).
Para las especies de agua dulce, la modificación directa e indirecta del hábitat, incluida la
contaminación (88) y la ya extensa y continua fragmentación y regulación del flujo de los ríos (89),
son claramente los principales impulsores de la extinción, especialmente para las especies con
capacidades limitadas de dispersión. Las alteraciones existentes en los sistemas de agua dulce
pueden ya haber comprometido la viabilidad de las especies en la medida en que ningún nivel de
protección futura pueda prevenir la extinción (90).
Las especies introducidas, incluidas las enfermedades, son una causa importante de extinción y la
causa principal de extinciones de aves recientes (37). Alrededor del 10% de las especies de plantas
son endémicas de islas lo suficientemente pequeñas como para que los herbívoros introducidos
sean una amenaza importante (59). No conocemos estimaciones de tasas de extinción de especies
introducidas. Dichas extinciones pueden desarrollarse de forma rápida e impredecible, como la
destrucción de la avifauna endémica de Guam por una serpiente introducida (91) y la destrucción
y posible extinción, principalmente por la perca del Nilo, de hasta 200 cíclidos de haplocromina del
Lago Victoria (36).
En resumen, hay pocas predicciones empíricamente probadas de futuras extinciones. Los
escenarios típicos consideran lo que se puede predecir: extinciones por deforestación o alteración
del clima, pero no procesos potencialmente importantes (enfermedades, especies introducidas o
cambios hidrológicos) que no se pueden modelar fácilmente.
Entre las muchas incertidumbres a la hora de proyectar tasas de extinción futuras, una
especialmente importante es el efecto que las acciones de conservación podrían tener para
reducirlas (92). Por ejemplo, la velocidad a la que los mamíferos, aves y anfibios se han deslizado
hacia la extinción en las últimas cuatro décadas hubiera sido 20% mayor si no fuera por los
esfuerzos de conservación (32).
La destrucción de los hábitats naturales es la principal amenaza para las especies (13). Por lo tanto,
las áreas protegidas, aunque son diversas y difieren sustancialmente en sus propósitos y niveles de
protección (93), son esenciales para reducir las extinciones. La Meta 11 de Aichi busca la
protección de> 17% de los ecosistemas terrestres y de agua dulce "ecológicamente
representativos" y> 10% de los ecosistemas costeros y marinos (2), mientras que la Meta 4 de la
Estrategia Global para la Conservación de Plantas (GSPC) del CDB busca> 15% de Región ecológica
o tipo de vegetación ”(94).
En 2009, el 12.9% del área total de la tierra estaba bajo alguna protección legal, por encima del
<4% en 1985 (95). Las áreas protegidas están sesgadas hacia áreas donde hay poca presión
humana (96). La cobertura varía entre el 4% y el 25% de protección de 14 biomas terrestres
principales (96). De las 821 ecorregiones terrestres del mundo, la mitad tenía <10% de su área
protegida (96).
Qué tan bien estas áreas capturan especies dentro de sus límites ahora y en el futuro es un insumo
esencial para predecir las tasas de extinción futuras (50, 60). Rodrigues y otros (97) analizaron
rangos de mamíferos, aves, anfibios y tortugas amenazados combinados con la Base de datos
mundial sobre áreas protegidas (93). En general, el 27% de los anfibios amenazados, el 20% de las
aves amenazadas, el 14% de los mamíferos amenazados y el 10% de las tortugas amenazadas
viven fuera de las áreas protegidas. Los análisis subsiguientes han establecido objetivos de
representación escalados en proporción inversa al tamaño del rango (98); por ejemplo, 100% de
representación para especies con rangos <1000 km2, 10% de representación para rangos> 250,000
km2, y una interpolación lineal para especies intermedias. Solo ~ 46% de las aves, ~ 39% de los
mamíferos y ~ 19% de los anfibios alcanzan o superan sus objetivos (98).
Estos análisis de brechas globales son vulnerables a errores de comisión (las especies parecen
aparecer cuando no lo hacen) como resultado de la superposición de los mapas de especies de
resolución gruesa con los límites de áreas protegidas de alta resolución (99). Estos pueden generar
una falsa sensación de seguridad:
Las especies pensadas con seguridad representadas pueden extinguirse. Los enfoques alternativos
que aceptan errores de omisión más altos, aunque menos eficientes, son menos problemáticos.
Por lo tanto, para las aves, las áreas protegidas cubren solo el 49% de los sitios documentados que
albergan a toda la población de al menos una especie altamente amenazada (56) y solo el 51% de
los sitios de importancia mundial para las aves (100).
¿Las áreas protegidas funcionan? Ciertamente, algunos fallan completamente: incluso los grandes
parques nacionales en África occidental han perdido leones y muchas de sus presas (40). Para las
poblaciones de especies de agua dulce, la presencia dentro de las reservas no es garantía de
protección, dadas las amenazas externas como la modificación del flujo y la falta de una gestión
explícita de reservas para cumplir los objetivos de agua dulce (101). Los bosques protegidos
generalmente conservan su cubierta forestal (102), tienen muchos menos incendios
antropogénicos que las áreas no protegidas (103) y no atraen a su perímetro el crecimiento de la
población humana superior al esperado (104). La mayoría de los estudios no evalúan directamente
las poblaciones de plantas y animales, y los hábitats restantes a menudo son demasiado pequeños
o están muy explotados para retener a todas sus especies (105). Aquellos que hacen un
seguimiento de las especies revelan que las áreas protegidas producen resultados sustanciales
para prevenir las extinciones. A nivel mundial, las especies con> 50% de los sitios de especial
importancia para ellas protegidas se están deslizando hacia la extinción solo la mitad de las que
tienen <50% de sus sitios importantes protegidos (100).
La protección del océano se queda atrás en la tierra. Una evaluación de 2013 (106) informó ~
10,000 áreas marinas protegidas (AMP) que cubren el 2.3% de los océanos. La Meta 11 de Aichi
admite "otras medidas de conservación basadas en áreas efectivas", por lo que esta evaluación
incluyó grandes zonas de manejo de pesquerías cerradas a ciertas artes de pesca, incluidas algunas
en Nueva Inglaterra, Florida y Nueva Zelanda. Estos no se establecieron para la conservación de la
biodiversidad y, en el caso de Nueva Zelanda, fueron propuestos por la industria de pesca de
altura, evitando lugares importantes para la pesca (106). Una evaluación más conservadora (107)
estima una cobertura global del 1,8%.
Como en tierra, la cobertura del área marina protegida es desigual. Las reservas a menudo están
ausentes donde las amenazas a la biodiversidad son más altas, como las zonas de pesca y los
arrendamientos de petróleo y gas. Más allá de los límites de 200 millas náuticas de la jurisdicción
nacional, el 0.17% de las aguas abiertas están protegidas, en comparación con el 8% de las
plataformas continentales (106). Los arrecifes de coral costeros son los mejor protegidos, con un
18.7% dentro de áreas protegidas para 2006 (108). Sin embargo, solo el 2% de las AMPs se
consideraron de tamaño, administración, nivel de protección y conectividad adecuados. Los
movimientos para establecer sitios grandes y remotos como AMPs, como el Territorio Británico del
Océano Índico de los EE. UU., Han contribuido en gran medida al reciente crecimiento de la
protección, lo que sugiere que el objetivo de cobertura del 10% de Aichi podría ser alcanzable
(109). Las áreas marinas protegidas que no son aptas, bien aplicadas, viejas, grandes y aisladas por
aguas profundas o arena tienen un éxito desproporcionado en la retención de sus especies (110).
La Meta 11 de Aichi busca la protección del 17% de las tierras terrestres (2), mientras que el GSPC
busca proteger el 60% de las especies de plantas (94). ¿Ambos objetivos son posibles
simultáneamente? La concentración de especies de pequeño rango es tal que las tierras se
protegieron eficientemente para capturar la biodiversidad, el 17% así seleccionado abarcaría parte
de los rangos del 81% de las especies de plantas y todos los rangos del 67% (59). ¿Cómo podría la
predicción de que un 15% más de especies de plantas no están actualmente descritas cambiar
estas selecciones? Joppa et al. (111) utilizaron tasas de descripción de especies corregidas para el
esfuerzo taxonómico y predijeron que las especies no descritas estarán en las concentraciones
conocidas de especies con rangos pequeños, lo que dejará las prioridades actuales sin cambios.
Estas prioridades de plantas coinciden con las de los vertebrados terrestres. Alrededor del 89% de
las especies de aves, el 80% de los anfibios y el 74% de los mamíferos viven dentro de estas áreas
prioritarias para las plantas (59). Los porcentajes para las especies con rangos más pequeños que
la mediana son 88%, 82% y 73%, respectivamente (59). Con datos actualizados, estos resultados
capturan la observación de Myers et al. (58) de que la conservación de una gran fracción de
especies es posible en áreas limitadas si las autoridades eligen áreas protegidas que conocen qué
especies contienen (112). Las áreas de alta diversidad de peces de agua dulce coinciden con
algunas áreas de alta diversidad terrestre, pero tal congruencia no se puede asumir: las
excepciones incluyen los sistemas de agua dulce de alta diversidad de los deltas del Ganges y
Mekong (113) (Fig. 4). Además, la protección de las especies de agua dulce requiere la gestión de
los paisajes y el uso del agua más allá de las cercas de las reservas y en pozos más grandes (101).
Sabemos lo suficiente como para ver que nuestra ignorancia sobre los números de las especies, las
distribuciones y el estado afecta en gran medida a las estadísticas clave de biodiversidad. Dos
ejemplos ilustran las consecuencias. Primero, alrededor del 20% de las plantas conocidas se
consideran amenazadas (114). Si se agrega el 15% previsto de especies no descritas, casi todas
serán raras y en lugares con gran pérdida de hábitat (36), se sugiere que el 30% de las especies de
plantas están amenazadas (6). La perturbación climática amenaza especies adicionales.
En segundo lugar, solo el 6,5% de las 632 especies de Conus están amenazadas. Otro 14% son
"deficientes en datos": no hay información suficiente para evaluar su estado, generalmente
porque son raros y tienen pequeños rangos geográficos (28). Si se conociera mejor el hecho de
considerarlos amenazados, el mapa de dónde se encuentran las especies amenazadas cambiaría
sustancialmente (Fig. 5). La inversión para extender la cobertura de la Lista Roja de la UICN a su
objetivo de 160,000 evaluaciones de especies es una prioridad (115). ¿Cuál es el progreso hacia un
mejor conocimiento y cuáles son las perspectivas de mejoras continuas? La Meta 19 de Aichi exige
que los datos sean "ampliamente compartidos". Los esfuerzos recientes en línea hacia este
objetivo incluyen el Fondo de Información de Biodiversidad Global (GBIF) (116), con 420 millones
de registros y 1.45 millones de nombres de especies y subespecies, y el Biogeográfico Oceánico
Sistema de información (117), con 38 millones de registros de 115,000 especies. Species 2000
busca crear una lista de verificación validada de todas las especies, y el Árbol de la Vida (118) y el
TimeTree (119) proporcionan relaciones filogenéticas.
Las comunidades de taxónomos ahora abordan el tedioso pero vital problema de la sinonimia y la
colocación de sus listas y decisiones taxonómicas en el dominio público. Las grandes bases de
datos incluyen el Registro mundial de especies marinas (120), que ha verificado el 95% de las
221,000 especies marinas, y FishBase, con 32,700 especies de peces (121). WCSPF (43) ha
evaluado actualmente ~ 110,000 especies de plantas (5).
Las nuevas tecnologías ayudan. El código de barras genético (122) ofrece la posibilidad de
identificar especies animales rápidamente por US $ 1 por muestra a partir de una secuencia de
ADN pequeña pero única. El código de barras para plantas es un poco más difícil. Para la gran
mayoría de las especies desconocidas en taxones animales con pocos especialistas taxonómicos,
este seguramente se convertirá en el método predominante para descubrir nuevas especies.
Plantea la idea controvertida de que muchas especies pueden llegar a ser conocidas por un
número derivado de códigos de barras y no, o no solo, de descripciones convencionales (123). El
potencial para encontrar nuevas especies y desenredar grupos de especies crípticas (124) también
se está realizando. Menos apreciado es que ahora es posible el código de barras rentable por lotes
de especies. Los nuevos y poderosos métodos estadísticos (125) estiman cuántas especies pueden
estar presentes en un área y cómo estas se superponen con otras muestras al aumentar los
esfuerzos de muestreo. Combinado con el código de barras por lotes, existe la promesa de
estimaciones rigurosas de qué fracciones de especies no descritas están presentes en áreas de
muestra deficiente, la forma más directa de estimar cuántas especies hay.
Incluso para las especies mapeadas, subsisten incertidumbres sustanciales. El mayor número
aparente de especies de vertebrados en América del Sur (fig. S1) está cerca de los centros de
investigación, al igual que muchos registros de GBIF. La consecuencia más importante de tener un
mapa de distribución de especies públicas es que desafía a los observadores a confirmarlo o
enmendarlo.
Los datos de fuentes múltiples, especialmente cuando se incluyen datos sobre el esfuerzo de
muestreo, brindan oportunidades sustanciales para monitorear una amplia gama de especies a lo
largo del tiempo y en amplias áreas geográficas: exactamente los requisitos necesarios para
evaluar los diversos escenarios para una futura extinción
Los números y tipos de bases de datos en línea han aumentado dramáticamente en los últimos
años y continuarán haciéndolo. Las estimaciones globales de la cobertura terrestre a partir de
sensores remotos [p. Ej., (131)] se diversificaron con la apertura en 2009 del archivo Landsat del
Servicio Geológico de EE. UU. Y los esfuerzos subsiguientes para recopilar y calibrar depósitos
globales de imágenes de Landsat que se remontan a principios de los años 70 (132, 133) .
Aún más prometedor es la combinación de fuentes de datos. Los estudios ahora permiten realizar
evaluaciones detalladas del estado actual de las especies mediante el recorte de los mapas de
rango disponibles utilizando estimaciones de altitud remotas y hábitats restantes (134) y
conectando directamente a los modelos de metapoblación de rangos fragmentados (45). La Figura
6 proporciona un ejemplo de la medida en que las especies ' los rangos se han perdido y
fragmentado por la deforestación, y cuando esto sucedió. También muestra dónde queda el
bosque fuera de las áreas protegidas, cómo se ha perdido dentro de ellas y el potencial de los
datos de fuentes múltiples para monitorear las distribuciones de las especies.
Los pinzones de Darwin, que habitan el archipiélago de las Galápagos y la Isla del Coco,
constituyen un modelo icónico para los estudios de especiación y evolución adaptativa. Aquí
presentamos los resultados de la re-secuenciación del genoma completo de 120 individuos que
representan a todas las especies de pinzones de Darwin y dos parientes cercanos. El análisis
filogenético revela importantes discrepancias con la taxonomía basada en el fenotipo.
Encontramos amplia evidencia de flujo de genes interespecíficos a lo largo de la radiación. La
hibridación ha dado lugar a especies de ascendencia mixta. Un haplotipo de 240 kilobases que
abarca el gen ALX1 que codifica un factor de transcripción que afecta el desarrollo craneofacial
está fuertemente asociado con la diversidad de formas de pico en las especies de pinzón de
Darwin, así como en el pinzón terrestre medio (Geospiza fortis), una especie que ha
experimentado una rápida evolución de forma de pico. En respuesta a los cambios ambientales. El
haplotipo ALX1 ha contribuido a la diversificación de las formas del pico entre los pinzones de
Darwin y, por lo tanto, a una mayor utilización de los recursos alimentarios.
Las radiaciones adaptativas son particularmente informativas para comprender las bases
ecológicas y genéticas de la biodiversidad1,2. Esas causas se identifican mejor en las radiaciones
jóvenes, ya que representan las primeras etapas de la diversificación cuando las transiciones
fenotípicas entre las especies son pequeñas e interpretables y las extinciones probablemente sean
mínimas3. Los pinzones de Darwin son un ejemplo clásico de una radiación adaptativa tan
joven3,4. Se han diversificado en tamaños y formas de picos, hábitos de alimentación y dietas para
adaptarse a diferentes recursos alimenticios4,5 (Tabla de datos ampliada 1). La radiación está
totalmente intacta, a diferencia de la mayoría de las otras radiaciones, ninguna de las especies se
ha extinguido como resultado de las actividades humanas4.
Aquí presentamos los resultados de la re-secuenciación del genoma completo de 120 individuos
que representan todas las especies de pinzones de Darwin y dos tanagers estrechamente
relacionados, Tiaris bicolor y Loxigilla noctis13. Para algunas especies recolectamos muestras de
múltiples islas (Fig. 1a). Analizamos exhaustivamente los patrones de diversidad genómica intra e
interespecífica y las relaciones filogenéticas entre las especies. Encontramos evidencia
generalizada de flujo de genes interespecíficos que puede haber mejorado la diversificación
evolutiva a lo largo de la filogenia, e informamos del descubrimiento de un lugar con un efecto
importante en la forma del pico.
Generamos una cobertura de secuencia de aproximadamente 103 por ave individual utilizando 2 3
100 pares de bases (pb) lecturas de extremos pareados (Datos extendidos, Fig. 1). Las lecturas se
alinearon con el ensamblaje del genoma de un pinzón de tierra mediano (G. fortis) 14.
Identificamos los andamios unidos por Z y W en función de las diferencias significativas en la
profundidad de lectura entre machos (ZZ) y hembras (ZW) (Tabla complementaria 1 ) y generó una
secuencia de ADNmt de G. fortis a través de una bioinformática combinada y un enfoque
experimental. El llamamiento a la variante estricta reveló aproximadamente 45 millones de sitios
variables dentro o entre poblaciones. Encontramos una cantidad considerable de diversidad
genética dentro de cada población, en el rango de 0,3 3 1023 a 2,2 3 1023 (Tabla de Datos
Extendidos 2), similar a la reportada en otras poblaciones de aves15, incluidas las poblaciones de
islas del pinzón de cebra16. Utilizamos estas estimaciones de diversidad para estimar los tamaños
efectivos de la población de las especies de pinzones de Darwin dentro de un rango de 6,000 a
60,000 (texto complementario). Se observó un amplio intercambio de variaciones genéticas entre
las poblaciones, en particular entre los pinzones del suelo y los árboles, casi sin diferencias fijas
entre las especies en cada grupo (Datos extendidos, Fig. 2)
De acuerdo con la taxonomía clásica de los pinzones de Darwin, respaldados por datos
morfológicos y mitocondriales (citocromo b), los pinzones de warbler fueron los primeros en
ramificarse, y los pinzones de tierra y árboles constituyen la división principal más reciente3,6,9.
Nuestro árbol filogenético de máxima probabilidad basado en secuencias de genomas
autosómicos generalmente es consistente con la taxonomía actual, pero muestra varias
desviaciones interesantes (Fig. 1b). Primero, la Geospiza difficilis que ocurre en seis islas diferentes
forma un grupo polifilético separado en tres grupos distintos: (1) poblaciones que ocupan las
tierras altas de Pinta, Santiago y Fernandina, (2) poblaciones que ocupan las islas bajas de Wolf y
Darwin en el noroeste3,6 , 9 y (3) la población de Genovesa en el noreste. Esto es coherente con
una versión anterior de la taxonomía, en la que estos tres grupos se clasificaron como especies
distintas en función de las diferencias morfológicas17,18.
En segundo lugar, Geospiza conirostris en España mostró la mayor similitud genética con otra
especie, Geospiza magnirostris, mientras que G. conirostris en Genovesa se agrupó con Geospiza
scandens (Fig. 1b). Aquí, la similitud fenotípica es paralela a la similitud genética; G. conirostris en
Genovesa tiene un pico puntiagudo similar a G. scandens, mientras que los de Espan˜ola tienen un
pico romo más similar a los picos de G. magnirostris (Datos ampliados Fig. 3).
Una red construida a partir de secuencias autosómicas del genoma indica señales conflictivas en
las ramas internas de los pinzones del suelo y del árbol que pueden reflejar la clasificación
incompleta del linaje y / o el flujo de genes (Datos ampliados, Fig. 3). El orden de bifurcación
exacto de los pinzones de suelo y de árbol más recientemente evolucionados debe interpretarse
con precaución, ya que puede cambiar con un muestreo adicional. Dado que nuestros datos
revelaron algunas discrepancias importantes con la taxonomía basada en el fenotipo, proponemos
una taxonomía revisada para el pinzón de fondo afilado (G. difficilis) y el cactusfinch grande (G.
conirostris) (Texto suplementario y datos extendidos, Fig. 4) , pero utilizará los nombres actuales
en el texto.
Fechamos las divisiones filogenéticas sobre la base de la divergencia del genoma (Fig. 2a), y
comparamos estas estimaciones con las obtenidas mediante el mtDNA (datos ampliados Fig. 5a y
texto suplementario). Inferimos que la división más basal, entre pinzones de la curruca (Certhidea
sp .) y otros pinzones, ocurrieron hace unos 900.000 años. Las rápidas radiaciones de los pinzones
del suelo y de los árboles comenzaron hace unos 100.000-300.000 años. Aunque estas
estimaciones se basan en datos de todo el genoma, deberían considerarse tiempos mínimos, ya
que no tienen en cuenta el flujo genético.
Las discrepancias entre las filogenias basadas en la morfología y las secuencias del genoma pueden
deberse a la evolución convergente y / o al flujo de genes entre especies. Encontramos evidencia
de introgresión de tres fuentes: pruebas ABBA-BABA, discrepancias entre árboles filogenéticos
basados en loci ligados al sexo y autosómicos, y mtDNA (Texto Suplementario y Datos Extendidos,
Fig. 5a).
Primero, se usó el estadístico19 asociado con la prueba ABBA-BABA para comparar dos
poblaciones de G. difficilis de Pinta y Wolf, y G.magnirostris de Genovesa, usando L. noctis como
grupo externo; G.magnirostris también ocurre en Wolf, pero nos faltaron muestras de esa
población. El análisis confirmó que G. difficilis en Wolf tiene una relación genética más cercana con
G. magnirostris que con G. difficilis en Pinta (Fig. 2b). Pero hay evidencia de flujo de genes entre G.
difficilis en Wolf y Pinta (P 5 5 3 102113), porque la asimetría sustancial en las relaciones genéticas
no puede explicarse por la clasificación incompleta del linaje. Sin embargo, la estadística D no
distingue la mezcla de la subdivisión ancestral19. Concluimos que las poblaciones de G
estrechamente relacionadas. difficilis en Wolf y Darwin son una especie de ascendencia mixta
donde la mayor parte del genoma se origina en G. magnirostris o un pariente cercano (Tabla
complementaria 2), mientras que una proporción considerable del genoma, posiblemente
incluyendo variantes genéticas que afectan caracteres fenotípicos, se deriva de G. difficilis. De
manera similar, G. difficilis en Genovesa muestra una relación genética más cercana con los
pinzones de otros suelos y árboles que con G. difficilis en Pinta, pero también encontramos
evidencia de flujo genético entre los dos grupos previamente clasificados como G. difficilis (P 5 3 3
10287 Tabla Suplementaria 2).
Los árboles basados en sitios autosómicos (Fig. 1b) y vinculados en Z (Datos ampliados Fig. 5b) no
son completamente congruentes. El árbol basado en polimorfismos ligados a Z indicó que G.
difficilis presente en las tierras altas de Pinta, Fernandina y Santiago está más estrechamente
relacionada con Platyspiza crassirostris y emergió antes de que el pinzón Cocos se separara del
suelo y los pinzones de los árboles, mientras que el árbol autosómico indica Un orden invertido
para el surgimiento de las dos especies. Esta discrepancia puede explicarse potencialmente por el
flujo de genes entre G. La difficilis y los pinzones de los árboles y del suelo después del pinzón de
Cocos se aislaron reproductivamente de los pinzones de las Galápagos, que afectaron a los loci
ligados a Z y autosómicos en diferentes grados. Es una observación común en especies
estrechamente relacionadas que hay más intercambio entre especies de polimorfismos de
secuencia en loci autosómicos que en loci 20 ligados al sexo. Esta interpretación del estado
filogenético de G. difficilis (grupo de tierras altas) está respaldada por los árboles basados tanto en
mtDNA como en W (Extended Data Fig. 5), lo que sugiere que G. difficilis divergió del antepasado
de otros pinzones de tierra y árboles antes La aparición del pinzón cocos.
La diferencia morfológica más notable entre los pinzones de Darwin se refiere a la forma del pico
(Datos extendidos, Fig. 3). Se realizó una exploración de todo el genoma en base a poblaciones
que están estrechamente relacionadas pero que muestran diferentes morfologías de pico: G.
magnirostris y g. conirostris en España tienen picos contundentes, mientras que G. conirostris en
Genovesa y G. difficilis en Wolf tienen picos puntiagudos. Usamos ventanas de 15 kilobases (kb) no
superpuestas para identificar regiones con los índices de fijación más altos (FST) entre grupos. La
distribución de FST se transformó en Z (ZFST) y se identificaron regiones con valores
sorprendentes de ZFST (Fig. 3a). Entre las 15 regiones más significativas, seis genes alojados
anteriormente asociados con mamíferos o aves con desarrollo craneofacial y / o pico, incluyendo
calmodulina (CALM) 11, homeobox goosecoid (GSC) 22, retinol deshidrogenasa 14 (RDH14) 23,
homeobox ALX1 (ALX1) 24,25, factor de crecimiento de fibroblastos 10 (FGF10) 26 y horquilla C1
(FOXC1) 27. Un estudio previo demostró la expresión diferencial de CALM entre pinzones con
diferentes tipos de pico11. Otros dos estudios informaron la expresión diferencial de la proteína
bonemorfogenética 4 (BMP4) 10,12, pero no observamos valores elevados de ZFST cerca de este
locus, lo que sugiere que la expresión diferencial está controlada por otros loci.
La búsqueda más sorprendente fue una región de 240 kb con valores altos de ZFST, incluida la
ventana con la puntuación más alta de ZFST (9.46) en general (Fig. 3a, b). La región se superpone a
parte de LRRIQ1 (repeticiones ricas en leucina y el motivo IQ que contiene 1), el gen ALX1
completo y aproximadamente 130 kb en sentido descendente de ALX1. Ningún informe anterior
indica que LRRIQ1 tiene un papel durante el desarrollo en vertebrados. Por el contrario, ALX1 es
un excelente candidato para la variación en la morfología del pico. Codifica una proteína de
homeodominio de tipo pareado que desempeña un papel crucial en el desarrollo de estructuras
derivadas del mesénquima craneofacial, el primer arco branquial y el brote de la extremidad24, y
en la migración de células de la cresta neural craneal, muy relevante para el desarrollo del pico25.
La pérdida de ALX1 en humanos causa la interrupción del desarrollo craneofacial temprano24.
Todos los individuos en la categoría de pico romo fueron homocigotos para un haplotipo asociado
con pico romo (denotado B), excepto un individuo heterocigoto de G. conirostris de España.
Además, a excepción de un ave heterocigota de Genovesa, todos los 19 individuos con G. difficilis
no incluidos en la exploración FST eran homocigotos para un haplotipo de pico puntiagudo (P),
consistente con su apariencia fenotípica (pinzones de tierra de pico afilado). Esto es notable
porque todo el genoma, G. difficilis en Wolf, Darwin y Genovesa están más estrechamente
relacionados con el G. magnirostris de pico romo que con el G. difficilis de Pinta (Fig. 2b).
Un árbol filogenético basado en esta región reveló una profunda divergencia entre los haplotipos
B y P que deben haber ocurrido poco después de la división entre los pinzones de la curruca y
otros pinzones de Darwin (Fig. 3c). Parte desde el pico romoG. magnirostris y g. Conirostris en
España, todos los individuos excepto tres eran homocigotos para los haplotipos de P, los tres
restantes eran heterocigotos. Los dos G. fortis de Daphne Major Island fueron homocigotos, pero
para diferentes haplotipos (BB y PP; Fig. 3c). Las longitudes de rama cortas entre los haplotipos B
son consistentes con un barrido selectivo. Hubo 335 diferencias fijas entre los haplotipos B y P (Fig.
3d, panel superior), que asignamos como derivados o ancestrales sobre la base de la comparación
con la secuencia del grupo externo (L. noctis). Los alelos derivados en el haplotipo B se agregaron
cerca de ALX1, incluida la región descendente (Fig. 3d, panel central). Además, 8 de estas 335
diferencias fijas ocurrieron en sitios conservados, y el haplotipo B llevó el alelo derivado a siete de
ellos (Fig. 3d, panel inferior). Cuatro alelos derivados se produjeron en sitios correspondientes a
los sitios de unión al factor de transcripción en el genoma humano28. Otros dos cambios
constituyen mutaciones de sentido erróneo (L112P y I208V) en los residuos de aminoácidos ALX1
que se encuentran altamente conservados entre aves y mamíferos (Datos extendidos, Fig. 7), y el
análisis de 'Clasificación de intolerantes de tolerantes' (SIFT) 29 clasificó a ambos como dañinos (
puntuación 0.03 para ambos). La proporción de sustituciones sinónimas y sinónimas entre los
alelos P y B es alta (2/1 5 2.00) en comparación con la proporción observada entre el alelo P
ancestral y el pinzón cebra ortólogo (2/14 5 0.14) y humano (21 / 122 5 0.17) secuencias, lo que
sugiere que una o ambas de estas mutaciones sin sentido no son neutrales.
El hecho de que ALX1 sea polimórfico en G. fortis (Fig. 3c, d, panel superior) es particularmente
interesante, ya que las observaciones de campo han demostrado que existe una diversidad
considerable en la forma del pico en esta especie5,30. Genotipamos un genotipo adicional de
62G.fortis aves de DaphneMajor Island para un diagnóstico de polimorfismo de un solo nucleótido
(SNP), y observamos una asociación significativa con la forma del pico (P 5 8.8 3 1025, Fig. 3e). Los
homocigotos PP solían tener picos puntiagudos proporcionalmente largos, los homocigotos BB
tenían picos contundentes proporcionalmente profundos, mientras que los heterocigotos (BP)
tenían formas de pico intermedio. También comparamos las frecuencias de haplotipos entre G.
fortisindividuals en Daphne Major Island con las de Santa Cruz, que tienen un pico más grande y
romo en promedio31, posiblemente como resultado de la hibridación introgresiva con G.
magnirostris4,5. Encontramos que el Bhaplotipo es más frecuente en Santa Cruz que en
DaphneMayor (0,74, n 5 21 versus 0,49, n 5 62; P 5 0,007, prueba exacta de Fisher).
La selección natural sobre el tamaño y la forma del pico de G. fortis en la isla Daphne Major ha
llevado a un cambio evolutivo en las últimas décadas5,30. Además, la variación genética en la
forma del pico se ha incrementado a través de la hibridación introgresiva5,30 con dos especies de
Geospiza, scandens y fuliginosa, que tienen picos relativamente puntiagudos. Por lo tanto,
esperamos que los híbridos y retrocruzamientos en la población de G. fortis tengan una frecuencia
relativamente alta del haplotipo P. Genotipamos un genotipo adicional de 25 G. fortis en ALX1, los
agregamos a la muestra de 62 (Métodos) y comparamos las frecuencias de haplotipos en ocho
híbridos (incluidos los retrocruzas) y 79 no híbridos. ALX1-P tuvo una frecuencia de 0.75 entre los
híbridos y 0.44 entre los demás, lo cual es estadísticamente significativo en la dirección esperada
(P = 0.03, prueba exacta de Fisher). Por lo tanto, los alelos ALX1-P introducidos por hibridación
introgresiva probablemente contribuyeron a la evolución de picos más puntiagudos en 1987
después de la selección natural como resultado de un cambio en el suministro de alimentos en la
sequía 1985–8630.
Discusión
Nuestra filogenia revisada y fechada de los pinzones de Darwin muestra que la radiación
adaptativa tuvo lugar en el último millón de años, con una rápida acumulación de especies
recientemente (Texto Suplementario). Hemos caracterizado genómicamente toda la radiación,
que ha revelado una conexión sorprendente entre la evolución pasada y presente. La evidencia de
hibridación introgresiva, que se ha documentado como un proceso contemporáneo, se encuentra
en toda la radiación. La hibridación ha dado lugar a especies de ascendencia mixta, en el pasado
(este estudio) y en el presente30. Ha influido en la evolución de un rasgo fenotípico clave: la forma
del pico. Se ha descrito una hibridación introgresiva similar que afecta un rasgo adaptativo
(mimetismo) en Heliconius butterflies32. El grado de continuidad entre la evolución histórica y la
contemporánea es inesperado porque la hibridación introgresiva no juega ningún papel en los
relatos tradicionales de las radiaciones adaptativas de los animales1,2. Para las radiaciones
jóvenes complementa el papel más conocido de la selección natural.
Charles Darwin observó por primera vez la diversidad de formas de pico entre los pinzones de las
Galápagos. Nuestro estudio genómico ahora ha revelado algunas de las variaciones genéticas
subyacentes que explican esta diversidad. El descubrimiento de unas 15 regiones con una fuerte
diferenciación genética entre grupos de pinzones con picos romos o puntiagudos indica una base
poligénica para la diversidad del pico. Presentamos evidencia de que el locus ALX1 contribuye a la
diversidad del pico, dentro y entre las especies. El haplotipo ALX1-B derivado asociado a los picos
romos tiene una larga historia evolutiva (cientos de miles de años), debido a que su origen es
anterior a la radiación de los pinzones vegetarianos, de árboles y de tierra (Fig. 3c). Este haplotipo
es fijo o casi fijo en dos pinzones terrestres con picos romos, G. magnirostris yG. conirostris en
Espan˜ola, y co-segrega con variación en la forma del pico en G. fortis. Como se documentó
previamente en animales domésticos33 y poblaciones naturales34, el haplotipo podría haber
evolucionado acumulando cambios en la codificación y regulatorios que afectan la función ALX1.
La selección natural y la introgresión que afectan a este lugar han contribuido a la diversificación
de las formas de los picos entre los pinzones de Darwin y, por lo tanto, a su mayor utilización de
los recursos alimenticios en las Galápagos.