Está en la página 1de 7

20

Machine Translated by Google

en
de
AVANCES DE LA CIENCIA | ARTÍCULO DE INVESTIGACIÓN

21
De
htt
CIENCIAS VEGETALES Derechos de autor © 2017

de
Los Autores, algunos

Revisando la poliploidía ancestral en plantas. derechos reservados;


licenciatario exclusivo

Asociación Americana
Colin Ruprecht,1 *†‡ Rolf Lohaus,2,3,4*‡ Kevin Vanneste,2,3§ Marek Mutwil,1 Zoran Nikoloski,1,5 para el avance

l
Yves Van de Peer,2,3,4,6|| Staffan Persson1,7|| de Ciencia. No hay reclamo de

w
Obras originales del gobierno

Las duplicaciones del genoma completo (WGD) o eventos de poliploidía se han estudiado ampliamente en plantas. En un artículo ahora de EE. UU. Distribuido

bajo una creatividad


ampliamente citado, Jiao et al. presentó evidencia de dos WGD de plantas antiguas y ancestrales anteriores al origen de las plantas con flores
Atribución de bienes comunes

e
y semillas, respectivamente. Este hallazgo se basó principalmente en una distribución de edad bimodal de los eventos de duplicación de genes
No comercial
obtenidos de la datación molecular de casi 800 árboles de genes filogenéticos. Volvimos a analizar los datos filogenómicos de Jiao et al. y
Licencia 4.0 (CC BY­NC).
encontró que la fuerte bimodalidad de la distribución por edades puede ser el resultado de cuestiones técnicas y metodológicas y, por lo tanto,
puede no ser una señal “verdadera” de dos eventos del GTD. Al utilizar un algoritmo de datación molecular de última generación, demostramos
que la distribución de edad bimodal informada no es sólida y debe interpretarse con precaución. Por lo tanto, existe poca evidencia de dos
WGD antiguos en plantas a partir de datación filogenómica.

INTRODUCCIÓN cada. En consecuencia, Jiao et al. (5) afirmó que “varios mecanismos podrían explicar los
Las duplicaciones del genoma completo (WGD) han desempeñado un papel importante […] patrones de duplicación de genes revelados en los árboles de genes, incluida la
durante la evolución de las plantas terrestres. Existe evidencia abrumadora de que todas WGD o las duplicaciones cromosómicas o segmentarias múltiples”
las eudicotiledóneas comparten un evento WGD antiguo (1), denominado g, y alguna (5). Cualquier combinación de estos mecanismos también sería una posibilidad.
evidencia de que la mayoría de las monocotiledóneas también comparten un evento En segundo lugar, el enriquecimiento de categorías funcionales que se sabe que se
WGD antiguo (2), denominado t. Muchos linajes de plantas también han sufrido eventos conservan después de los WGD fue prominente en los ~800 árboles de genes (5).
de poliploidía más recientes (3, 4). Además, utilizando un enfoque filogenómico, Jiao et Aunque esto proporciona apoyo circunstancial para el GTD, ciertamente no permite
al. (5) informaron duplicaciones de genomas antiguos en plantas que ocurrieron antes de distinguir entre uno, dos o más eventos del GTD.
la divergencia de monocotiledóneas y eudicotiledóneas. El estudio presentó tres líneas Finalmente, Jiao et al. (5) realizaron la datación molecular de ~800 árboles de genes
principales de evidencia para respaldar la conclusión de dos WGD antiguos: uno para analizar si estas duplicaciones de genes antiguos habían ocurrido simultáneamente.
compartido por todas las angiospermas existentes y otro aún más antiguo compartido por Los árboles genéticos se calibraron asignando restricciones de edad a ciertos nodos
todas las plantas con semillas existentes. que corresponden a eventos evolutivos conocidos.
Primero, Jiao et al. (5) analizaron casi 800 árboles genéticos que contenían patrones El estudio utilizó restricciones de edad de hace 400 a 450 millones de años (Ma) para la
de duplicaciones de genes antiguos y descubrieron que estas duplicaciones se dividen división de briofitas y traqueofitas (designadas como nodo AL), exactamente 400 Ma
principalmente en dos conjuntos. Las duplicaciones de genes en el primer conjunto para la división de licófitas y eufilofitas (nodo PL), de 125 a 150 Ma para la división de
ocurrieron en el ancestro común de las plantas con semillas (53% de todas las monocotiledóneas (M) y eudicotiledóneas (E) (nodo ME), y un máximo de 125Ma para la
duplicaciones de genes), y las duplicaciones de genes en el otro conjunto ocurrieron en división de rosidas dentro de eudicotiledóneas (nodo RO)
el ancestro común de las angiospermas (44%). Sólo unas pocas de todas las duplicaciones (Figura 1); como máximo, se calibró uno de cada uno de estos nodos en un árbol.
genéticas identificadas parecían haber ocurrido después de la divergencia de las Utilizando estas fechas de calibración, se estimaron mediante algoritmos de reloj
angiospermas basales (3%). En particular, este análisis indicó sólo el marco de tiempo molecular las edades de los nodos que representan duplicaciones de genes ancestrales
evolutivo general dentro del cual cualquiera de las duplicaciones de genes en los dos (situados entre los nodos PL y ME). Jiao et al. (5) encontraron una distribución fuertemente
conjuntos puede haber ocurrido, es decir, en algún momento entre la divergencia de los bimodal de edades de duplicación de genes con dos picos separados alrededor de 319 y 192 Ma.
licófitos y la divergencia de las gimnospermas y en algún momento entre la divergencia Esta agrupación de las edades estimadas de las duplicaciones de genes proporcionó de
de las gimnospermas y la divergencia. de angiospermas, respectivamente. Estos datos manera concluyente un fuerte apoyo para dos eventos antiguos de WGD, indicando un
no son necesariamente indicativos de eventos de poliploidía porque no contienen ninguna WGD en el ancestro común de todas las plantas con semillas y un WGD posterior en el
información sobre si las duplicaciones de genes se agruparon en el tiempo durante estos ancestro común de todas las angiospermas, respectivamente.
dos largos intervalos de ~100 millones de años o más. En el contexto de un proyecto relacionado, volvimos a analizar los datos de Jiao et al.
(5). Sorprendentemente, descubrimos que la notoria bimodalidad de la distribución por
edades probablemente se debía a cuestiones técnicas. Además, no pudimos reproducir
1
Instituto Max Planck de Fisiología Molecular de Plantas, Am Muehlenberg 1, 14476
2 este resultado de Jiao et al. (5) utilizando un algoritmo de datación molecular diferente.
Potsdam, Alemania. Departamento de Biotecnología Vegetal y Bioinformática,
3 Centro VIB de Planta
Universidad de Gante, Technologiepark 927, 9052 Gante, Bélgica.
4 Instituto de Bioinformática
Biología de sistemas, Technologiepark 927, 9052 Gante, Bélgica.
5
Gante, Technologiepark 927, 9052 Gante, Bélgica. Grupo de Bioinformática, Instituto de
Bioquímica y Biología, Universidad de Potsdam, Karl­Liebknecht­Str. 24­25, 14476 Potsdam, Alemania.
6 RESULTADOS
de Pretoria, Pretoria, Departamento de Genética, Instituto de Investigación Genómica, Universidad
7 Utilizando datos proporcionados por Jiao et al. (5), pudimos reproducir la distribución de
Sudáfrica. Escuela de Biociencias, Universidad de Melbourne,
Parkville, Victoria 3010, Australia. edad bimodal de las duplicaciones de genes (Fig. 2A). Esta distribución fue respaldada
*Autor correspondiente. Correo electrónico: ruprecht@mpimp­golm.mpg.de (CR); rolf.lohaus@psb. vib­
por dos clases distintas de topologías de los (sub)árboles de genes compuestos por un
ugent.be (RL)
†Dirección actual: Instituto Max Planck de Coloides e Interfaces, Am Muehlenberg 1, 14476 Potsdam, nodo de duplicación de genes y sus dos clados secundarios: (i) Ambos parálogos se
Alemania. ‡Estos autores conservaron tanto en monocotiledóneas (M) como en eudicotiledóneas (E), denominado
contribuyeron igualmente a este trabajo. §Dirección actual: topología (ME)(ME) (Fig. 1) o (ii) se perdió un parálogo en todas las monocotiledóneas o
Instituto Científico de Salud Pública (WIV­ISP), Juliette Wytsmanstraat 14, 1050 Bruselas, Bélgica.
en todas las eudicotiledóneas, denominado topologías (ME)(E) y (ME)(M), respectivamente
||Estos autores contribuyeron igualmente a este trabajo. (figura S1). Nuestra primera observación fue

Ruprecht y col., Sci. Adv. 2017;3: e1603195 5 de julio de 2017 1 de 6


20
Machine Translated by Google

en
de
AVANCES DE LA CIENCIA | ARTÍCULO DE INVESTIGACIÓN

21
De
htt
de
Physcomitrella_patens_148429 []

Selaginella_moellendorffii_131236 ME M E _
Selaginella_moellendorffii_162424

l
Alabama
Arabidopsis_thaliana_AT2G38670
RO y

w
Vitis_vinifera_GSVIVT00033614001
mi

PL Cucumis_sativus_177150
A MÍ

e
Sorgo_bicolor_Sb05g001470
(150 Ma)
metro
Oryza_sativa_Os11g03050
METRO

Oryza_sativa_Os12g02820

Oryza_sativa_Os10g24810
Nodo de duplicación
(340 Ma) Oryza_sativa_Os08g12830
metro

METRO

Sorgo_bicolor_Sb07g006380

Carica_papaya_supercontig_115.43
MEO
Cucumis_sativus_281820
(202 Ma)
mi Vitis_vinifera_GSVIVT00007159001
mi
Populus_trichocarpa_0006s07030

Populus_trichocarpa_0018s13260

Physcomitrella_patens_121436
0,2

Fig. 1. Nodos de duplicación y calibración en las topologías del árbol de genes filogenéticos. Ejemplo de un árbol de genes con topología (ME)(ME), árbol RAxML_1111 de Jiao et al. (5), en el
que ambos parálogos se conservaron tanto en monocotiledóneas (M) como en eudicotiledóneas (E) después del evento de duplicación. Las estimaciones de edad de los nodos se extrajeron
del archivo de salida original r8s de Jiao et al. (5) y se dan entre paréntesis para los nodos coloreados. Los nodos para la división de briofitas (nodo AL), licófitas (nodo PL), monocotiledóneas
y eudicotiledóneas (nodos ME y MEO) y rosidas (nodo RO) también se extrajeron del archivo de salida original de r8s. El nodo MEO verde era el nodo ME no calibrado en el análisis r8s de
Jiao et al. (5) (indicado por la ausencia de corchetes en el pequeño árbol esquemático en la parte superior derecha). Los nodos M y E representan los nodos de la corona de monocotiledóneas
y eudicotiledóneas, respectivamente. Los nodos m y e son nodos de calibración adicionales que se utilizaron al probar la restricción superior potencialmente demasiado joven para los nodos
ME (consulte Métodos para obtener más detalles). En la fig. se pueden encontrar ejemplos de árboles genéticos con topologías (ME)(M) y (ME)(E). T1

que Jiao et al. (5) calibró solo uno de los dos clados secundarios, es decir, uno de estimaciones de edad de duplicación en los árboles (ME)(M) y (ME)(E) (~160 a 220
los dos nodos ME, en los árboles (ME)(ME). En particular, el algoritmo de datación Ma; Fig. 2D y fig. S2, A y B), y estas estimaciones más jóvenes coincidieron con las
había estimado la mayoría (85%) de estos nodos ME calibrados en exactamente 150 estimaciones más tempranas. WGD reciente inferido en ~ 192 Ma (5).
Ma (Fig. 2B), que es el límite de edad superior del rango de calibración, lo que Estos datos mostraron que dos clases diferentes de topologías de árboles genéticos,
sugiere que esta edad para el límite superior del nodo ME era demasiado joven. Las es decir, (ME)(ME) versus (ME)(M)/(ME)(E), podrían, en gran medida, explicar la
edades del otro nodo ME no calibrado (en adelante denominado nodo MEO) en los bimodalidad en la distribución de edades. de nodos de duplicación de genes en el
árboles (ME)(ME) se estimaron sin restricciones de edad mediante el análisis del estudio de Jiao et al. (5).
reloj molecular. Esta parametrización dio como resultado estimaciones de edad Jiao et al. (5) utilizaron el programa de datación molecular r8s, que utiliza
mucho más antiguas de los nodos MEO, que mostraron una amplia distribución de longitudes de ramas en un árbol filogenético para estimar fechas absolutas para los
edad con un pico de ~220 Ma y, por lo tanto, se estimó en promedio ~70 millones de nodos del árbol (6). Volvimos a analizar los datos originales utilizando BEAST, un
años más que los nodos ME calibrados (Fig. 2B). algoritmo de datación molecular bayesiano ampliamente utilizado que incluye
Esto fue sorprendente porque los nodos ME y MEO deberían representar el mismo alineamientos de secuencias en el análisis (7). Usando las mismas restricciones de
evento evolutivo en un árbol, es decir, la divergencia de monocotiledóneas y calibración que Jiao et al. (5), nuestro análisis BEAST mostró un pico de duplicación
eudicotiledóneas, y por lo tanto deberían tener estimaciones de fechas muy similares. genética a ~300 Ma para los árboles (ME)(ME) y a ~210 Ma para los árboles (ME)
Jiao et al. (5) dedujeron que el más joven de los dos eventos WGD ocurrió ~192 (M) y (ME)(E) (Fig. 3). , A y B). Aunque los picos se acercaron un poco más (Fig.
Ma y, por lo tanto, ocurrió antes de la división de ME. Sin embargo, se estimó que 3C), BEAST mostró un patrón similar en comparación con los resultados de datación
muchos de los nodos MEO, contradictoriamente, eran considerablemente más de Jiao et al. (5). De acuerdo con r8s, BEAST estimó las edades del nodo MEO no
antiguos (~ 220 Ma; Fig. 2B) que este evento WGD inferido. Por lo tanto, planteamos calibrado también en ~220 Ma (fig. S3A), lo que, similar a los análisis de r8s (5),
la hipótesis de que las estimaciones de la edad de duplicación de genes en los podría haber sesgado las edades de duplicación en los árboles (ME)(ME) a
árboles (ME) (ME) podrían estar sesgadas hacia edades mayores más allá de la estimaciones más antiguas.
distribución de edades de los nodos MEO. Encontramos un fuerte sesgo hacia Para abordar el presunto problema de un nodo MEO no calibrado, aplicamos la
edades de duplicación de genes estimadas más antiguas (~ 300 a 370 Ma) en los restricción de calibración del nodo ME a los nodos ME y MEO en los árboles (ME)
árboles (ME) (ME) (Fig. 2C, también en comparación con la distribución de nodos (ME); es decir, calibramos ambos clados secundarios de un nodo de duplicación de
MEO en la Fig. 2B). Estas estimaciones más antiguas coincidieron con las fechas genes. . Este nuevo conjunto de análisis BEAST resultó en un cambio sustancial en
inferidas (~319 Ma) del WGD más antiguo (5). Por el contrario, encontramos un sesgo hacia genes más jóvenes.
las estimaciones de la edad de duplicación genética en

Ruprecht y col., Sci. Adv. 2017;3: e1603195 5 de julio de 2017 2 de 6


htt
Machine Translated by Google

AVANCES DE LA CIENCIA | ARTÍCULO DE INVESTIGACIÓN

A B

d2el
[] [] + [] + []

w
001
ME M E _ ME M E _ ME M E _ ME M E _

2
e
D
d
aicneucerF

53
00 1
2
0

0
100 150 200 250 300 350 400 100 150 200 250 300 350 400

C D
[] [] + [] +

001
001

ME M E _ ME M E _ ME M E _
aicneucerF

0
0

100 150 200 250 300 350 400 100 150 200 250 300 350 400

Tiempo de divergencia (Ma) Tiempo de divergencia (Ma)


Fig. 2. Los dos picos de duplicación corresponden a dos clases distintas de topologías de árboles genéticos. Las estimaciones de edad de los nodos se extrajeron del archivo de salida original de r8s.
de Jiao et al. (5). (A) Estimaciones de edad de los nodos de duplicación de genes en todos los árboles (n = 777). (B) Estimaciones de edad de los nodos ME (azul) y los nodos MEO (verde) en árboles (ME)(ME) (n = 283).
(C) Estimaciones de edad de los nodos de duplicación de genes en árboles (ME) (ME) (n = 283). (D) Estimaciones de edad de los nodos de duplicación de genes en árboles (ME)(E) y (ME)(M) (n = 494). En todos los paneles, el
Los pequeños árboles esquemáticos ilustran la topología general de los árboles correspondientes con el color de los nodos que coincide con el color de las estimaciones de edad mostradas en los histogramas (círculo amarillo
indica el nodo de duplicación de genes; Los círculos azules y verdes indican los nodos ME y MEO, respectivamente). Los corchetes indican qué nodo/clado se ha calibrado.

los árboles (ME)(ME) de ~300 a ~250 Ma (Fig. 3D y fig. S4), lo que indica que la calibración de clases de topologías de árboles genéticos mucho más juntas. Así, el fuerte
solo uno de los dos nodos ME causó una Distribución bimodal por edades de las duplicaciones genéticas observadas por Jiao et al. (5)
sesgar las edades de duplicación en los árboles (ME)(ME). De manera similar, también (Fig. 2A) ya no era evidente cuando se usaba BEAST con métodos más estrictos y más estrictos.
calibramos el segundo clado hijo no (ME) de un nodo de duplicación de genes en restricciones de calibración coherentes (Fig. 3F, tablas S1 y S2, y fig. S5).
(ME)(M) y (ME)(E) mediante la introducción de una calibración adicional Examinar el efecto de la edad potencialmente demasiado joven para la parte superior
nodo, es decir, un nodo M en el clado (M) o un nodo E en el clado (E), límite de la restricción de calibración en los nodos ME, realizamos un

respectivamente (consulte la Fig. 1 y los materiales complementarios para obtener más detalles). análisis adicional usando BEAST. Eliminamos las restricciones de edad en
Esto también provocó un cambio en las estimaciones de la edad de duplicación de genes, aunque todos los nodos ME en todos los árboles y en su lugar utilizó nuevas calibraciones alternativas

solo uno menor, de ~210 a ~200 Ma (Fig. 3E y fig. S4). El en los nodos más jóvenes dentro de todos los hijos monocotiledóneas (M) y eudicotiledóneas (E).
La calibración de ambos nodos secundarios de un nodo de duplicación de genes movió en clados de una duplicación de genes o nodo ME (ver Métodos). Esto resultó
consecuencia las distribuciones de edad de las duplicaciones de genes de los dos. en un cambio en las estimaciones de la edad de duplicación de genes para todos los árboles a ~300 Ma,

Ruprecht y col., Sci. Adv. 2017;3: e1603195 5 de julio de 2017 3 de 6


Machine Translated by Google

htt
AVANCES DE LA CIENCIA | ARTÍCULO DE INVESTIGACIÓN

A B C

d2el
[] [] [] [] [] []
001

001

001

w
ME M E _ YO YO YO YO _ _ _ _ ME M E _ YO YO YO YO _ _ _ _
08

08

08

2
e
D
06

06

06

d
04

04

04
aicneucerF

02

02

02
0

0
100 150 200 250 300 350 400 100 150 200 250 300 350 400 100 150 200 250 300 350 400

D mi F
[] [] [] [] [] [] [] []
[] [] [] []
001

001

001
ME M E _ YO YO YO YO _ _ _ _ ME M E _ YO YO YO YO _ _ _ _
08

08

08
06

06

06
04

04

04
aicneucerF

02

02

02
0

0
100 150 200 250 300 350 400 100 150 200 250 300 350 400 100 150 200 250 300 350 400

Tiempo de divergencia (Ma) Tiempo de divergencia (Ma) Tiempo de divergencia (Ma)

Fig. 3. Distribución de estimaciones de duplicación de genes utilizando BEAST para la datación filogenómica. Fila superior: estimaciones de edad de los nodos de duplicación de genes en árboles con calibración de
sólo un nodo ME [igual que en Jiao et al. (5); ilustrado por un nodo azul con corchetes en pequeños árboles esquemáticos]. (A) Estimaciones de edad en árboles (ME)(ME) (n = 285). (B) Edad
estimaciones en árboles (ME)(E) y (ME)(M) (n = 487). (C) Estimaciones de edad en todos los árboles (n = 772). Fila inferior: estimaciones de edad de los nodos de duplicación de genes en árboles con calibración de ambos
Nodos secundarios de un nodo de duplicación de genes (ilustrados por nodos coloreados con corchetes en pequeños árboles esquemáticos). (D) Estimaciones de edad en árboles (ME)(ME); calibración de ambos ME
y nodos MEO (n = 285). (E) Estimaciones de edad en árboles (ME)(E) y (ME)(M); calibración de los nodos ME y E o M (si este nodo existe), respectivamente (n = 487). (F) Estimaciones de edad
en todos los árboles; calibración de los nodos ME y MEO, E o M (n = 772). A modo de comparación, la distribución de los datos originales de Jiao et al. (5) se muestra en amarillo claro en el
fondo. En todos los paneles, los pequeños árboles esquemáticos ilustran la topología general de los árboles correspondientes (el círculo amarillo indica el nodo de duplicación de genes). Cuadrado
los corchetes indican qué nodo/clado ha sido calibrado.

nuevamente sin apoyo para una distribución bimodal clara [fig. S6A; (A MÍ) En la mayor parte de nuestro reanálisis de los datos de Jiao et al. (5) usando BESTIA,
(ME) árboles solos, ~320 Ma, fig. S6B; (ME)(M)/(ME)(E) árboles solos, Mantuvimos deliberadamente las restricciones de edad y los parámetros de calibración como
~280 Ma, figura. S6C]. Las estimaciones de edad de los nodos ME (ahora todos sin calibrar en el lo más cerca posible de los utilizados por Jiao et al. (5) para que r8s pueda
conjunto completo de árboles genéticos) alcanzaron su punto máximo nuevamente en ~220 Ma (fig. comparar directamente los resultados entre ambos software filogenéticos
S6D). Estos datos indicaron que las restricciones de calibración para el herramientas y particularmente para evaluar los efectos del MEO no calibrado
Los nodos ME solo afectaron el tiempo y no la distribución de la nodo. No intentamos proporcionar una mejor datación molecular de
Estimaciones de la edad de duplicación de genes. estas duplicaciones de genes de plantas antiguas, ni afirmamos que nuestro análisis
proporcione evidencia clara de una sola planta ancestral WGD como
opuesto a dos o más. Se debe tener mucho cuidado en cualquier estudio de datación
DISCUSIÓN filogenómica, especialmente si se analizan eventos evolutivos antiguos.
El estudio de Jiao et al. (5) representó un hito para la investigación siendo investigado. Por lo tanto, lo ideal sería que un mejor análisis de datación examinara
de antiguos eventos de poliploidía en plantas. Sin embargo, mostramos aquí que los efectos de las diferentes restricciones y calibraciones de edad (por ejemplo, distribuciones
su principal evidencia en apoyo de dos antiguos eventos WGD a principios previas uniformes versus no uniformes y sus
Evolución de las angiospermas y las plantas con semillas: una clara distribución de edades bimodal parámetros), así como los modelos y métodos del reloj molecular.
de duplicaciones genéticas—debe interpretarse con cautela y probablemente (por ejemplo, en lo que respecta al manejo de variaciones de tarifas entre sucursales,
causado por problemas técnicos en el análisis de datación filogenómica. que probablemente estén presentes aquí, dada la tremenda evolución evolutiva

Ruprecht y col., Sci. Adv. 2017;3: e1603195 5 de julio de 2017 4 de 6


20
Machine Translated by Google

en
de
AVANCES DE LA CIENCIA | ARTÍCULO DE INVESTIGACIÓN

21
De
htt
distancias involucradas y topologías de árboles genéticos fijos versus estimados), y un modelo de reloj relajado no correlacionado (UCLD) (16) y un modelo evolutivo LG+G

de
luego resumir e interpretar cuidadosamente estos resultados (8­10). Como mostramos (cuatro categorías de tasas). El número de árboles datados con BEAST (n = 722) fue
para el límite de edad superior de la restricción en los nodos ME, la configuración de ligeramente menor que los datados por Jiao et al. (5) usando r8s (n = 779) porque varios
calibración puede influir fuertemente en el momento estimado de los eventos en los árboles no cumplían con los criterios mínimos para nodos de duplicación, como lo
árboles. De manera similar, se pueden argumentar si las otras calibraciones utilizadas describen Jiao et al. (5). Aunque Jiao et al. (5) dataron más de una duplicación de genes

l
por Jiao et al. (5), y por tanto también por nosotros, y sus características sean las más en una pequeña cantidad de árboles, solo fechamos una duplicación de genes por árbol,
adecuadas. Por ejemplo, la restricción de punto fijo de 400 Ma utilizada por Jiao et al. (5) porque no estaba claro qué nodos Jiao et al. (5) utilizado para calificar la segunda

w
para el nodo PL (la división de licófitos y eufilofitos) puede ser demasiado joven y duplicación en estos árboles. Usamos tres conjuntos diferentes de calibraciones previas:
estricto. La evidencia fósil respalda una restricción de edad mínima para este nodo de al (i) las mismas restricciones de edad que en Jiao et al. (5), es decir, una calibración
menos 416 Ma, y las edades estimadas de los nodos varían hasta 446 Ma (11­13). uniforme de 400 a 450 Ma antes en el nodo AL, una calibración uniforme de 399,5 a

e
Además, creemos que la inclusión de gimnospermas de alta calidad y genomas de 400,5 Ma antes en el nodo PL, una calibración uniforme de 125 a 150 Ma antes en el
angiospermas divergentes tempranas probablemente será crucial para resolver el ME nodo y una calibración uniforme de 0 a 125 Ma antes en el nodo RO; (ii) todas las
número y el momento de los eventos de WGD de plantas ancestrales. calibraciones anteriores anteriores, más una calibración uniforme adicional de 125 a 150
Ma previa en el nodo MEO en los árboles (ME)(ME), una calibración uniforme adicional
Tenga en cuenta que, desde la publicación del estudio de Jiao et al. (5), ha habido de 0 a 70 Ma previa en el M nodo, el nodo hijo no ME de un nodo de duplicación de
algunas afirmaciones adicionales en apoyo de antiguos WGD anteriores al origen de genes en árboles (ME)(M) [si este nodo existía porque algunos clados (M) solo
las plantas con flores. Por ejemplo, el análisis de sintenia del genoma de la angiosperma consistían en un solo gen monocotiledónea], y un uniforme adicional de 0 a 125­
divergente temprana Amborella trichopoda reveló evidencia de un evento de WGD antes Calibración previa de Ma en el nodo E, el nodo secundario no ME de un nodo de
del origen de las angiospermas (14). Un segundo evento de WGD sólo pudo identificarse duplicación de genes en árboles (ME)(E) [si este nodo existía porque algunos clados (E)
utilizando el mismo enfoque de datación filogenómica que en el estudio de Jiao et al. solo consistían en un solo gen eudicotiledóneo]; y (iii) no hay restricciones de edad en
(5), que, según los métodos descritos del Proyecto Genoma Amborella (14), puede los nodos ME y MEO, sino restricciones en los nodos dentro de todos los clados (M) y
haber sufrido los mismos problemas técnicos aquí planteados. (E) en un árbol [incluidos los clados secundarios (M) y (E) de los nodos ME y MEO]: una
calibración uniforme de 400 a 450 Ma antes en el nodo AL, una calibración uniforme de
Basado en gran medida en el supuesto de dos WGD, el WGD derivado de los datos de 399,5 a 400,5 Ma antes en el nodo PL, una calibración uniforme de 0 a 125 Ma antes en
sintenia se colocó luego en el ancestro común de las angios­perms (14); Nuestros un nodo en cada uno de los clados (E) (nodos e, similares pero no idénticos a un nodo
análisis potencialmente cuestionan este momento y ubicación filogenética (consulte los RO; consulte a continuación una definición detallada de estos nodos) y calibración previa
Materiales complementarios para una discusión detallada). En otro estudio reciente, el uniforme de 0 a 70 Ma en un nodo en cada uno de los clados (M) (nodos m ; ver más
análisis de las distribuciones de edades parálogas basadas en Ks de varias abajo para una definición detallada de estos nodos).
gimnospermas combinado con un enfoque novedoso basado en la reconciliación del
árbol genético mostró evidencia putativa de una planta con semillas ancestrales WGD
(15). Sin embargo, el estudio no incluyó análisis de ningún evento de duplicación de
angiospermas (ancestrales), es decir, eventos posteriores a la divergencia de Se construyeron automáticamente árboles iniciales de BEAST con longitudes de ramas
gimnospermas y angiospermas (15). Por lo tanto, este estudio tampoco proporcionó que satisfacían todas las restricciones anteriores.
evidencia de los eventos de poliploidía propuestos por Jiao et al. (5). Realizamos un conjunto de análisis BEAST para cada uno de los tres conjuntos de
calibración anteriores anteriores. Para los dos primeros conjuntos, se utilizaron los 772
En conclusión, aunque hay bastante evidencia de diferentes fuentes de que se han árboles, pero el tercer conjunto se ejecutó en un subconjunto más pequeño de 455
producido WGD antiguos en la evolución temprana de las plantas con semillas, creemos árboles por las siguientes razones. Este conjunto se definió sin antecedentes de
que es prematuro concluir sobre el número exacto, el momento y la posición filogenética calibración en ninguno de los nodos ME y MEO y, por lo tanto, requirió antecedentes
de estas duplicaciones antiguas. Un análisis cuidadoso y detallado del reloj molecular y de calibración sustitutos. Debido a que los resultados de los dos primeros conjuntos
secuencias genómicas bien ensambladas con anotaciones de alta calidad de resaltaron la importancia de calibrar ambos clados hijos de un nodo de duplicación
angioespermas divergentes tempranas y diferentes gimnospermas, que proporcionen genética, decidimos calibrar un nodo dentro de cada uno de los clados (M) y (E)
evidencia estructural sobre la colinealidad intra e interespecies, son probablemente existentes, es decir, cuatro sustituir nodos de calibración en árboles (ME)(ME) y tres
claves para resolver esta cuestión. nodos de calibración sustituir en árboles (ME)(M) y (ME)(E). Para evitar cualquier sesgo
en la elección de nodos entre estos clados, especificamos algorítmicamente los nodos
m y e: se requería que los nodos m especificaran un clado con dos a cuatro genes que
MÉTODOS tuvieran al menos un gen de cada una de las dos especies de monocotiledóneas (Oryza
El archivo de salida original de r8s fue proporcionado a pedido por Jiao et al. (5). sativa y Sorghum bicolor), y los nodos e debían especificar un clado con dos a cuatro
Para todos los árboles de genes individuales, las estimaciones de edad de los nodos de genes que tuvieran al menos un gen de al menos dos especies de eudicotiledóneas
interés y la ubicación de los nodos AL, PL, ME y RO se extrajeron manualmente de este diferentes cada uno (consulte la figura S1 para ver ejemplos). Además, requerimos que
archivo de salida r8s. La duplicación no marcada y los nodos MEO fueron inferidos con todos los clados (M) solo contuvieran genes monocotiledóneas y que todos los clados
cierta orientación por Y. Jiao, el autor que realizó el análisis original. (E) solo contuvieran genes eudicotiledóneos [sorprendentemente, esto no siempre se
dio en los árboles originales (5)]. Se excluyó cualquier árbol que no cumpliera con todos
los criterios anteriores, como los árboles que tenían menos de dos genes en cualquiera
Análisis BEAST La de los clados (M) o (E), lo que resultó en el subconjunto más pequeño de 455 árboles.
datación de cada árbol genético se realizó con BEAST (v1.7.4) (7) utilizando las Observamos que el subconjunto de estimaciones de edad de duplicaciones de genes
alineaciones y árboles genéticos originales publicados por Jiao et al. (5) y las del conjunto de datos original de Jiao et al. (5), incluyendo sólo estimaciones de estos
calibraciones originales en los mismos nodos extraídos del archivo de salida r8s (a 455 árboles, mantuvo la distribución bimodal; sin embargo, el pico más joven se redujo
menos que se indique lo contrario, consulte a continuación) (5). BEAST se configuró y más fuertemente que el pico más antiguo (consulte la distribución del fondo amarillo
ejecutó como lo describen en detalle Vanneste et al. (4) usando claro en la figura S6A).

Ruprecht y col., Sci. Adv. 2017;3: e1603195 5 de julio de 2017 5 de 6


20
Machine Translated by Google

en
de
AVANCES DE LA CIENCIA | ARTÍCULO DE INVESTIGACIÓN

21
De
htt
5. Y. Jiao, NJ Wickett, S. Ayyampalayam, AS Chanderbali, L. Landherr, PE Ralph,
Al contrario de los procedimientos comunes en los análisis BEAST, donde

de
LP Tomsho, Y. Hu, H. Liang, PS Soltis, DE Soltis, SW Clifton, SE Schlarbaum, SC Schuster, H. Ma, J. Leebens­
las dataciones moleculares de los árboles se aceptan solo si el tamaño de Mack, CW dePamphilis, Poliploidía ancestral en plantas con semillas y angiospermas. Naturaleza 473, 97­100
muestra mínimo efectivo (ESS) para todas las estadísticas es mayor que un (2011).

cierto valor (comúnmente ≥200), aceptamos y trazamos estimaciones de edad 6. MJ Sanderson, r8s: Inferir tasas absolutas de evolución molecular y tiempos de divergencia
en ausencia de un reloj molecular. Bioinformática 19, 301–302 (2003).
para todos. árboles para poder comparar los resultados de BEAST con los

l
7. AJ Drummond, MA Suchard, D. Xie, A. Rambaut, filogenética bayesiana con BEAUti y BEAST 1.7. Mol. Biol. Evolución.
resultados originales de r8s (5). Sin embargo, la exclusión de todos los árboles
29, 1969­1973 (2012).

w
que tenían un ESS inferior a 200 para cualquiera de las estadísticas dio 8. SYW Ho, S. Duchêne, Métodos de reloj molecular para estimar tasas evolutivas y
resultados cualitativamente similares, es decir, no parecía haber un sesgo escalas de tiempo. Mol. Ecológico. 23, 5947–5965 (2014).

marcado en la topología del árbol de genes o en la estimación de la edad de 9. H. Sauquet, Una guía práctica para la datación molecular. CR Palevol 12, 355–367 (2013).
10. RCM Warnock, JF Parham, WG Joyce, TR Lyson, PCJ Donoghue, Calibración
duplicación de genes entre los árboles que fueron excluidos [242 (~31%) de

e
Incertidumbre en los análisis de datación molecular: no existe sustituto para la evaluación previa del tiempo anterior.
los árboles en el conjunto de datos BEAST con calibración del nodo ME Proc. R. Soc. B 282, 20141013 (2015).
únicamente (Fig. 3C y fig. S5B) tuvieron una ESS <200; 230 (~30%) de los 11. JT Clarke, RCM Warnock, PCJ Donoghue, Establecimiento de una escala de tiempo para la planta

árboles en el conjunto de datos de BEAST con calibraciones de nodo ME y nodo evolución. Nuevo fitol. 192, 266–301 (2011).

MEO, E o M (Fig. 3F y fig. S5C) tenían una ESS <200; y 126 (~28%) de los 12. SA Smith, JM Beaulieu, MJ Donoghue, Un análisis de reloj relajado no correlacionado
sugiere un origen anterior de las plantas con flores. Proc. Nacional. Acad. Ciencia. Estados Unidos 107, 5897–5902
árboles en el conjunto de datos de BEAST sin calibraciones de nodos ME y MEO (figs. 6A y 5D) tenían un ESS <200].
(2010).

13. S. Magallón, Uso de fósiles para romper ramas largas en datación molecular: una comparación de relojes relajados
aplicados al origen de las angiospermas. Sistema. Biol. 59, 384–399 (2010).
MATERIALES COMPLEMENTARIOS El material 14. Proyecto Genoma Amborella, El genoma de Amborella y la evolución de las plantas con flores.
complementario para este artículo está disponible en http://advances.sciencemag.org/cgi/ content/full/3/7/e1603195/ Ciencia 342, 1241089 (2013).
DC1 Diferencias en las estimaciones de 15. Z. Li, AE Baniaga, EB Sessa, M. Scascitelli, SW Graham, LH Rieseberg, MS Barker, Duplicaciones tempranas del
edad de duplicación entre (ME)(ME), (ME)( E) y (ME)(M) árboles Momento y ubicación filogenética del WGD genoma en coníferas y otras plantas con semillas. Ciencia. Adv. 1, e1501084 (2015).
derivado de la tabla de datos de sintenía de Amborella S1. Análisis estadísticos de la modalidad de distribución de
edades de duplicación, tabla S2. Valores del criterio de información bayesiano del análisis 16. G. Baele, WLS Li, AJ Drummond, MA Suchard, P. Lemey, Selección precisa de modelos de relojes moleculares
EMMIX para estimar el número de componentes significativos en las distribuciones de edad de duplicación fig. S1. relajados en filogenética bayesiana. Mol. Biol. Evolución. 30, 239–243 (2013).
Árboles de genes filogenéticos con topología (ME)(E) y (ME)(M). higo. S2. Distribución de 17. PA Naik, P. Shi, CL Tsai, Ampliación del criterio de información de Akaike a la mezcla
estimaciones de duplicación en los árboles (ME)(M) y (ME)(E). higo. S3. Correlación de modelos de regresión. Mermelada. Estadística. Asociación. 102, 244–254 (2007).

la topología del árbol genético con la estimación de duplicación. higo. S4. Correlación de la topología 18. K. Vanneste, Y. Van de Peer, S. Maere, Inferencia de duplicaciones del genoma a partir de la edad.
del árbol genético con la estimación de duplicación. higo. S5. Identificación de componentes distribuciones revisadas. Mol. Biol. Evolución. 30, 177­190 (2013).

significativos mediante SiZer. higo. S6. Reemplazar todas las calibraciones de los nodos ME no 19. SAS Institute Inc., Guía del usuario de SAS/STAT (SAS Publishing, ver. 6, ed. 4, 1990).
cambia el patrón general de distribución de edades de duplicación de genes 20. JA Hartigan, PM Hartigan, La prueba de inmersión de la unimodalidad. Ana. Estadístico. 13, 70–84 (1985).
estimadas por BEAST. 21. R. Pfister, KA Schwarz, M. Janczyk, R. Dale, JB Freeman, Las cosas buenas alcanzan su punto máximo en parejas:
una nota sobre el coeficiente de bimodalidad. Frente. Psicólogo. 4, 700 (2013).
Referencias (17–22) 22. P. Chaudhuri, JS Marron, SiZer para la exploración de estructuras en curvas. Mermelada. Estadística. Asociación. 94,
807–823 (1999).

REFERENCIAS Y NOTAS Agradecimientos: Queremos agradecer a V. Storme por la ayuda con los análisis estadísticos de modalidad.
1. D. Vekemans, S. Proost, K. Vanneste, H. Coenen, T. Viaene, P. Ruelens, S. Maere, Financiamiento: YVdP reconoce el proyecto de asociación de investigación multidisciplinaria “Bioinformática: de
Y. Van de Peer, K. Geuten, Paleohexaploidía gamma en el linaje madre de eudicotiledóneas principales: importancia nucleótidos a redes” (n.° 01MR0310W) de la Universidad de Gante y la financiación del Séptimo Programa Marco de la
para el gen MADS­box y la diversificación de especies. Mol. Biol. Evolución. 29, 3793–3806 (2012). Unión Europea (FP7/2007­2013) en virtud del acuerdo de subvención avanzada 322739 del Consejo Europeo de
Investigación. DOBLAR.
2. R. Ming, R. VanBuren, CM Wai, H. Tang, MC Schatz, JE Bowers, E. Lyons, M.­L. Wang, J. Chen, E. Biggers, J. Zhang, SP fue financiado por una cátedra R@MAP en la Universidad de Melbourne y una subvención FT del Consejo
L. Huang, L. Zhang, W. Miao, J. Zhang, Z. Ye, C. Miao, Z. Lin, H. Wang, H. Zhou, WC Yim, HD Priest, C. Australiano de Investigación (FT160100218). Contribuciones de los autores: CR y RL diseñaron el estudio, realizaron la
Zheng, M. Woodhouse, PP Edger, R. Guyot, H.­B. Guo, H. Guo, G. Zheng, R. Singh, A. Sharma, X. Min, Y. Zheng, mayoría de los análisis y redactaron el manuscrito. Datos analizados por KV, MM y ZN. CR, RL, YVdP y SP escribieron el
H. Lee, J. Gurtowski, FJ Sedlazeck, A. Harkess, MR McKain, Z. Liao, J. Fang, J. Liu, X. Zhang, Q. Zhang, W. manuscrito con la ayuda y aprobación final de todos los autores. Intereses en competencia: Los autores declaran
Hu, Y. Qin, K. Wang, L.­Y. Chen, N. Shirley, Y.­R. Lin, L.­Y. Liu, AG Hernandez, CL Wright, V. Bulone, GA Tuskan, que no tienen intereses en competencia.
K. Heath, F. Zee, PH Moore, R. Sunkar, JH Leebens­Mack, T. Mockler, JL Bennetzen, M. Freeling, D. Sankoff, AH Disponibilidad de datos y materiales: todos los datos necesarios para evaluar las conclusiones del artículo están
Paterson, X. Zhu, X. Yang, JAC Smith, JC Cushman, RE Paull, Q. Yu, El genoma de la piña y la presentes en el artículo y/o en los materiales complementarios. Se pueden solicitar a los autores datos adicionales
evolución de la fotosíntesis CAM. Nat. Gineta. 47, 1435­1442 (2015). relacionados con este artículo.

Presentado el 15 de diciembre de 2016

3. JE Bowers, BA Chapman, J. Rong, AH Paterson, Desentrañando la evolución del genoma de las angiospermas Aceptado el 26 de mayo de
mediante análisis filogenético de eventos de duplicación cromosómica. Naturaleza 422, 433–438 (2003). 2017 Publicado el 5 de julio
de 2017 10.1126/sciadv.1603195

4. K. Vanneste, G. Baele, S. Maere, Y. Van de Peer, El análisis de 41 genomas de plantas respalda una ola de
duplicaciones exitosas del genoma en asociación con el límite Cretácico­Paleógeno. Genoma Res. 24, 1334­1347 Cita: C. Ruprecht, R. Lohaus, K. Vanneste, M. Mutwil, Z. Nikoloski, Y. Van de Peer, S. Persson, Revisitando la poliploidía
(2014). ancestral en plantas. Ciencia. Adv. 3, e1603195 (2017).

Ruprecht y col., Sci. Adv. 2017;3: e1603195 5 de julio de 2017 6 de 6


20
Machine Translated by Google

en
de
21
De
htt
del
Revisando la poliploidía ancestral en plantas.

w
Colin Ruprecht, Rolf Lohaus, Kevin Vanneste, Marek Mutwil, Zoran Nikoloski, Yves Van de Peer y Staffan Persson

e
Ciencia. Adv. 3 (7), e1603195. DOI: 10.1126/sciadv.1603195

Ver el artículo en línea


https://www.science.org/doi/10.1126/sciadv.1603195
Permisos
https://www.science.org/help/reprints­and­permissions

El uso de este artículo está sujeto a los Términos de servicio.

Science Advances (ISSN 2375­2548) es una publicación de la Asociación Estadounidense para el Avance de la Ciencia. 1200 New York Avenue NW,
Washington, DC 20005. El título Science Advances es una marca registrada de AAAS.

Copyright © 2017 Los Autores, algunos derechos reservados; Licenciatario exclusivo de la Asociación Americana para el Avance de la Ciencia. No se
pueden reclamar obras originales del gobierno de EE. UU. Distribuido bajo una licencia Creative Commons Attribution NonCommercial 4.0 (CC BY­NC).

También podría gustarte