Evidencias genómicas de la compleja domesticado en Sudamérica para dar lugar a S.
lycopersicum L. var. cerasiforme (SLC), y SLC más tarde
historia de domesticación del tomate dio lugar a SLL en Mesoamérica a través de la im- cultivado en América Latina portación posterior. La historia de la domesticación del tomate se describe generalmente como un proceso de Resumen El proceso de domesticación de las plantas "dos pasos" con un aumento en el tamaño del fruto desde suele ser prolongado e implica etapas intermedias poco el SP, del tamaño de un arándano, al SLC, generalmente exploradas, con importantes implicaciones para las del tamaño de una cereza, y luego a los tomates comunes trayectorias evolutivas de los rasgos de domesticación. de frutos muy grandes (Lin et al. 2014) que se consumen Anteriormente, se pensaba que la historia de la en todo el mundo. Sin embargo, se sabe poco sobre la domesticación del tomate implicaba dos grandes historia evolutiva del SLC, que se considera el grupo transiciones: una desde el Solanum pimpinellifolium L. intermedio en la domesticación del tomate, pero cuyo silvestre hasta un estado intermedio de estatus ha sido históricamente controvertido. Durante semidomesticación, S. lycopersicum L. var. cerasiforme años, el término SLC se aplicó a un surtido de formas con (SLC) en Sudamérica, y una segunda transición de SLC frutos del tamaño de cerezas que incluían SLL escapados hasta una totalmente domesticada S. lycopersicum L. var. (asilvestrados) en todo el mundo y descendientes híbridos lycopersicum en Mesoamérica. En este estudio entre SLL y especies silvestres (Ranc et al. 2008). empleamos métodos de genómica de poblaciones para Estudios recientes, sin embargo, han revelado que SLC es reconstruir la historia de la domesticación del tomate, un verdadero grupo taxonómico con orígenes en el centro centrándonos en los cambios evolutivos ocurridos en las de Sudamérica (Blanca et al. 2012, 2015). Por lo tanto, etapas intermedias. Nuestros resultados sugieren que el una comprensión exhaustiva de la historia de la origen del SLC puede ser anterior a la domesticación, y domesticación del tomate requiere un amplio muestreo que muchos rasgos considerados típicos de los tomates de poblaciones nativas de SLC, y exclusión de cultivados surgieron en el SLC sudamericano, pero se germoplasma asilvestrado o hibridizado que represente perdieron o disminuyeron una vez que estas formas vástagos modernos de SLL cultivados. Un obstáculo parcialmente domesticadas se extendieron hacia el norte. relacionado con la comprensión de la historia de la Es probable que estos rasgos se volvieran a seleccionar domesticación del tomate es que la mejora genética de forma convergente en el tomate cultivado común, moderna (siglo XX) ha introducido alelos de múltiples antes de su expansión por todo el mundo. Basándonos especies silvestres, a veces distantes, en el SLL para en estos hallazgos, revelamos complejidades en la etapa mejorar la resistencia a las enfermedades y otros rasgos intermedia de la domesticación del tomate y favorables a la industria (Hajjar y Hodgkin 2007). Este proporcionamos información sobre las trayectorias de los germoplasma introducido puede ocultar los verdaderos genes y fenotipos implicados en el síndrome de patrones de la historia de la domesticación. Para superar domesticación del tomate. Nuestros resultados también este obstáculo es necesario muestrear las variedades nos permiten identificar germoplasma poco explorado locales de SLL en lugar de las variedades mejoradas que alberga alelos útiles para la mejora del cultivo. modernas, ya que es probable que las variedades locales se parezcan más a las primeras SLL divergentes. En este Introducción La domesticación de plantas suele implicar estudio empleamos la secuenciación del genoma el cultivo inicial de individuos de una especie de planta completo, la genómica de poblaciones y un muestreo silvestre con rasgos deseables, seguido de una fase exhaustivo de SLL, SLC y SP para reconstruir la historia posterior de mejora de esos rasgos mediante la cría de la domesticación del tomate. En particular, selectiva (Gross y Olsen 2010; Meyer y Purugganan determinamos el papel de SLC en el origen de SLL, 2013). Sin embargo, la historia de domesticación de los evaluamos el alcance de la diversidad genética y cultivos puede ser a menudo prolongada, y las fenotípica en SLL y sus poblaciones estrechamente poblaciones en etapas intermedias experimentan relacionadas, y dilucidamos los cambios genotípicos y múltiples cambios evolutivos, como alteraciones en el fenotípicos que pueden haber ocurrido en cada paso de tamaño de la población, hibridación con poblaciones la historia de la domesticación del tomate. Esta ancestrales y pérdida de rasgos deseables información facilitará la identificación de alelos (Bagavathiannan y Van Acker 2008). Dichos cambios beneficiosos para su reintroducción en las variedades evolutivos pueden afectar en gran medida a la variación modernas de tomate con el fin de mejorar sus genética y fenotípica disponible para cada paso de características agrícolas. domesticación posterior. Centrarse exclusivamente en los puntos finales de los procesos de dominación puede Resultados oscurecer las trayectorias evolutivas de los rasgos y genes favorecidos. Para comprender a fondo el ritmo y los Delimitación de la población. Generamos nuevas límites de la domesticación es necesario examinar las secuencias de genoma completo para 166 muestras, que etapas intermedias y los cambios evolutivos asociados. El representan SP en toda su área de distribución nativa en tomate de cultivo común (Solanum lycopersicum L. var. América del Sur y SLC en toda su área de distribución lycopersicum; SLL) es el cultivo hortícola de mayor valor nativa en América del Sur y Mesoamérica, junto con del mundo y un importante organismo modelo para el variedades locales de SLL de Mesoamérica, que desarrollo del fruto. Estudios previos (Blanca et al. 2012, anteriormente no habían sido suficientemente 2015; Lin et al. 2014) han propuesto que S. pimpi- muestreadas (tabla suplementaria 1, Material nellifolium L. (SP) silvestre de frutos rojos fue suplementario en línea). Analizamos estos datos recién generados con 394 secuencias genómicas de tomate Nuestros resultados sugieren tres poblaciones de SP publicadas anteriormente (Aflitos et al. 2014; Lin et al. fuertemente diferenciadas, según los análisis de 2014), que comprendían principalmente SLL de todo el estructura y FST (Weir y Cockerham 1984) (fig. 1d). La mundo, pero también algunas SP y SLC. Excluimos las diferenciación entre los SP ecuatorianos del norte y del secuencias publicadas que no cumplían nuestros criterios sur (SP NECU y SP SECU; FST = 0,50) sugiere la existencia de calidad o identidad (véase Materiales y Métodos), en de una barrera al flujo genético, consistente con que el particular, descartando las muestras con >25% de datos SP SECU se limita a regiones montañosas, y el SP NECU faltantes, SLL con introducciones silvestres conocidas de ocurre principalmente en zonas costeras (fig. 1b). A prácticas modernas de mejora, y accesiones dudosas diferencia del SP ecuatoriano, el SP peruano (SP PER) designadas como SLC pero con orígenes de fuera de las incorpora accesiones con pertenencia poblacional única, Américas. Nuestro conjunto final incluía 295 accesiones, así como otras que tienen cierta similitud genética con el 49 SP de Sudamérica, 153 SLC de Sudamérica y SP SECU, lo que sugiere flujo genético o ascendencia Mesoamérica, 92 accesiones SLL de Mesoamérica y otros compartida entre estos grupos. Nuestros criterios lugares, y una accesión de S. pennellii Correll incluida detectaron cinco poblaciones de SLC, con diversos grados como outgroup. Se identificó un total de 23.797.503 de heterogeneidad genética y estructura poblacional (fig. polimorfismos de un solo nucleótido (SNPs), incluyendo 1a y d) y un rango geográfico más amplio en comparación 300.687 SNPs sinónimos y 357.572 SNPs no sinónimos, con SP (fig. 1b). Distinguimos tres grupos de SLC alineando las secuencias con el genoma de referencia del principalmente sudamericanos: un grupo heterogéneo SLL ("Heinz 1706", build SL2.50) (Sato et al. 2012). con cierta similitud genética a las poblaciones de SP, También obtuvimos 4.303.329 indels pequeños (≤10 basada en la estructura, y distribuido principalmente en pb). la región amazónica de Ecuador (SLC ECU), un grupo peruano que se da principalmente en las laderas Detectamos un número moderado de inserciones grandes orientales de los Andes (SLC PER), y un grupo más (>10 pb; véase Materiales y métodos) comunes o fijas en localizado y genéticamente homogéneo en el norte de SLC y SLL, pero en gran medida ausentes en SP, pero un Perú (SLC San Martín). Un grupo de accesiones de SLC número sorprendentemente bajo de genes afectados por procedentes principalmente de México, Centroamérica y estas inserciones (tabla suplementaria 2, Material el norte de Sudamérica (SLC MEX-CA- NSA) y otro grupo suplementario en línea). Utilizamos un conjunto de datos que se da predominantemente en México (SLC MEX) de SNPs cuádruples degenerados (4D) para reconstruir la representan las poblaciones más septentrionales de SLC. filogenia de las 295 accesiones, y una estructura A pesar de la similitud en la estructura de la población poblacional estimada utilizando SNPs de genoma (fig. 1a), SLC San Martín, SLC MEX-CA-NSA, y SLC MEX completo (fig. 1a, figs. suplementarias. 1 y 2 y tabla 3, son geográficamente distintos y se diferencian entre sí de Material suplementario en línea). Como se ha forma similar basándose en FST en cuanto a otros grupos documentado anteriormente para las especies de tomate de SLC (fig. 1d). Además, la mayoría de los SLL forman un de frutos de color, los niveles de diversidad genética son conglomerado separado, caracterizado por longitudes de bajos, lo que conduce a ramas cortas, en particular en SLL rama muy cortas, a pesar de tener una estructura de (fig. suplementaria 1, Material suplementario en línea). No población similar con tres grupos SLC (fig. 1a y fig. obstante, observamos una gran congruencia entre los suplementaria 1, Material suplementario en línea). De conglomerados definidos filogenéticamente, los todos los grupos SLC, SLC MEX tiene el nivel más bajo de resultados de la estructura de la población, el origen diferenciación poblacional con SLL (FST ¼ 0.21). Dentro geográfico predominante y las designaciones de grupo de SLL, observamos un subgrupo mayoritariamente (SP, SLC o SLL) en los datos del pasaporte (fig. 1a). Sólo mexicano y otro con accesiones latinoamericanas y otras unas pocas accesiones identificadas como SLL en los variedades cultivadas consumidas en todo el mundo (fig. datos de pasaporte se resolvieron fuera de la agrupación 1a). Nuestros resultados concuerdan con las hipótesis filogenética SLL, ocurriendo dentro de agrupaciones de previas de un origen de SLL en México, tras una accesiones SLC y probablemente indicando propagación hacia el norte de SLC al norte de secuencia introgresiones modernas no reconocidas; estas precisa de los acontecimientos se analiza más adelante. accesiones se excluyeron de los análisis posteriores. También identificamos algunas accesiones etiquetadas Historia de la población. Estimamos el desequilibrio de como SLC que se resolvían dentro de los conglomerados ligamiento (LD) en cada población identificada SP. Éstas tendían a ser genéticamente heterogéneas basándonos en el promedio de r*2 para SNPs en un radio según los análisis de estructura, eran de origen de 1.000 kb entre sí (fig. suplementaria 3, Material geográfico variable y estaban alejadas de todas las demás suplementario en línea). Los valores más bajos de LD se SLC en su ubicación filogenética, lo que tal vez indicaba observaron en SP PER y SLC MEX. Además, observamos orígenes diversos a través de la mezcla. Debido a nuestra LD muy elevados en SP SECU, lo que puede atribuirse al incapacidad para asignar de forma fiable estas accesiones submuestreo de esta población debido a la falta de del a cualquier población, las excluimos de nuestros análisis conocimiento previo de cierta diferenciación entre las posteriores. El resto de las muestras se clasificaron en poblaciones de SP en el sur y el norte de Ecuador. nueve poblaciones bien definidas, basándose en criterios También calculamos los niveles de diversidad genética en combinados de fitogenia, estructura, origen geográfico y todo el genoma (tabla 1) para probar la posibilidad de datos de pasaporte; estas designaciones están eventos de cuello de botella en las principales etapas de respaldadas además por resultados congruentes de un la historia de la domesticación del tomate, como se ha análisis de componentes principales (ACP; fig. 1c). sugerido anteriormente (Lin et al. 2014; Blanca et al. 2015). La diversidad genética en SLC ECU es variación en los datos de SNP. Este árbol tiene un fuerte relativamente alta y comparable a la de las poblaciones soporte de ramas, excepto un soporte moderado en el SP. Esto sugiere que la transición de SP a SLC puede no orden de divergencia de SLC San Martín, SLC PER, y SLC haber implicado un evento de cuello de botella, aunque MEX-CA- NSA. Al permitir un evento de flujo genético, el contacto secundario entre SP y SLC ECU también podría observamos un mayor ajuste del modelo (99%), pero un explicar esta observación. En concordancia con un estudio menor soporte bootstrap para algunos de los nodos de anterior (Lin et al. 2014), los niveles de diversidad la topología del árbol resultante (fig. 2b). Los modelos nucleotídica (p) son un orden de magnitud más bajos en con más eventos de flujo genético, hasta m = 10, no SLL, lo que concuerda con los cuellos de botella mejoraron sustancialmente el ajuste, y sólo el evento de asociados a la domesticación. Sin embargo, la theta de flujo genético entre SP PER y SLC PER tuvo un apoyo Watterson (HW) en SLL es comparable con la de otras consistentemente alto en todos los modelos, por tanto, poblaciones de SLC (tabla 1). Para explorar más a fondo tomamos el m = 1 como el modelo más fiable. Tanto el la demografía, calculamos la D de Tajima media para cada modelo m = 0 como el m = 1 confirman una estrecha población, y observamos que SLL tiene una D de Tajima relación entre SLL y SLC MEX, pero los dos modelos mucho más negativa que cualquier otro grupo (tabla 1), difieren en la posición de SLC PER. Además, el clado que lo que indica una abundancia de alelos raros. incluye SLC MEX-CA-NSA, SLC MEX y SLL tiene un soporte bootstrap más bajo en el modelo con un evento de flujo El hecho de que el exceso de alelos raros se deba genético, lo que indica incertidumbre en la colocación de probablemente a alelos derivados de baja frecuencia SLC MEX-CA-NSA. Utilizamos una prueba de cuatro queda confirmado por las comparaciones del espectro de taxones menos parametrizada (Green et al. 2010) que se frecuencias de sitios (SFS) entre poblaciones (fig. basa en frecuencias alélicas medias por población para suplementaria 4, Material suplementario en línea). Al evaluar el evento de flujo genético sugerido por TreeMix explorar la procedencia de estos alelos raros, y distinguirlo de un posible polimorfismo ancestral. Lo de- identificamos diez accesiones SLL con pequeños signos visamos de forma que la relación probada fuera de mezcla de SP o SLC en nuestro análisis de estructura consistente tanto con el modelo m = 0 como con el m = (fig. 1a), que contienen de forma exclusiva el 49% de los 1 (fig. 2c). Se observó un flujo genético significativo alelos raros. Según los datos de pasaporte, se trata en su (26%, valor P < 0,00001) entre SP PER y SLC PER, mayoría de cultivares modernos (Aflitos et al. 2014; Lin consistente con la firma de mezcla observada en los et al. 2014), que probablemente contengan resultados de la estructura poblacional (fig. 1a). Para introgresiones exóticas obtenidas a través de la mejora evaluar la trayectoria evolutiva de los alelos típicos de contemporánea y que habían superado nuestra selección SLL, calculamos la frecuencia alélica derivada media inicial de variedades mejoradas modernas. Tras excluir (ADAF) en cada población para SNPs con alelos diferentes estas accesiones, el SLL seguía teniendo una D de Tajima entre el genoma de referencia (un SLL) y el outgroup S. sustancialmente negativa (tabla 1) y una SFS sesgada (fig. pennellii. Observamos un aumento gradual de la ADAF suplementaria 4, Material suplementario en línea), lo que comparando SP con SLC y SLC con SLL, así como una indica que la prevalencia de alelos raros también se da en ADAF similar en SLC MEX-CA- NSA y en SLC San Martín las variedades autóctonas y en los cultivares de SLL (fig. 2d). Estos resultados apoyan a SLC MEX como el menos improbados. De los alelos raros en estas pariente más cercano y posiblemente antepasado directo accesiones de SLL restantes, el 31% eran exclusivos de de SLL. También estimamos las fechas de divergencia de SLL, y el resto segregaban en SLC y/o SP. Esto sugiere los principales acontecimientos en la historia de la que muchos alelos raros en el conjunto de cultivares domesticación del tomate utilizando “dadi” (Gutenkunst autóctonos/no mejorados de SLL se adquirieron a partir et al. 2009). Evaluamos modelos que tenían en cuenta el de la variación existente en SLC, unos pocos proceden de flujo genético en diferentes puntos de divergencia, así grupos silvestres como SP, pero una parte sustancial como modelos que incorporaban cambios en el tamaño puede ser nueva. Estos resultados se ven respaldados por de la población (fig. 8 suplementaria, Material la presencia de una elevada proporción de alelos privados suplementario en línea), y descubrimos que los modelos derivados en SLL con frecuencias principalmente bajas. La complejos solían estar más respaldados estadísticamente acumulación de alelos nuevos de baja frecuencia podría , lo que sugiere que los estudios anteriores pueden haber deberse a la mutación durante la expansión de la subestimado los tiempos de divergencia en la historia de población a medida que el cultivo se extendía por todo el la domesticación del tomate. Según nuestros resultados, mundo o a la relajación de la selección natural que SLC probablemente divergió de SP hace ~78 mil años (ka; permite la acumulación de mutaciones deletéreas (Moyers +-ka). La divergencia inicial de los grupos septentrionales et al. 2017). se estimó en 13 +- 2 ka, con una divergencia posterior Sin embargo, no podemos descartar completamente la del grupo SLC MEX + SLL de casi 10 +- 1 ka. Estimamos posibilidad de que haya habido una pequeña mezcla que el origen de SLL ocurrió ~7 ka, sin expansión en el genética de algunas variedades de tomate con grupos tamaño de la población de SLL (nu2 = 0,35) sugiriendo distantes no examinados. Para investigar el orden de que la extrema D de Tajima en SLL puede ser más divergencia entre las poblaciones de tomate definidas impulsada por la acumulación de mutaciones deletéreas anteriormente y la posibilidad de flujo genético entre durante el proceso de domesticación. Cabe señalar que ellas, utilizamos una herramienta llamada TreeMix (v1.13). las complejidades generales de las historias de Usamos todos los SNP disponibles y descubrimos que una domesticación de cultivos, que a menudo implican topología sin flujo génico (m= 0) explica el 98% de la expansiones de la población, cuellos de botella y contactos secundarios, así como una fuerte selección domesticación en el que se favorecieron muchas de las positiva que puede tener grandes efectos genéticos a mismas tendencias fenotípicas que en SLL. través de la vinculación, hacen que sea especialmente difícil ajustar modelos demográficos. A pesar de nuestros Curiosamente, para muchos de estos rasgos de esfuerzos por incorporar estos factores en nuestros domesticación, parece haber un patrón en forma de N- (o modelos de la historia de la domesticación del tomate, И-) al considerar las medianas de los rasgos para las advertimos de que existen incertidumbres inherentes a poblaciones en el orden de la transición de SP a SLC y la nuestras estimaciones de fechas, como ilustran los valores posterior expansión geográfica desde América del Sur residuales obtenidos. hasta Mesoamérica. Es decir, tomando el modelo de historia poblacional que hemos sugerido anteriormente Nuestros análisis sugieren una historia poblacional (fig. 3), y asumiendo que los rasgos fenotípicos actuales compleja para el tomate cultivado y sus parientes. de la población reflejan aquellos en el momento de la Basándonos en los resultados combinados de todos los divergencia, la tendencia sugiere una transición general análisis de historia poblacional aquí presentados, de fenotipos de silvestre a domesticado en las proponemos el siguiente escenario para la domesticación poblaciones de SLC en América del Sur (SLC ECU, SLC del tomate (fig. 3). El SLC probablemente divergió del SP PER y SLC San Martín), una reversión a fenotipos más hace más de 78 ka, una fecha anterior a las estimaciones parecidos a los silvestres en las poblaciones de SLC del de la presencia humana en Sudamérica y Mesoamérica, y norte (SLC MEX-CA-NSA y SLC MEX), y finalmente una probablemente se debió a una divergencia natural y no a segunda transición de fenotipos de silvestre a un evento de domesticación. La alta heterogeneidad domesticado en el SLL. Esta tendencia también sugiere genética en la ECU del SLC se debe probablemente a que la expansión de SLC hacia el norte de América del Sur polimorfismos ancestrales y/o al flujo de genes tras el y Mesoamérica pudo haber relajado la selección artificial proceso de divergencia con el SP, según el modelo “dadi” para rasgos preferidos por los humanos o favorecido mejor soportado. Posteriormente, el SLC parece haberse fenotipos más parecidos a los silvestres, quizás como una extendido hacia Perú (SLC PER y SLC San Martín), necesidad de adaptación a las condiciones locales en experimentando el SLC PER un flujo génico local con el latitudes más altas. SP PER. Entre 10 y 13 ka, se originaron el SLC MEX CA- NSA, y el SLC MEX seguido de su propagación hacia el Interesantemente, algunos fenotipos que comúnmente se norte hasta Mesoamérica. No podemos distinguir cree que son rasgos de domesticación, como el menor fácilmente si estos dos grupos SLC se extendieron hacia contenido de tomatina (Zhu et al. 2018), parecen no ser el norte de forma independiente o si divergieron entre sí el resultado de ningún proceso de domesticación en los después de su migración hacia el norte, pero la presencia tomates, sino que es más probable que estén asociados de algunas accesiones de cada grupo en América del Sur con la preferencia local o la adaptación local, ya que los podría indicar extensiones separadas hacia el norte. El niveles son más altos en un solo grupo SP (SP SECU) y tomate cultivado común (SLL) y el SLC MEX parecen haber muestran una mayor varianza en las poblaciones divergido ~7 ka, con una porción del SLL llevada peruanas SLC y en SLL. Del mismo modo, el licopeno, el posteriormente a Europa, desde donde se propagó a pigmento responsable del color rojo de los frutos del otros países del mundo. Aunque la propagación hacia el tomate, parece haber aumentado su contenido en el norte del SLC y el origen del SLL coinciden con la origen del SLC, pero no muestra una tendencia marcada presencia humana en Mesoamérica y Sudamérica y en el origen del SLL. pueden haber sido mediados por humanos, el momento Para cada uno de los fenotipos observados, obtuvimos las del origen del SLC en Sudamérica plantea dudas sobre el variantes con mayor correlación mediante estudios de papel de los humanos en el origen de este grupo. asociación de todo el genoma (GWAS). Nuestras variantes Evolución de los rasgos asociados al síndrome de más significantes se localizaban a menudo dentro o cerca domesticación del tomate. Para entender cómo han de genes candidatos plausibles conocidos o nuevos, lo cambiado los fenotipos de los frutos a lo largo de la que sugiere que los resultados de nuestro GWAS revelan historia de la domesticación del tomate, hemos medido loci causales o estrechamente vinculados para muchos de varios rasgos importantes para la mejora del tomate y el los rasgos analizados (tabla 2). Por ejemplo, la atractivo para el consumidor (Paran y Van Der Knaap concentración de sólidos solubles (Brix) se correlacionó 2007; Huang y van der Knaap 2011) en nuestro conjunto con un SNP sin sentido (Asn a Asp) dentro de Lin5 original de accesiones secuenciadas. Es evidente que las (Solyc09g010080), que codifica para una beta- accesiones comunes de tomate cultivado (SLL) han fructofuranosidasa, una invertasa extracelular implicada experimentado cambios radicales en comparación con los en el metabolismo de la sacarosa, y que previamente se fenotipos de tomate silvestre (SP), con frutos que en ha implicado en cambios en el contenido de azúcar en la promedio tienen pericarpos más gruesos, más lóculos, domesticación del tomate. El número de lóculos está menor peso seco, niveles más bajos de betacaroteno, asociado con el factor de transcripción WUSCHEL, que sólidos solubles y ácido cítrico, y niveles más altos de está implicado en el destino de las células madre (Munos ácido málico (fig. 4). Muchos de estos fenotipos de SLL et al. 2011). El ácido málico se asoció con un indel aguas (aunque no todos; véase, por ejemplo, ácido málico) arriba de Solyc06g072840, que codifica para una también son evidentes en cierto grado en las poblaciones proteína 1 inducida por peróxido de hidrógeno, un gen sudamericanas de SLC, lo que es consistente con que la altamente expresado en frutos y semillas de tomate y transición de SP a SLC representó un evento de parte de una red de coexpresión implicada en el ciclo de Krebs (CoNekT 2019), a través de la cual el ácido málico condiciones experimentadas a medida que el SLC se se convierte en ácido cítrico, por lo que es un candidato extendía hacia el norte condujeron, en promedio, a probable para el rasgo. fenotipos frutales más silvestres y, a veces, a inversiones en las frecuencias alélicas. Es probable que estos SLC En varios casos, la tendencia en forma de N- (o И-) que mesoamericanos sean capaces de sobrevivir en estado observamos en los fenotipos también se refleja en la salvaje a pesar de los distintos grados de asociación con distribución genotípica de los alelos correlacionados con hábitats creados por el hombre. Por último, deducimos cada fenotipo (fig. 4), lo que indica que los "alelos de que durante la transición de SLC a SLL en México se domesticación" derivados aumentaron en frecuencia produjo un evento de redomesticación a partir de durante los orígenes tanto del SLC como del SLL, pero ancestros que, en promedio, eran fenotípicamente más disminuyeron en frecuencia en los grupos SLC del norte. silvestres que los SLC sudamericanos. Tal evento de Sin embargo, se observaron algunas excepciones a esta redomesticación no fue necesariamente de novo, ya que tendencia genotípica, como que SLC MEX- CA-NSA y SLC parece haber implicado la reselección o reutilización de MEX ganaron un alelo nuevo asociado con un mayor alelos ancestrales de domesticación que se redujeron en contenido medio de glucosa, y un aumento en la frecuencia pero persistieron en SLC durante su expansión frecuencia de un alelo nuevo o raro asociado con un hacia el norte. Así pues, la historia de la domesticación mayor promedio de ácido málico en SLL. La tendencia del tomate abarca una etapa intermedia compleja y para el ácido cítrico, por el contrario, está correlacionada multifacética, en la que diversas poblaciones ancestrales con el aumento de la frecuencia de un alelo derivado raro de SLC experimentaron destinos genotípicos y fenotípicos en las poblaciones del norte de SLC que parece haber contrastados. desaparecido en SLL. Señales genómicas de selección durante la historia de la También examinamos ocho genes candidatos que se sabe domesticación del tomate. que controlan fenotipos subyacentes a la variación de rasgos del fruto en tomates cultivados y que también Se realizaron varios análisis para identificar las regiones pueden estar asociados a la domesticación, como la forma genómicas sometidas a una fuerte selección positiva del fruto (OVATE y OFP20), el peso del fruto (CNR, KLUH durante cada una de las principales etapas de la historia y CSR), el número de lóculos (WUSCHEL y CLV3) o la de la domesticación del tomate. Las posibles regiones de inflorescencia articulada (MADS1). Las distribuciones de barrido selectivo se identificaron en función de la genotipos de alelos causales para estos genes también reducción en todo el genoma de la diversidad media de revelan una tendencia en forma de N- (o N-), similar a la nucleótidos (ratio p), la diferenciación genética (FS ) y la tendencia anterior, para CNR, WUSCHEL y MADS1, lo que desviación de la SFS de la neutralidad, calculada mediante sugiere que las distribuciones genotípicas se vieron SweeD (Pavlidis et al. 2013) entre poblaciones afectadas por los orígenes de SLC y SLL, y la expansión ancestrales y descendientes. Las regiones significativas se hacia el norte de SLC. De manera similar a la tendencia definieron como aquellas dentro de los valores del 2% descrita anteriormente, estos alelos causales previamente superior para al menos dos estadísticos. Nuestros análisis asociados con la domesticación del tomate parecen haber altamente conservadores fueron diseñados para disminuir sido reducidos en frecuencia en el SLC mesoamericano, la posibilidad de falsos positivos, y se utilizaron para pero permanecieron como parte de la variación revelar señales de barridos selectivos durante 1) el origen permanente en estos grupos. Nuestros resultados de SLC, comparando SP con SLC ECU, 2) la propagación también revelaron que CSR, que ha demostrado ser un hacia el norte de SLC, comparando el SLC sudamericano importante contribuyente al peso de la fruta (Mu et al. (SLC ECU-PER-San Martín) con las extensiones hacia el 2017), desempeñó un papel en el origen de SLL, pero no norte de SLC (SLC MEX- CA-NSA y SLC MEX), y 3) el origen de SLC. La comparación de las distribuciones de de SLL, comparando SLC MEX con SLL. frecuencias alélicas de CNR, WUSCHEL y MADS1 con El origen de SLC parece haber implicado un número nuestros resultados de ADAF (fig. 2d) revela que, aunque mucho mayor de barridos putativos (133) en comparación a nivel de todo el genoma, SLC MEX y SLC MEX-CA-NSA con cualquier otro grupo (SLC MEX-CA-NSA: 54, SLC son grupos altamente derivados entre los SLC, ambos MEX: 91, y SLL: 55. Esto sugiere que el origen del SLC grupos parecen haber experimentado una reversión a implicó la selección sobre más rasgos o rasgos con más alelos ancestrales para múltiples loci asociados con genes subyacentes que cualquier otro evento principal en rasgos de domesticación de la fruta. la historia evolutiva del tomate domesticado. El Basándonos en estos resultados y en la historia enriquecimiento de términos de la ontología génica (GO) poblacional inferida, hacemos varias inferencias sobre la entre los genes que aparecen en las regiones de barrido evolución de los tomates domesticados. En primer lugar, no reveló tendencias claras en las transiciones la antigua divergencia entre SLC y SP sugiere que SLC se examinadas. La transición original de SP a SLC incluye originó en Ecuador como especie silvestre (fig. 3). Sin varios términos relacionados con el transporte intracelular embargo, dada la prevalencia de fenotipos de y la reparación del ADN, pero el significado biológico de domesticación en el SLC sudamericano y los datos de la selección en estos genes no es obvio. Algunos términos pasaporte que indican el uso humano actual, la selección GO posiblemente relacionados con la maduración del posterior probablemente fue mediada por el hombre y fruto estaban sobrerrepresentados en barridos favoreció varios rasgos de fruta similares a los específicos de la expansión hacia el norte de SLC, como favorecidos en el SLL. También inferimos que las "proceso metabólico de carbohidratos" y "proceso catabólico de macromoléculas de la pared celular". Al menos una de las extensiones hacia el norte (el origen del a la sequía (SlAGO4A y WAT1; Huang et al. 2016; Lee et SLC MEX) tiene múltiples términos GO relacionados con al. 2018). Estos genes pueden tener funciones la defensa de las plantas ("proceso catabólico de la potenciales en la adaptación de SLC ECU a un entorno quitina", "regulación de la vía de señalización mediada más boscoso que el típico de SP. El origen de SLC MEX- por ácido salicílico" y "regulación de la respuesta de CA-NSA, un grupo con una amplia distribución y notable defensa"), lo que quizá indica la necesidad de adaptarse colonización de la costa occidental seca de México, está a nuevas presiones bióticas. La diversidad de términos asociado a un barrido que incluye un gen de tolerancia a sobrerrepresentados en la transición de SLC a SLL sugiere la sequía (CAT1; Li et al. 1998). Por el contrario, los genes que ningún proceso biológico dominó el paisaje de asociados con la resistencia a la disfacilidad o la defensa selección durante el origen de los tomates cultivados son más evidentes en los barridos en el origen de SLC modernos. A continuación, examinamos si algún loci MEX, por ejemplo SOLYC02G031790, NBS-IRR y asociado con nuestros rasgos frutales examinados se GAME12 (Itkin et al. 2013), en consonancia con la solapaba con las regiones de barrido. Aunque el locus sobrerrepresentación del término GO, y posiblemente exacto al que se dirige la selección no puede implicando la adaptación al crecimiento bajo diferentes determinarse únicamente a partir de los datos de ambientes bióticos a medida que los tomates se movían barridos, el solapamiento entre los resultados de los hacia el norte. Los genes notables bien estudiados GWAS y los de los barridos sugiere qué rasgos pueden asociados con las regiones de barrido específicas de la haber sido moldeados por la selección positiva durante la redomesticación de SLL a partir de ancestros silvestres evolución del tomate, y en algunos casos puede incluyen LIN7, una invertasa de pared celular que puede vincularse a genes candidatos conocidos. Con nuestros ser importante para la fertilidad (Slugina et al. 2018). Por estrictos criterios de filtrado de barridos, encontramos último, observamos que si se relajan nuestros estrictos barridos asociados con picos GWAS sólo para peso seco, criterios de filtrado de barridos, se puede considerar que número de lóculos, sólidos solubles y ácido cítrico. La muchos más genes previamente caracterizados muestran selección positiva parece haber impulsado el aumento del signos de selección durante la historia de dominación del peso seco y del número de lóculos observado en el origen tomate. Por ejemplo, detectamos señales de selección del SLC, y puede haberse dirigido al bien estudiado gen más débiles, es decir, basadas en estadísticas de barrido candidate WUSCHEL. Por el contrario, los sólidos solubles único, para regiones que contienen numerosos genes son el rasgo más asociado con la selección durante el bien estudiados implicados en el metabolismo de la evento de redomesticación que condujo al SLL. resistencia a enfermedades secundarias, los relojes Curiosamente, los loci asociados tanto con el tamaño del circadianos, la fotosíntesis y el desarrollo y morfología del fruto (número de lóculos) como con el sabor (ácido cítrico) fruto. se solapan con barridos en ambos eventos de expansión hacia el norte del SLC, lo que sugiere que algunos Discusiones. cambios fenotípicos observados en esta expansión Hemos reconstruido una posible historia de pueden haber sido impulsados por la selección más que domesticación de los grupos de tomates, centrándonos por la deriva. Notablemente, de los rasgos examinados especialmente en la poco explorada etapa intermedia con patrones en forma de N, ninguno dio señales de representada por el SLC. Hemos descubierto que el SLC selección tanto durante la domesticación inicial del SLC se originó en Ecuador probablemente como una especie como durante la redomesticación del SLL, sugiriendo que silvestre a lo largo de 78 ka (78 mil años antes del no toda la convergencia fenotípica entre estos eventos presente), probablemente como un evento de vicarianza fue necesariamente impulsada por la selección, o que la (separación debido a cambios en la geografía o el selección para un rasgo frutal dado no fue igualmente ambiente) que separó a las poblaciones SP más costeras fuerte para ambos eventos. Sin embargo, si se adoptan del SLC emergente del interior. Curiosamente, a pesar de estándares más laxos para detectar barridos, como un la edad de este origen SLC y la evidencia de flujo de corte del 5%, genes bien conocidos que afectan a genes de SP en SLC PER, los SLC sudamericanos aspectos del desarrollo del fruto (por ejemplo, WUSCHEL) generalmente muestran rasgos de fruta consistentes con o a la estructura de la inflorescencia (por ejemplo, el síndrome de domesticación del tomate (definido como MADS1), aparecen cerca de los barridos tanto en los rasgos que vemos en SLL), incluyendo tendencias hacia orígenes del SLC como en la redomesticación del SLL. frutos de mayor tamaño que SP, pericarpos más gruesos, También exploramos si nuestros barridos podían más lóculos, menor ácido cítrico, menores sólidos proporcionar pistas sobre la diversidad de fenotipos solubles, y menor beta-caroteno. Aunque es posible que distintos de los relacionados con el tamaño del fruto en la selección natural haya dado forma a los rasgos frutales cada etapa de la historia del tomate. Aunque los datos de presentes en las SLC sudamericanas, especulamos que es barrido no permiten determinar el gen exacto al que se improbable que la selección natural se superponga con dirige la selección en cada región, centramos nuestro las preferencias humanas hasta tal punto. examen en genes con funciones supuestamente Desafortunadamente, se sabe muy poco de los animales conocidas. Así, en el origen de SLC a partir de SP, dispersores de los SLC en Sudamérica para determinar si encontramos genes en regiones de barrido implicados en estos rasgos frutales podrían haber sido impulsados por la tolerancia al frío (MPK2; Lv et al. 2017), el desarrollo la selección mediada por animales. El examen de los datos floral (SlDEF; De Martino et al. 2006), el desarrollo del de los pasaportes sugiere que la mayoría de las fruto (ETR2, SlOFP21, SlSUN14 y TBG3; Klee y Tieman accesiones de SLC sudamericanas han sido recolectadas 2002; Huang et al. 2013; Eda et al. 2016), la tolerancia en áreas de influencia humana, incluso cuando la evidencia directa de cultivo intencionado sólo es evidente algunos genes asociados con la resistencia a a veces, con algunas SLC recolectadas vendidas en enfermedades y la tolerancia al estrés abiótico en los mercados, pero la mayoría procedentes de entornos como barridos de estos grupos apoya un papel de la selección patios traseros y bordes de campos. Los grupos durante las expansiones hacia el norte. En conjunto, intermedios con evidencias de uso humano no son poco nuestro árbol de poblaciones, la identidad de los grupos comunes en cultivos, y también se han reportado para de SLC que se han extendido hacia el norte, nuestras chiles, Capsicum annuum L. (Aguilar-Mel'endez et al. estimaciones de fechas de divergencia para las 2009). Dado esto, proponemos que el uso humano migraciones septentrionales y para el origen de SLL, los consistente del SLC puede haber moldeado la evolución niveles estimados de diversidad genética y el análisis de la fruta en el SLC sudamericano, pero sólo después de ADAF, son coherentes con SLC MEX como probable que el SLC divergiera naturalmente del SP. Esta selección ancestro directo de SLL. Así, el origen del tomate humana puede haber llevado a las SLC sudamericanas al cultivado común, SLL, alrededor de 7 ka, probablemente punto en que las plantas domesticadas han superado en implicó la reselección de rasgos de domesticación a partir número a las SLC puramente silvestres. En apoyo de de SLC, fenotípicamente más silvestre. Nuestra nuestra hipótesis, cuando dividimos el grupo SLC ECU en interpretación de la historia de la domesticación del dos grupos según nuestro árbol filogenético (fig. 1a), un tomate podría verse alterada si los fenotipos clado presenta un tamaño medio de fruto más pequeño y poblacionales actuales de los grupos SLC difieren en gran se asemeja más al fenotipo típico de SP. Sin embargo, medida de las poblaciones ancestrales en el momento de este clado también presenta una estructura de población la divergencia. A pesar de la ausencia (por lo que más compartida con SP, lo que dificulta separar los sabemos) de datos arqueológicos sobre los fenotipos del efectos de un posible flujo genético en los fenotipos. No tomate en el pasado, nuestro escenario de obstante, observamos que nuestros análisis no redomesticación se ve reforzado por la presencia de dos detectaron un flujo genético significativo entre los grupos poblaciones mesoamericanas de SLC separadas con SP más distantes y SLC ECU, lo que sugiere que la distribuciones fenotípicas similares para muchos de los similitud se debe probablemente a polimorfismos rasgos de domesticación. Esto sugiere que el proceso de ancestrales compartidos. Aunque las accesiones de SLC propagación hacia el norte, que debió preceder a los que presentan rasgos consistentes con la domesticación orígenes del SLL, conllevó obligatoriamente cambios son persistentes en Sudamérica, notablemente, estos fenotípicos cada vez que se producía. Como alternativa, rasgos se redujeron una vez que el SLC se extendió hacia hemos considerado escenarios en los que el SLL el norte. Las poblaciones de SLC del norte de Sudamérica, evolucionó directamente, como un evento de mejora, a Centroamérica y México tienen, en promedio, frutos más partir del SLC sudamericano (SLC PER o SLC San Martín) pequeños, con menos lóculos, pericarpos más delgados y con el SLC MEX como un derivado asilvestrado del SLL o niveles más altos de betacaroteno y ácido cítrico que los del SLC sudamericano. Sin embargo, los orígenes SLC sudamericanos. Dado que los orígenes de estos independientes de SLC MEX y SLL a partir de SLC grupos se remontan a unos 10-13 ka, es posible que la sudamericano no son compatibles con nuestros árboles propagación hacia el norte fuera llevada a cabo por los de población mejor soportados (fig. 2a y b), y SLC MEX humanos, ya fuera de forma intencionada o no, como como derivado asilvestrado de SLL no es consistente con acompañante de las malas hierbas. Podría ser que los los mayores niveles de diversidad genética en SLC MEX rasgos de domesticación se redujeran porque estas (tabla 1), los resultados de ADAF (fig. 2d), o el mayor poblaciones de SLC se volvieron más asilvestradas, es rango geográfico de SLC MEX en Latinoamérica (fig. 1b). decir, menos asociadas a los humanos o seleccionadas Curiosamente, a pesar del amplio rango geográfico de los por ellos, a medida que se extendían hacia el norte. Sin grupos mesoamericanos de SLC, que se extiende hasta el embargo, a pesar de la reducción de los rasgos de norte de Sudamérica, el SLL cultivado parece haber domesticación, los SLC en el norte de Sudamérica y surgido sólo en México. Este evento parece haber Mesoamérica siguen estando asociados en gran medida ocurrido en el este de México, en un área con entornos creados por el hombre, aunque no siempre geográficamente distinta de la presencia del SLC MEXCA- bajo cultivo intencionado, por ejemplo, dentro de los NSA en México. campos de maíz en México (Chacón y Gliessman 1982; Casas et al. 2016). Alternativamente, mientras se Nuestro escenario de un origen del SLL a partir de extendían hacia el norte, los tomates se habrían ancestros del SLC MEX es consistente con los argumentos encontrado con condiciones bióticas y abióticas asociadas presentados por Jenkins (1948) de que la asociación del a latitudes más altas, como cambios de temperatura, SLC con ambientes humanos, así como la abundancia de disponibilidad de agua o patógenos. Por tanto, la nombres nativos para formas pequeñas de SLC "tipo selección de genes que respondieran a estas nuevas maleza" en México, en contraste con la escasez de condiciones podría haber impuesto costes u optado por nombres para el tomate cultivado común más grande (es la preferencia humana, reduciendo algunos rasgos de decir, SLL), apoyan un establecimiento más antiguo de domesticación. Al menos algunos de los rasgos frutales estas "formas de maleza" en Mesoamérica, a partir de las que estudiamos, como el ácido cítrico y el número de cuales el tomate cultivado fue domesticado lóculos, están asociados a barridos selectivos en los posteriormente. Esta reselección de rasgos de grupos SLC septentrionales, lo que sugiere que los rasgos domesticación puede ser considerada esencialmente fueron moldeados por la selección positiva impuesta por como un evento de redomesticación, que fue permitido las nuevas condiciones ambientales más que por la por la variación permanente que mantuvo alelos de selección relajada y la deriva. Asimismo, la aparición de domesticación de baja frecuencia para algunos rasgos, originalmente del SLC sudamericano, en el SLC mesoamericano.
Conclusiones. Los resultados proporcionados en este
estudio pueden aplicarse en un contexto más amplio al estudio de la dinámica de la domesticación y de la evolución convergente, dada la presencia de rasgos similares en SLC y SLL sudamericanos y las similitudes entre los dos grupos de SLC que se extendieron hacia el norte. Basándonos en múltiples líneas de evidencia proporcionadas en este estudio, revelamos las complejidades en las etapas intermedias de la historia de la domesticación del tomate y abogamos por un muestreo más amplio y un mayor cuidado en la definición de las poblaciones consideradas intermedias en la historia de la domesticación de cualquier cultivo. Recientemente, un enfoque similar reveló complejidades en la domesticación del maíz con la mejora en América del Sur después de una domesticación parcial en México, así como la diversificación independiente de algunos linajes semidomesticados en razas autóctonas en México y más allá (Grimaldo et al. 2018). Los múltiples cambios evolutivos entre grupos revelados al explorar las etapas intermedias de la domesticación del tomate también tienen implicaciones directas para la mejora de los cultivos. Por ejemplo, el mayor contenido de betacaroteno en el SLC mexicano (fig. 4) lo convierte en un grupo atractivo en el que explotar variantes genéticas para mejorar los niveles de este antioxidante en los tomates cultivados. Del mismo modo, la ganancia de nuevos alelos para la glucosa en los grupos SLC del norte (fig. 4) proporcionan una fuente única de variantes para un rasgo correlacionado con la preferencia gustativa humana (Tieman et al. 2017). Estos conocimientos pueden ayudar a los mejoradores a identificar estos "alelos perdidos" para introducirlos en las variedades modernas de tomate, mejorando así los rasgos deseables desde el punto de vista agrícola.
Genética de Poblaciones de Agave Cupreata y Agave Potatorum. Aportaciones para El Manejo y La Conservación de Dos Especies Mezcaleras. Aguirre Dugua, Xitlali. 2004