Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen
Introducción
Las sociedades de estado organizado solo fueron posibles después del desarrollo de la
agricultura, que implicó la domesticación de numerosas plantas y animales 1 , 2 .
Recién estamos comenzando a entender este proceso más desde una perspectiva
genética, gracias a las tecnologías genómicas en expansión. De particular interés es
identificar el escenario demográfico, la línea de tiempo para la domesticación y las
consecuencias genómicas para las especies que han sido críticas en el desarrollo de las
sociedades 2 , 3 , 4 . Entre todas las especies, hay un lugar especial en la cultura general
para la domesticación de Theobroma cacaoL, la planta de la que se hace el chocolate. El
árbol de chocolate ha jugado un papel fundamental en el desarrollo de las civilizaciones
mesoamericanas 5 y ha sido un tema de investigación durante más de 100 años, pero su
historia de domesticación ha sido controvertida 6 , 7 , 8 . Si bien la historia de la
domesticación del cacao ha despertado el interés en diversas disciplinas, nuestro
conocimiento del proceso es incompleto y a menudo involucra información parcial
centrada en unos pocos grupos genéticos, algunas regiones geográficas, información
arqueológica fragmentada o un número limitado de marcadores genéticos 8 , 9 , 10 , 11 ,
12. En este trabajo, informamos y analizamos la variación del genoma completo de 200
individuos de T. cacao (Tabla complementaria 1 ) para investigar el origen evolutivo de
Criollo, el árbol de cacao domesticado en Mesoamérica. También examinamos las
consecuencias del proceso de domesticación en la arquitectura genómica de la
acumulación de mutaciones perjudiciales a lo largo del genoma, lo que a su vez nos
permitió comprender los límites críticos de la productividad del cacao criollo
(domesticado).
Las clasificaciones tradicionales de cacao han reconocido los grupos o cultivares Criollo
y Forastero, y un híbrido adicional de Criollo × Forastero llamado Trinitario 7 . Se han
descrito las características biológicas de estos grupos. Los análisis genéticos más
detallados que utilizan marcadores de microsatélites han descubierto una gran cantidad
de grupos genéticos, así como una clara diferenciación entre los árboles encontrados en
la cuenca del Amazonas y las variedades criollas que se encuentran en América Central
10 . Este trabajo ayudó a caracterizar el germoplasma de cacao en diez grandes grupos
genéticamente diferenciados: Amelonado, Contamana, Criollo, Curaray, Guianna,
Iquitos, Marañón, Nacional, Nanay y Purús 10. Análisis adicionales realizados con
microsatélites sugirieron que Criollo, el representante más probable del cacao
domesticado en Mesoamérica, está más estrechamente relacionado con los árboles de la
frontera entre Colombia y Ecuador que los árboles de otros grupos sudamericanos 10 .
Sin embargo, existe una gran brecha en la información sobre el alcance de la variación
genómica en la especie, lo que hace difícil proponer escenarios claros para la evolución
de las poblaciones naturales y la domesticación de T. cacao . Aunque es ampliamente
reconocido que algunas de estas diez poblaciones han contribuido en los últimos
tiempos a la composición genética de los cultivos, la mayoría de ellas permanecen como
poblaciones silvestres 10 . La especie más estrechamente relacionada con T. cacao es
supuestamenteTheobroma grandiflorum 17 , pero las características biológicas de los
árboles y los frutos son dramáticamente diferentes a las que se encuentran en T. cacao
18 .
Resultados
Figura 1
Anotación genómica del polimorfismo de un solo nucleótido (SNP) en T. cacao. A El
número de SNP clasificados por impacto funcional en la variación de transcripción por
cromosoma. B Detalles del número comparativo de mutaciones sinónimos y no
sinónimos.
Figura 2
Estructura genética de la población en T. cacao . a Los diez grupos genéticos
principales se pueden recuperar (A.1), aunque la estructura adicional (11 grupos) parece
ser significativa dado que un número considerable de individuos mezclados presentan la
ascendencia de un subconjunto de ascendencia de Amelonado (A. 2). Las barras de
color en la parte superior de los individuos mezclados muestran nuestra agrupación
sugerida para los híbridos. b Mapa de América Central y del Sur que muestra las
ubicaciones de coordenadas medias para el origen de las muestras de cada población
muestreada en este trabajo (con la excepción de Admixed). doMDS que muestra un
gradiente de diferenciación del lado oeste al este del Amazonas (PC2) y una separación
importante del grupo criollo que corresponde al grupo domesticado mesoamericano
(PC1). d La disminución significativa de la diversidad genética (π) para la especie a lo
largo de PC2 es compatible con el origen de la especie que se encuentra en el lado
occidental de la cuenca del Amazonas (se excluye Criollo, modelo: π ∼ grupo + ε, p
<2E-16, r 2 = 0,19). e Los diez grupos genéticos de la población que se han descrito
para la especie están altamente diferenciados, y Criollo presenta un promedio de
F ST más grande en comparación con todos los otros grupos
Una de las características muy apreciadas del cacao criollo domesticado es el cotiledón
blanco del frijol, que parece estar asociado con cualidades de sabor deseables. Los
primeros trabajos han sugerido que las concentraciones reducidas de polifenoles,
metilxantinas y precursores de antocianinas en el cotiledón están asociadas con esta
observación 40 , 41 ,42 . Los polifenoles y las metilxantinas son responsables de la
astringencia y el amargor detectados en los granos de cacao 43 , y se cree que la
modificación de estos compuestos durante el proceso de fermentación contribuye al
sabor final de un chocolate 43 . De hecho, durante el proceso de fermentación, la
concentración de polifenoles se reduce hasta en un 70%.44 . Las plantas de la variedad
Criollo probablemente fueron seleccionadas durante la domesticación para reducir este
amargor. Investigamos el impacto de la selección artificial durante la domesticación en
el genoma Criollo buscando regiones de mayor diferenciación entre Criollo y su
población hermana Curaray, utilizando XP-CLR, un método que busca identificar
cambios en la distribución de la variación alélica o cambios en el Espectro de frecuencia
del sitio 2D a lo largo de los cromosomas en ventanas deslizantes 45 . Encontramos
varias regiones del genoma en las que la selección natural ha producido una mayor
diferenciación entre Curaray y Criollo de lo esperado por la demografía sola (Fig. 4 ,
Datos suplementarios 1 y 2) El resultado más interesante deriva de la identificación de
genes que codifican lacasa 14, lacasa / difenol oxidasa. Las lacasas se asocian
normalmente con el proceso de lignificación, pero recientemente se ha demostrado que
las lacasas también están involucradas en el metabolismo de los
polifenoles 46 , 47 , 48 ; Presumimos que la selección de estos genes probablemente
resulte en la reducción de la concentración de polifenoles en el cacao. También
identificamos firmas de selección en una región que contiene el gen que codifica la
xantina deshidrogenasa 1, probablemente involucrado en el metabolismo de las
metilxantinas (como la teobromina) y también es probable que haya sido el resultado
del proceso de selección para reducir el amargor 42. En la tabla complementaria 3 se
proporciona una lista adicional de genes en regiones identificadas como seleccionadas e
incluye genes involucrados en la estabilidad genómica (mantenimiento estructural de los
cromosomas), resistencia a enfermedades, respuesta al estrés abiótico (proteína de unión
al ADN WRKY), regulación transcripcional (MYB dominio) y señalización (receptor
RLK rico en cisteína, así como genes S-dominio-2 5).
Fig. 4
Fig. 5
Conclusiones
Muestreo
Tomamos muestras de las hojas de las accesiones en la Unidad de Investigación del
Cacao de la Universidad de las Indias Occidentales y el CATIE en Costa Rica (Tabla
complementaria 1 ).
El ADN se extrajo usando ZR Plant / Seed DNA MiniPrep ™ (Zymo Research Inc). Se
cortaron aproximadamente 3 g de material de hoja por extracción por muestra y se
colocaron en tubos de homogeneización con perlas de cerámica y tampón de lisis. Las
muestras se homogeneizaron en un FastPrep-24 TM (MP Biomedicals, LLC) colocado en
una habitación fría a 4 ° C durante 60 s a una velocidad de 4.5 m sec -1 . Si el tejido no
se homogeneizó completamente, los tejidos se homogeneizaron durante 20–40 s
adicionales a la misma velocidad. El ADN se cuantificó usando un Qubit TMFluorómetro
3.0 (ThermoFisher Scientific), utilizando un kit de ensayo dsDNA HS. Además, se
evaluó la calidad general del ADN extraído con E-Gel al 2% (Invitrogen, Carlsbad,
CA). La mayoría de las muestras se prepararon utilizando los kits de preparación de
muestras de ADN Nextera (Epicenter, Chicago, IL, EE. UU.) Y el kit de preparación de
biblioteca NEBnext® Ultra DNA Library para Illumina (New England BioLabs,
Inc). Las muestras restantes se prepararon cortando primero el ADN genómico usando
un M220 Focused-ultrasonicator ™ (Covaris Inc) y NEBnext® Ultra DNA Library Prep
Kit para Illumina (New England BioLabs, Inc). Las bibliotecas se cuantificaron en el
chip de ADN Agilent 2100 Bioanalyzer High Sensitivity para la concentración y la
distribución del tamaño, se agruparon en conjuntos de 3 a 4 por lote y se secuenciaron
en la plataforma HiSeq 2000/2500 en el Centro de Servicio de Secuencia de Stanford
(100 ciclos, modo de lectura emparejado) .
El mapa y la ubicación de las poblaciones en América del Sur se creó utilizando ggmaps
en R. Los mapas utilizados en ggmaps se obtienen de los mapas de Google (fuente de
acceso abierto) y los diamantes utilizados para el posicionamiento de las poblaciones se
modificaron para aumentar el tamaño en Illustrator .
Comparamos las estimaciones obtenidas cuando se usa la ascendencia Criollo versus las
obtenidas cuando la ascendencia Amelonado se usa como un predictor para evaluar el
efecto específico de la domesticación y no solo la endogamia. La
Figura 13 complementaria muestra los resultados del análisis de asociación entre
ascendencia de Amelonado y productividad. Se proporcionan detalles adicionales sobre
el análisis en la Información complementaria .
Disponibilidad de código
El código informático está disponible por OEC a través de un repositorio de github
oeco28 / Cacao_Genomics en https://github.com/oeco28/Cacao_Genomics/
Disponibilidad de datos
Los SNP están disponibles en el European Variation Archive con los códigos de acceso
PRJEB28591 (proyecto) y ERZ696780 (análisis). Se puede acceder a los datos de
secuenciación sin procesar en el SRA desde ncbi a través del BioProject PRJNA486011.