Está en la página 1de 10

SC I ENCE ADVANCE S | ARTÍCULO DE INVESTIGACIÓN

Genet HUMANA I CA. Copyright © 2020 Los autores,

algunos derechos reservados;

La recuperación de las señales fantasma introgresión arcaica en las poblaciones licenciatario exclusivo Asociación

Americana para el Avance de la

africanas Ciencia. Sin pretensión de originales

Funcionamiento del Gobierno de los

Estados Unidos. Distribuido bajo


Arun Durvasula 1 y Sriram Sankararaman 1,2,3,4 * una licencia Creative Commons

Reconocimiento-No comercial 4.0


Mientras fromNeanderthals de introgresión y Denisovanos se ha documentado en los seres humanos modernos fuera de África, la contribución de los homínidos
(CC BY-NC).
arcaicos a la variación genética de los africanos de hoy en día sigue siendo poco conocida. Proporcionamos líneas complementarias de pruebas para la introgresión
arcaica en cuatro poblaciones del África Occidental. Nuestros análisis de los espectros de frecuencia sitio indican que estas poblaciones se derivan 2 a 19% de su
ascendencia genética de una población arcaica que divergieron antes de la división de los neandertales y los humanos modernos. Utilizando un método que puede
identificar segmentos de ascendencia arcaica sin necesidad de referencia genomas arcaicos, construimos mapas de todo el genoma de ascendencia arcaica en los
yoruba y las poblaciones de Mende. Los análisis de estos mapas revelan segmentos de ascendencia arcaica a alta frecuencia en estas poblaciones que representan
objetivos potenciales de la introgresión de adaptación. Nuestros resultados ponen de manifiesto la contribución sustancial de ascendencia arcaica en la conformación
de la reserva genética de las poblaciones actuales de África Occidental.

descargado de
INTRODUCCIÓN estructura o el flujo de genes en la historia de la población arcaico (véase Materiales y
Mezcla ha sido una fuerza dominante en la formación de patrones de variación genética en las Métodos).
poblaciones humanas ( 1). Las comparaciones de las secuencias del genoma de los homínidos Hemos calculado CSF YRI, N: los MCA en el Yoruba de Ibadan (YRI) mientras se restringe
arcaicos a los de los humanos actuales han documentado múltiples entrecruzamiento eventos, a SNPs donde se observó un alelo en la muestra al azar de la Vindija Neanderthal genoma
de alta cobertura (N) que se deriva ( 15). En contraste con la fromtheory
incluyendo el flujo de genes de los neandertales en los antepasados ​de todos los no africanos ( 2), fromDenisovans

http://advances.sciencemag.org/
en de Oceanía ( 3) y oriental no africanos ( 4, 5), así como de los primeros seres humanos modernos uniformspectrumexpected, se observa que los MCA YRI, N tiene una forma de U con una
en los neandertales ( 6). Sin embargo, el registro fósil escaso y la dificultad en la obtención de ADN proporción elevada de SNPs con baja y alta frecuencia - alelos derivados relativos a los de
antiguo han hecho que sea difícil de diseccionar la contribución de los homínidos arcaicos a la frecuencias intermedias (Fig. 1 y la Fig. S4). El MCA es casi idéntica cuando reemplazamos
diversidad genética dentro de África. Aunque varios estudios han puesto de manifiesto las el genoma Vindija Neanderthal con la alta cobertura Denisova genoma (Fig. 1 y la Fig. S4) ( 4).
contribuciones fromdeep linajes a los ancestros de los africanos de hoy en día ( 7 - 12), Hemos observado una similar CSF en forma de U en cada una de las tres poblaciones
adicionales de África Occidental [Esan en Nigeria (ESN), Gambia en las divisiones
occidentales en Gambia (DAS), y Mende, en Sierra Leona (MSL)] incluidos en los genomas
la naturaleza de estas contribuciones sigue siendo poco conocida. Fase 1000 3 el conjunto de datos (fig. S4).

el 18 de febrero 2020
RESULTADOS sesgos mutacionales, errores en la determinación de una mutación de la ancestral o el
Nos aprovechamos datos de la secuencia de todo el genoma de actuales poblaciones del África alelo arcaico, o recurrente podría producir los MCA observados. Se confirmó que la forma
Occidental y los homínidos arcaicos para calcular las estadísticas que son sensibles a la de los MCA YRI, N era robusto a la inclusión de sólo transitionmutations, sólo
introgresión en la historia de estas poblaciones. Específicamente, se tabularon la distribución de transversionmutations, a la exclusión de sitios CpG hypermutable (fig. S7), así como
las frecuencias de alelos derivados (donde un alelo derivada es determinada con respecto a un cuando se calculó el spectrumon los genomas Yoruba secuenciaron por separado en el
antepasado humano inferido) en el analizado poblaciones africanas a polimorfismos de un solo 1000 Genomas Fase 1 conjunto de datos (fig. S7) .
nucleótido se observó (SNPs) para los que una muestra al azar alelo individuo arcaico froman
también ser derivada. La teoría predice que se espera que este espectro condicional frecuencia Hemos comprobado que esta señal era robusto a cambios en la tasa de recombinación y
sitio (CSF) para ser distribuida de manera uniforme cuando alelos se neutralmente selección del fondo mediante la restricción a las regiones que son susceptibles de ser neutral en
evolucionando bajo un modelo demográfico en el que el antepasado de los humanos modernos evolución (mediante la restricción de los sitios con las estimaciones de selección del fondo, si estadística,>
y arcaicos, supone que en la mutación de la deriva de equilibrio, dividida con ningún gen 800). También se evaluó el efecto de la conversión parcial de genes mediante la exclusión de débil a
subsiguiente fluir entre los dos grupos ( 13, 14). Esta expectativa es robusto a suposiciones fuerte polimorfismos y fuerte-toweak. Hemos encontrado que la señal de forma de U es robusto a la
acerca de los cambios en los tamaños de población en la historia de las poblaciones arcaicas variación en la tasa de recombinación, la selección de fondo, y la conversión parcial de genes (fig.
humano moderno o. Además, se muestra que esta expectativa se mantiene incluso cuando hay S10). Los errores en la determinación del alelo ancestral podría hacer alelos ancestrales de baja
población frecuencia parecen ser de alta frecuencia -

alelos derivados y viceversa, y por lo tanto potencialmente podría conducir a un CSF en forma de U.
Sin embargo, la forma de los MCA sigue siendo cualitativamente sin cambios cuando se utilizó ya
sea el genoma de chimpancé o el consenso a través de los genomas orangután y chimpancé para

1 Departamento de Genética Humana, David Geffen de Medicina de la Universidad de California, Los Ángeles, Los determinar el alelo ancestral (fig. S9). Hemos simulado tanto ancestral identificación errónea alelo y
Ángeles, CA, EE.UU.. 2 Departamento de Ciencias de la Computación de la Universidad de California, Los Ángeles, genotipo errores en el llamamiento de la alta cobertura del genoma arcaico. Un ajuste a los datos
Los Ángeles, CA, EE.UU.. 3 Programa Interdepartamental de Bioinformática de la Universidad de California, Los
requiere tanto una tasa de identificación errónea ancestral 15% y una tasa de error de
Ángeles, Los Ángeles, CA, EE.UU.. 4 Departamento de Medicina Computacional de la Universidad de California, Los
genotipificación 3% en el genoma arcaico, sustancialmente mayor que las estimaciones previas de
Ángeles, Los Ángeles, CA, EE.UU..
estas tasas de error [1% para ancestral
* Autor correspondiente. E-mail: sriram@cs.ucla.edu

Durvasula y Sankararaman, Sci. Adv. 2020; 6: eaax5097 12 de febrero de 2020 1 de 9


SC I ENCE ADVANCE S | ARTÍCULO DE INVESTIGACIÓN

ING modelo no se ajusta a los MCA observados YRI, N [ PAG valor de una prueba de
Kolmogorov-Smirnov (KS) en los residuos se distribuye normalmente
P < 2 × 10 - dieciséis]. Extensiones de este modelo para incluir las tasas de recombinación variación
inmutationand realistas a lo largo del genoma (KS P < 2 × 10 - dieciséis;
higo. S12 y la sección S1) y bajos niveles de ADN Neanderthal introducen en poblaciones africanas a
través de la migración entre europeos y africanos no proporcionan un ajuste adecuado (KS P < 2 × 10 - dieciséis;
La Fig. 1 y en la sección S1) ni tampoco AMODEL de gen flowbetweenYRI y pigmeos poblaciones
que se ha propuesto anteriormente (KS P < 2 × 10 - dieciséis; higo. S12 y la sección S1) ( 19). La expectativa
de que theCSFS se distribuye uniformemente a través de las frecuencias de los alelos se basa en la
suposición de ofmutation-deriva equilibriumin la población ancestral de los humanos modernos, los
neandertales, y Denisovanos. Se confirmó que violaciónes de esta suposición (debido a los cuellos de
botella, ampliaciones y estructura de la población en la población ancestral) también fueron incapaces
de ajustar los datos (KS P < 2 × 10 - dieciséis para todos los modelos; sección S2, S3 mesa, y la fig. S17).

Dado que ninguno de los modelos demográficos actuales son capaces de adaptarse a los
MCA observados, hemos explorado modelos en los que parte hoy en día de África occidental

descargado de
rastro de su ascendencia a (A) una población que se separó de sus antepasados ​después de la
división entre los neandertales y los humanos modernos, (B) una población que se separó de la
antepasado de los neandertales después de la división entre neandertales y humanos modernos, o
(C) una población que se separaron de los ancestros de los humanos modernos y los neandertales
antes de los ancestros de los neandertales y humanos modernos se separó de la otra ( fig. S2 y de
Fig. 1. Demografía relativos conocido y propuso linajes arcaicos a las poblaciones humanas modernas. la sección S3). Cada uno de estos modelos de mezcla (que nos referimos como modelos A, B, y C,

http://advances.sciencemag.org/
(UN) modelo demográfico básico con los CSF en forma. W Afr, africanos del oeste; Eur, Europeo; N, respectivamente) puede producir una CSFs en forma de U. El aumento en los recuentos de baja
Neanderthal; D, Denisovan; UA, arcaica desconocida [ver ( 18)]. A continuación, mostramos los MCA en el deriva alelo SNPs de frecuencia es en gran parte debido a la introducción de la deriva alelo fromthe
YRI África Occidental cuando la restricción a SNPs donde una muestra al azar alelo de la alta cobertura
introgresión de población en los sitios que se corrigen para el alelo ancestral. El aumento de los
se observó Vindija Neanderthal que se deriva [Neanderthal (datos)], así como donde un alelo de la
recuentos de los SNPs de alta frecuencia es en gran parte debido a la introducción de los alelos
muestra al azar de la alta se observó -cobertura Denisovan genoma que se deriva [Denisovan (datos)].
ancestrales a los sitios que se fija para el alelo derivada.
También mostramos los MCA bajo el modelo propuesto [Neandertal (modelo) y Denisova (modelo)]. La
migración entre Europa y África occidental presenta un exceso de variantes de baja frecuencia, pero no
captura la disminución de la frecuencia intermedia variantes y aumento de alta frecuencia variantes. ( SI) Recientemente
propuesta que implica modelo de introgresión en el moderno ancestro humano a partir de un hominin
desconocido que se separó del ancestro humano antes de la división de los humanos modernos y los Una búsqueda de los parámetros para los modelos A y B que producen el mejor ajuste a los
ancestros de los neandertales y Denisovanos. A continuación, mostramos los MCA encajan del modelo resultados de los CSF en una trifurcación, es decir, modelos en los que las divisiones de la población

el 18 de febrero 2020
propuesto, que captura la forma de U observada en los datos. frente a su introgresión de la población humana moderna al mismo tiempo que el ser humano
moderno - Neanderthal. Los modelos A y B no pueden adaptarse a los MCA observados incluso en la
mayoría de sus parámetros estimados probables (KS P = 3.3 × 10 - 15 y P = 5.6 × 10 - 6, respectivamente;
sección S3) a causa de la deriva genética insuficiente en la población africana desde la división de la
población de introgresión (sección S4.2). Además, mostramos en el apéndice B que se espera que el
espectro para el modelo A para ser simétrica, que no se observa en los datos (Fig. 1). Modelo C, por
tasa de identificación errónea en el Enredo-pacana-Ortheus (EPO) secuencia ancestral ( dieciséis) el contrario, es consistente con los datos (KS P = 0,09), lo que sugiere que parte de los ancestros de la
y 0,6% para la contaminación humana moderna en el Vindija Neanderthal ( 15)] ( sección S1.1 y actual África occidental debe proceder de una población que se separaron antes de que el tiempo de
fig. S11). Para explorar la contribución de mutaciones recurrentes, utilizamos hacia adelante división de los neandertales y los humanos modernos. Además de las pruebas de bondad de ajuste,
en el tiempo simulaciones que permiten mutaciones recurrentes: los MCA simulados no se se examinó la probabilidad de los parámetros de ajuste óptimo para cada uno de los modelos y
parece a los MCA en forma de U que vemos en los datos (Fig. S43). En conjunto, estos encontramos que el modelo C proporciona un ajuste significativamente mejor que otros modelos
resultados indican que los CSF en forma de U observados en las poblaciones africanas no es (modelo C que tiene un logaritmo de verosimilitud compuesto más alta que la siguiente mejor modelo re
un artefacto. LL = LL Nextbestmodel - LL C = - 6806whenwe conditionon el genoma Vindija Neanderthal y re LL = - 6240
cuando condicionamos sobre el genoma Denisovan; tabla S4 y de Materiales y Métodos). Nuestros
Para determinar si los modelos realistas de la historia humana pueden explicar los MCA, análisis proporcionan soporte para una contribución a la ascendencia genética de las poblaciones de
se compararon los MCA estimados simulaciones fromcoalescent a los MCA observados YRI, N usando
hoy en día África Occidental a partir de una población fantasma arcaico cuya divergencia con
una prueba de bondad de ajuste (véase Materiales y Métodos y la sección S2). Aumentamos respecto a los ancestros de los humanos modernos es anterior a la escisión de los neandertales y los
un modelo de la historia demográfica de los africanos de hoy en día ( 17) con un modelo de la humanos modernos.
historia de los neandertales y Denisovanos inferida por Prüfer et al.

( 15) ( La Fig. 1 y las Figs. S1 y S16). Este modelo incluye eventos clave cruce entre
neandertales, Denisovanos, y las poblaciones humanas modernas, como la introgresión
de los neandertales en nonAfricans, desde los primeros humanos modernos en los Aplicamos aproximada de cálculo bayesiano (ABC) a los MCA para refinar los
neandertales ( 6), y en theDenisovans Froman población arcaica desconocido ( 18). El parámetros de nuestro modelo demográfico más probable (modelo
resultado- C) (sectionS5) .given la LargeNumber de parámetros en thisdemographic

Durvasula y Sankararaman, Sci. Adv. 2020; 6: eaax5097 12 de febrero de 2020 2 de 9


SC I ENCE ADVANCE S | ARTÍCULO DE INVESTIGACIÓN

modelo, parámetros fijos que previamente habían sido estimadas ( 15) y se estima tamaño efectivo de la población en el linaje de introgresión (posterior media de 25.000; 95% HPD:
conjuntamente el tiempo de división de la población arcaica introgresión de los 23.000 a 27.000) podría indicar una estructura adicional. Nos encontramos con que la norte mi del
antepasados ​de los neandertales y los humanos modernos, el tiempo de linaje introgresión en YRI andMSL es mayor que en las otras poblaciones africanas, posiblemente
introgresión, la fracción de ascendencia aportado por la población introgresión, y debido a una contribución diferencial a partir de una basal rama del África Occidental ( 20).
su tamaño efectivo de la población. Se determinó la posteriormean para el tiempo
de división para ser 625.000 años antes del presente (BP) [95% de intervalo de Mientras que hemos elegido para representar la contribución genética de la población fantasma
más alto posterior densidad (HPD): 360.000 a 975.000], el tiempo de mezcla para africana como una única discreta entrecruzamiento evento, amore realisticmodel podría incluir bajos

ser 43.000 años BP (95% HPD: 6.000 a 124.000 ), y la fracción de mezcla para niveles de flujo de genes en una población estructurada durante un período prolongado de tiempo.
Anteriormente proposedmodels de estructura ancestral en África no se ajustan a los MCA [KS P < 2 ×
ser 0,11 (95% HPD: 0,045 a 0,19). Los análisis de las otras tres poblaciones del
10 - dieciséis
África Occidental (ESN, GWD, y MSL) produjeron estimaciones concordantes
para estos parámetros (Fig. 2 y la Tabla S7). Combinando nuestros resultados en para el modelo descrito en ( 21) y KS P < 2 × 10 - dieciséis para el modelo propuesto en ( 14); higo. S18],
las poblaciones africanas theWest, aunque se observa que el modelo de la estructura ancestral propuesto por Yang et al. no producir
una ligera forma de U. Exploramos modelos adicionales de estructura de la población en África ( 22)
en el que una fracción de linaje desde el antepasado de los humanos modernos con tiempos
BP y, posteriormente, introgresado en los antepasados ​de los africanos 0-124 ka BP parciales que van from100 a 550 ka BP y continuó genes de intercambio con la población humana
contribuyen 2 a 19% de su ascendencia actual. Advertimos que el verdadero modelo themodern hasta que las tasas actuales withmigration que van from2.5 × 10 - 5 a 2 × 10 - 2 migrantes
demográfico subyacente es probable que sea más complejo. Para explorar aspectos de esta por generación. Aunque estos modelos de flujo de genes continua producen una CSFs en forma
complejidad, se analizó la posibilidad de que la población arcaica se separaron al mismo de U para las tasas de migración bajos y profundas divisiones, que no proporcionan un ajuste

descargado de
tiempo que el tiempo de división de las modernas andNeanderthals seres humanos y encontró adecuado a los MCA empíricos sobre el intervalo de parámetros considerados (KS PAG ≤ 2.3 × 10 -
que este modelo también puede producir un CSF en forma de U con una probabilidad de que 5; la sección S6 y los higos. S14 y S15). Utilizamos nuestro marco ABC para explorar una mayor
es relativamente alta, aunque inferior a la de nuestro modelo de mejor ajuste ( re LL = - 2713 de detailedmodel de la migración continua en la que se varió el tiempo parcial, la tasa de migración, y
los MCA y de Neanderthal re LL = - 2597 para la Denisovan MCA, KS PAG ≤ 2,9 × 10 - 6). Nuestras el tamaño efectivo de la población del linaje introgresión. Simulaciones en el marco del modelo de
estimaciones de un gran mejor ajuste producir un CSF que no se ajusta adecuadamente los datos (KS P = 1,83 × 10 - 6). Una
posible razón por la cual los modelos de migración constante que hemos explorado no se ajustan

http://advances.sciencemag.org/
a los datos es que estos modelos pueden ser considerados como extensiones del modelo A con
múltiples eventos de mezcla. Hemos demostrado que estos modelos sólo pueden producir los
CSF simétricas, a diferencia de los MCA que observamos en los datos (Apéndice B). Por lo tanto,

UN si la estructura de la población en lo profundo de África sola no puede no explicar los datos (sección
S6).
Mezcla de tiempo (años × 10 000)

fracción 0,00 0,10 0,20 0,30


20

Dada la incertidumbre en nuestras estimaciones del tiempo de introgresión, nos


--
Mezcla

el 18 de febrero 2020
-- --
0 5 10

-- preguntamos si analizar conjuntamente los MCA fromboth los (residentes de Utah con Norte y
-- --
-- -- Europa Occidental ascendencia) CEU y YRI genomas podría proporcionar una resolución
adicional. Bajo el modelo C, simulamos introgresión antes y después de la división entre las
N

SL

s
AS

diferencias cualitativas observadas entre los twomodels en la alta frecuencia de las


le
ES
N

SL

ria
AS

le

M
ES

D
ria
M
D

poblaciones no africanas y africanos y - derivados alelo contenedores de los MCA en África y


C re poblaciones no africanos (fig. S40). El uso de ABC para encajar conjuntamente la alta
frecuencia - derivado de alelos contenedores de los MCA en CEU y YRI (definido como mayor
que la frecuencia de 50%), encontramos que el límite inferior en el intervalo de credibilidad
tiempo de división (años × 10.000)

100 150

2.8

95% del tiempo introgresión es más antigua que la división simulado entre CEU y YRI (2,800
Ne (× 10 000)

frente a 2,155 generaciones BP), lo que indica que al menos parte de los linajes arcaicas visto
-- en el YRI también se comparten con el CEU (sección S9.2).
2.4

--
--
50

-- -- -- -- --
2.0

Posteriormente, se trató de entender la distribución a escala fina de la ascendencia fantasma


0

arcaico a lo largo de los genomas de los africanos de hoy en día. Se utilizó un método estadístico
desarrollado recientemente (Archie) que las estadísticas genéticos cosechadoras de población múltiple
N

SL

s
AS

le
ES
N

SL

ria
AS

le

M
ES

D
ria
M

para identificar segmentos de ascendencia divergieron en 50 YRI y 50 genomas MSL sin la necesidad
D

Fig. 2. Las estimaciones de ABC de los parámetros demográficos de la población arcaica fantasma a través de
de un genoma de referencia arcaico (sección S7) ( 23). Brevemente, las estadísticas de resumen utiliza
cuatro poblaciones del África Occidental (YRI, ESN, GWD, y MSL).
el método computado secuencias del genoma frompresent-día como entrada a un modelo de
medios posteriores se denotan por los diamantes, y 95% intervalos de credibilidad se denotan por líneas. ( UN) El
regresión logística para estimar la probabilidad de que un segmento haploide de un genoma individual
tiempo de mezcla t un, ( SI) la fracción de mezcla un, ( C) el tiempo de división de la población introgresión t s, y ( RE) el
(definida como una región contigua de longitud 50 kilobases) es arcaico. Mientras que los parámetros
tamaño efectivo de la población de la población introgresión norte mi son exhibidos. Las estimaciones de los
del modelo se estiman mediante la simulación de los datos en virtud de que UN MODELO
parámetros son en gran medida consistente a través de las poblaciones africanas: Estimamos tiempos parciales de

360 ​ka closelymatches la historia demográfica relacionada neandertales y los no africanos, nos

1,02 Ma BP, los tiempos de mezcla entre 0 y 124 ka BP, las fracciones de mezcla que intervalo de 0,02 a 0,19; y
efectivo de la población de tamaños que van desde 22.000 a 28.000.

Durvasula y Sankararaman, Sci. Adv. 2020; 6: eaax5097 12 de febrero de 2020 3 de 9


SC I ENCE ADVANCE S | ARTÍCULO DE INVESTIGACIÓN

Tabla 1. Genes que albergan una alta frecuencia de segmentos arcaicas en las poblaciones yoruba y
Mende. Los genes fueron seleccionados por la clasificación de la unión del conjunto de segmentos
arcaicas putativos por la frecuencia, ya sea en la población Mende o Yoruba y seleccionando la parte
superior 10 genes. Los genes en frecuencias negrita indican mayores que 50% en la población
respectiva.

Frecuencia
Cromosoma Gen Frecuencia tipo de gen
(Yoruba) (Mende)

chr1 RP11-286M16.1 0.84 0,81 lincRNA

CHR4 kcnip4 0,73 0.69 la codificación de proteínas

CHR6 MTFR2 0.67 0,78 la codificación de proteínas

CHR8 TRPS1 0,71 0.75 la codificación de proteínas

chr12 RP11-125N22.2 0.12 0.88 pseudogen

chr16 HSD17B2 0.74 0.68 la codificación de proteínas

Chr17 NF1 0.83 0.85 la codificación de proteínas

descargado de
Chr17 KRT18P61 0.84 0.36 pseudogen

Chr21 MIR125B2 0,76 0.64 microARN

Fig. 3. Análisis de segmentos de ascendencia fantasma arcaico encuentra en las poblaciones yoruba y Mende.

http://advances.sciencemag.org/
(UN) Inferencia de segmentos de ascendencia arcaico se realizó con Archie. Archie procede mediante la
marcado nonarchaic utilizando el modo del par de valores múltiples coalescente secuencialmente
simulación de los datos bajo un modelo de introgresión arcaico, el cálculo de las estadísticas de resumen de
Markovian (MSMC) (Fig. 3B y la sección s7.2) ( 24) y observó que la TMRCA es mayor para la clase
población genéticos, y la formación de un modelo para predecir la probabilidad de que una ventana de 50 kb en
un individuo proviene de una población arcaica. Aplicamos el predictor resultante del genoma secuencias de las putativamente arcaica de segmentos. En concreto, nos encontramos con que el tiempo del

poblaciones yoruba y Mende. ( SI) Comparación de TMRCA entre segmentos arcaicas y nonarchaic inferidos a segmento coalescente nonarchaic promedio es de hace 0.865 Ma para ambas poblaciones,

la TMRCA de un par de segmentos nonarchaic en el Yoruba. En promedio, los segmentos son arcaicos 1,69 × mientras que el tiempo del segmento coalescente arcaica promedio es de hace 1,51 Ma y de riales
mayores de segmentos nonarchaic. ( C) Las estimaciones de los tiempos de divergencia de los segmentos
arcaicas inferirse en Yoruba de KhoeSan, Jul ' hoan, dos genomas humano pigmeos modernos (mbuti y Biaka), 1,15 Ma hace para MSL (1.69- y aumenta 1,23 veces en la edad para YRI y MSL,
y neandertales y genomas Denisovanos en comparación con los tiempos de divergencia de los segmentos respectivamente).
nonarchaic. PAG valores se calculan a través del bloque de navaja. segmentos arcaicos están más divergieron
Examinamos las frecuencias de segmentos arcaicos para investigar si la selección natural
de los seis genomas que los segmentos nonarchaic.
podría haber dado forma a la distribución de los alelos arcaicas (fig. S40). Encontramos 33 loci

el 18 de febrero 2020
con una frecuencia segmento arcaica de ≥ 50% en el YRI (un punto de corte elegido para ser
mayor que el 99,9 percentil de frecuencias de los alelos arcaicas introgresión en base a una
simulación neutral de parámetros introgressionwith arcaicos relacionados con el tiempo de
introgresión y la fracción de mezcla elegido de forma conservadora para maximizar la deriva
Archie encontrado que tiene 68% de potencia para detectar segmentos arcaicas a una tasa de falso desde introgresión; sección S7.3 y fig. S40) y 37 loci en el MSL. Algunos de estos genes se
descubrimiento de alrededor de 7% bajo nuestro modelo demográfico de mejor ajuste, lo que confirma que encuentran en alta frecuencia a través tanto de la riales y MSL, incluyendo NF1, un gen supresor
sus inferencias son robustos y sensible a la introgresión arcaico en África. de tumor (83% en YRI, 85% inMSL), MTFR2, un gen involucrado con la respiración aeróbica
mitocondrial en el testículo (67% en YRI, 78% en MSL), HSD17B2, una regulación de la
De media, ≃ 6.6 y ≃ 7,0% de las secuencias del genoma en YRI y hormona gen participeen (74% en YRI, 68% inMSL), kcnip4,
MSL fueron etiquetados como arcaico putativamente en ascendencia. Hemos tratado de probar si
los segmentos supuestamente arcaicas identificados en riales y MSL remontar su ascendencia
primaria a otras poblaciones africanas ( 8 - 10) o conocido homínidos arcaicos tales como los que es un gen involucrado con los canales de potasio (73% en YRI, 69% en MSL), y TRPS1,
neandertales o Denisovanos. Hemos calculado la divergencia de estos segmentos a una un gen asociado con el síndrome trico (71% en YRI, 75% en MSL; Tabla 1). Tres de estos
secuencia de genoma de cada una de las seis poblaciones: el sur de África KhoeSan, Jul ' hoan; genes han sido encontrados en las exploraciones anteriores para la selección positiva en
poblaciones de pigmeos de África Central (dos Biaka andMbuti); y dos poblaciones de homínidos el riales: NF1
arcaicos (Neanderthal y Denisovanos). Esperamos que los segmentos de introgresión de ( 25, 26), kcnip4 (27), y TRPS1 (28). Por otro lado, no encontramos frecuencias elevadas
cualquiera de estas poblaciones a ser menos divergentes en relación con los segmentos en MUC7, un gen encontraron previamente a las firmas puerto de introgresión arcaico ( 29).
nonarchaic. Por el contrario, los segmentos putativamente arcaicas son más divergentes, en
consonancia con su fuente no siendo ninguna de estas poblaciones (Fig. 3C y sección S7.1). La
fusión de los segmentos putativamente arcaicas través de los genomas individuales, se obtuvo un
total de 482 y 502 Mb de secuencia del genoma arcaico en el YRI y MSL, respectively.We estima DISCUSIÓN
la distribución del tiempo para themost ancestro común reciente (TMRCA) entre los segmentos de Nuestro análisis de documentos introgresión en cuatro poblaciones actuales dayWest africanos
marcado arcaico y aquellos de una población arcaica que probablemente divergieron antes de la división de los humanos
modernos y los ancestros de los neandertales y Denisovanos. Varios estudios anteriores han
encontrado pruebas de

Durvasula y Sankararaman, Sci. Adv. 2020; 6: eaax5097 12 de febrero de 2020 4 de 9


SC I ENCE ADVANCE S | ARTÍCULO DE INVESTIGACIÓN

linajes profundamente divergentes que contribuyen ascendencia genética de los pigmeos ( 8, 9) y Chen et al. (13) mostró que si el ancestro de poblaciones pop 1 y el pop 2 está en equilibrio
Yoruba ( 7, 30) poblaciones. Los análisis de los genomas ancestrales africanos han revelado que mutación-deriva (es decir, el espectro de frecuencia sitio en el ancestro es F re X Þ º 1 X , donde 0
la edad de piedra cazadores-recolectores de África del Sur se separaron de otras poblaciones de < x < 1 es el derivado alelo frecuencia a un SNP polimórfico) y las dos poblaciones pop 1 y el
hoy en día 260.000 años (> 31) BP y que hoy en día parte del África Occidental poblaciones rastro pop 2 dividir sin mezcla posterior, a continuación, los MCA YRI, N se espera que sea uniforme, es
de su ascendencia a un linaje basal que divergieron antes de la división de la southernAfrican decir, CSFs YRI, N ( k) = constante. Este resultado no depende de ningún aspectos adicionales de
San ( 20) ( Aunque un alternativemodel coherente con sus datos incluye un complejo patrón de la historia demográfica de las poblaciones, ya sea pop 1 o pop 2, excepto que son el
aislamiento por distancia entre las poblaciones occidentales, este y southernAfrican). La apareamiento al azar. Utilizamos los MCA a la introgresión de estudio en los africanos de hoy
colocación de nuestros resultados en el contexto de los complejos patrones de profundas en día, donde nos propusimos pop 1 a los africanos de hoy en día y pop 2 a una población
divergencias en las poblaciones africanas requerirá el análisis de un conjunto diverso de las arcaica,
poblaciones africanas que incluyen el sur de las poblaciones de África San, así como la inclusión
de antiguos genomas africanos que carecen de señales de reciente mezcla que están presentes es decir, Neanderthal o Denisovan.
en los actuales San poblaciones ( 32). Una de las complicaciones en la aplicación de los MCA para aprender acerca de la
historia de la actual africanos surge de salidas conocidos a partir de un modelo simple de
aislamiento sin mezcla posterior. Sin embargo, hemos considerado la posibilidad de la
Una interpretación de la reciente época de introgresión que documentamos estructura de la población arcaica. Esta estructura podría tener varias formas que incluyen la
es que las formas arcaicas persistieron en África hasta hace muy poco ( 33). Alternativamente,
población neandertal ancestral siendo estructurado o podría implicar flujo de genes de los
la población arcaica podría haber introgresión anterior en una población humana primeros humanos modernos en los neandertales ( 6), o como en el caso de Denisovanos, esto
moderna, que, posteriormente, se cruzaron con los antepasados ​de las podría incluir froma flujo de genes muy divergentes población arcaico ( 18). Se realizó extensas

descargado de
poblaciones que hemos analizado aquí. Los modelos que hemos explorado aquí simulaciones para demostrar que la estructura de la población arcaica continúa y también
no son mutuamente excluyentes, y es plausible que la historia de las poblaciones conduce a una uniformes CSF (sección S1). Además, en el apéndice A, se muestra que los
africanas incluye contribuciones genéticas de múltiples poblaciones divergentes, MCA es uniforme incluso si hay una estructura en la población arcaica. Sin embargo, la
como lo demuestra el tamaño efectivo de la población grande asociado con la estructura dentro de la población de la población africana (POP 1)
población arcaica introgresión. Relativamente, los últimos fósiles con
características arcaicas (o combinaciones de rasgos humanos arcaicos y

http://advances.sciencemag.org/
modernos) se han encontrado en el registro fósil enÁfrica y themiddle Medio. desde su separación de la población arcaica (pop 2), por ejemplo, debido a la mezcla, se espera que
Mientras que los humanos anatomicallymodern aparecen en el registro fósil hace produzca desviaciones de los MCA uniformes.
años around200,000, 34). Ejemplos de estos fósiles incluyen un cráneo de Iwo
Eleru ( 33) Procesamiento de datos

Para los análisis primarios de los MCA, se utilizó el 1000 Genomas Fase 3 conjunto de
datos (versión 20130502) ( 36), la alta cobertura Vindija Neanderthal genoma ( 15), y la alta
y restos humanos de Ishango ( de 35) que se han interpretado como siendo coherente con la cobertura Denisovan genoma ( 4). Utilizamos los alelos ancestrales anotados
estructura profunda y que representa una compleja historia de interacción entre los homínidos proporcionados por el consortiumand 1000Genomes analizaron SNPs autosómicos única.
modernos y arcaicos en África. genotipos arcaicas (Vindija andDenisovan) vienen fromthe tubería descrita en ( 15), que
Las señales de introgresión en las poblaciones del África Occidental que hemos analizado utilizó SNPAD para SNP llamando [ver S3 en ( 15)], y se requiere una calidad de mapeo ≥ 25

el 18 de febrero 2020
plantean cuestiones sobre la identidad del homínido arcaico y sus interacciones con las y un filtro mapeabilidad de 100. No se aplicó un filtro adicional calidad genotipo de los
poblaciones humanas modernas en África. El análisis de los MCA en el Luhya de Webuye, datos presentados en la Fig. S4. Sin embargo, hemos probado la sensibilidad del
Kenia (LWK) también revela señales de introgresión arcaica, aunque nuestra interpretación es spectrumto la elección de los filtros de calidad genotipo en el arcaico cuando se utiliza un
complicada por la mezcla reciente en el LWK que involucra a las poblaciones relacionadas con filtro de GQ (Genotipo calidad) de ≥ 30 y ≥ 50 y ver muy poca diferencia en la forma del
los africanos occidentales y los cazadores-recolectores de África oriental (sección S8) ( 20). Las espectro (fig. S8).
poblaciones no africanas (chinos Han en los residentes de Beijing y Utah con ancestros del
norte y Europa occidental) también muestran patrones análogos en los MCA, lo que sugiere
que un componente de la ascendencia arcaica fue compartida antes de la división de las Además, también computa los MCA utilizando el genoma de chimpancé para polarizar los
poblaciones no africanas y africanos. Una comprensión detallada de introgresión arcaica y su alelos ancestrales (fig. S9A) ( 37). Dejamos caer los sitios en los casos en que el alelo chimpancé
papel en la adaptación a diversas condiciones ambientales requerirá un análisis de los no corresponde a ninguno de alelo humano. Como comprobación adicional, también repetimos el
genomas de los genomas existentes y antiguos de todo el rango geográfico de África. restringir sólo a sitios donde el chimpancé y genomas orangután han emparejan alelos análisis ( 38).
Estos resultados se presentan en la fig. S9B. Por último, repetimos nuestro análisis de la
filtración de los sitios CpG hypermutable utilizando las anotaciones de CpG ( 18).

MATERIALES Y MÉTODOS CSF de los datos 1000 Genomas


espectro de frecuencias sitio condicional Hemos calculado CSF YRI, N donde pop 1 es una población humana moderna y pop 2 es una
Definimos los CSF, CSF YRI, N, como el histograma de los recuentos de alelos derivados en pop población arcaica. En concreto, se optó por el pop 1, a su vez, ser los yoruba de Nigeria
población 1 condicional en la observación de un alelo derivado en un pop relacionada grupo afuera 2 ( 13). (YRI), MSL, ESN, y DAS, mientras que elegimos pop 2 para ser o bien el de alta cobertura
Definimos C k como el número de SNPs en el que el alelo derivado está presente en k cromosomas en Vindija Neanderthal o la alta cobertura Denisovan genoma (fig. S4).
una muestra de norte cromosomas en total en el pop 1, mientras que un solo cromosoma en el
emergente grupo externo 2 lleva un alelo derivada. CSF YRI, N es el vector de los recuentos Hemos calculado theCSFS fromthe 3.Datos fase 1000Genomes ( 36) para cada uno de
los cuatro africana populationsmentioned arriba (fig. S4), así como para la CEPH CEU y
C k para k ∈ { 1 ... norte - 1}. chinos Han de Beijing (CHB) (fig. S6).

Durvasula y Sankararaman, Sci. Adv. 2020; 6: eaax5097 12 de febrero de 2020 5 de 9


SC I ENCE ADVANCE S | ARTÍCULO DE INVESTIGACIÓN

Para todas las poblaciones, se observó un espectro en forma de U con un exceso de patrones de los MCA empíricos. El estadístico de bondad de ajuste se define a partir de los
alelos derivados a frecuencias bajas y altas. En las poblaciones africanas, se observó que los residuos obtenidos al tratar de adaptarse a los MCA simuladas a los MCA empíricos.
MCA fromconditioning en la Denisovan es casi idéntica a la Vindija Neanderthal excepto en los Asumimos que los cargos de SNPs en cada derivan alelo bin de frecuencia de los MCA
contenedores lowestfrequency, donde hay un exceso de los recuentos de los MCA empíricos sigue una distribución binomial con una media dada por la proporción de SNPs
Neanderthal. Se interpretó que esta diferencia como sugerente de los bajos niveles de que tienen el mismo derivado alelo frecuencia en los MCA simulados. Una complicación es
ascendencia neandertal relacionada en estas poblaciones consistentes con estudios previos ( 18). que los recuentos a través de contenedores de frecuencias de los alelos derivados no son
En CEU y CHB, también se observó un espectro en forma de U, tanto para el Vindija independientes debido a desequilibrio de ligamiento. Para dar cuenta de esta complicación,
Neanderthal y Denisovan, pero con una diferencia más pronunciada entre el Neanderthal y se intentó estimar el número efectivo de observaciones independientes en los MCA
Denisovan espectros, es decir, un exceso de recuentos en la de baja frecuencia - derivado observados (en lugar de asumir que cada SNP es una observación independiente).
siteswhen acondicionado en el Vindija Neanderthal con relación a la Denisovan. Esta diferencia Definimos el residual para bin k como
es probablemente un reflejo de la experiencia de un evento de Neanderthal introgresión de
poblaciones fuera de África hace alrededor de 50.000 años ( 21, 39). Sección S8 explora la
implicación de la observación de un CSF en forma de U en las poblaciones no africanas y
africanos. pag ok sk
metro efpag ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
r k ¼ ffiffiffiffiffiffiffiffi
s k re 1 s k Þ

Para determinar la robustez de la forma de los MCA, que vuelven a calcular los MCA en riales
utilizando sólo las transiciones, transversiones, y después de la eliminación de los sitios CpG. Aquí, metro ef es el número efectivo de los SNP independientes, o k representa la

descargado de
Encontramos CSF muy similares en forma de U a través de thesemutation clases (fig. S7). Además, proporción de SNPs con derivados alelo recuento k en los MCA empíricos, s k es la
checkedwhether conversión parcial de genes podría causar esta señal mediante la eliminación de los proporción de SNPs con derivados alelo recuento k
polimorfismos de débil a fuerte y-fuertes-a débil. Hemos encontrado que la forma de los MCA en los MCA simulados, y k índices de la cuenta de alelo derivada. Se espera que estos residuos
permanece sin estas mutaciones (fig. S10A). Por último, hemos comprobado si la forma de los MCA para ser aproximadamente una distribución normal cuando el número de observaciones es
fue impulsado por la selección o bajas tasas de recombinación. Nosotros usamos si valores de ( 40), que grande (como es el caso de los MCA donde cada bin tiene> 1000 observaciones). metro ef es un
estiman los antecedentes de selección howmuch ha reducido la diversidad. Hemos restringido a las factor de escala para asegurar que los residuos están estandarizados.

http://advances.sciencemag.org/
regiones del genoma en el quintil superior de si valores (es decir, la parte superior de una quinta parte
de los sitios neutrales; si ≥ 800) y recalcula el espectro usando los individuos YRI. Hemos encontrado Calcular metro eff, utilizamos dos simulaciones de todo el genoma replicados (3 GB) bajo el mismo

que la forma sigue siendo la misma después de esta filtración (fig. S10B). demographicmodel y el conjunto de uno como los datos observados y uno como la simulación. Hemos

dividido el número de contenedores norte por la suma de los cuadrados de los residuos

norte
comparación de modelos metro ef ¼
ok sk 2
pagffiffiffiffiffiffiffiffiffiffiffiffi
Utilizamos simulaciones coalescentes para evaluar si un modelo demográfico produce un Σ norte
k¼1 s k re 1 s k Þ

CSF que coincide con los MCA empíricos. Para evaluar el ajuste de un modelo

el 18 de febrero 2020
demográfico dado METRO a los datos, se compararon los MCA calculadas sobre los datos
simulados bajo METRO a la calculada en los datos empíricos. Se consideró un modelo en Un buen ajuste resultará en los residuos aproximadamente normalmente distribuidos, mientras que

el que los MCA empíricos se obtuvieron mediante un muestreo de los MCA calculadas en encaja pobres desviarse significativamente de una distribución normal. Para obtener una prueba formal de

los datos simulados. Para estos ataques, modelamos la proporción de SNPs que contiene ajuste, se utilizó una prueba de KS comparar la distribución de los residuos a una distribución normal. PAG valores

un número dado k de alelos derivados más que el número de SNPs. Para evaluar el ajuste que rechazan la hipótesis nula sugieren que el modelo es un mal ajuste de los datos. Utilizamos

de los MCA simulados bajo contenedores de alelos conteos comprendidas entre 11 y 90, con exclusión de los contenedores de más

bajos y de más alta frecuencia que el recuento de estos contenedores son más propensos a ser afectados

METRO( S METRO) a los MCA observados ( O), se utilizó una probabilidad compuesta multinomial por errores de genotipado no modeladas, dando lugar a falsos rechazos de la hipótesis nula. Para evaluar

el ajuste de una clase de modelos (por ejemplo, los modelos A, B, y C), se presenta la PAG valor del

modelo con el parámetro estimaciones obtenidas a través de ABC (secciones S3.1 a S3.6).
Ok
Sk
L DMTH ¼ PAG re O | S METRO Þ ¼ Y norte 1
k¼1 Σk Sk Pasado, hemos ampliado la gama de derivados alelo recuentos en nuestra bondad de ajuste de
cálculo a partir de [11, 90] a [6, 95] (Tabla S8). Aunque ninguno de los modelos de ajuste
Aquí, k índices de la derivan alelo recuento, S k denota el número de SNPs con k- alelos adecuadamente, modelo C tiene sustancialmente mayor

derivados observados en los MCA simulados, mientras O k PAG valores que los othermodels, lo que indica que continúa explicando los MCA mejor a través de
denota el número de SNPs con k- alelos derivados observaron en los MCA empíricos. esta gama de alelos conteos. La falta de ajuste a través de la gama ampliada de derivados de alelos
Advertimos que L es una probabilidad compuesta que ignora la dependencia entre los SNPs que cuenta es probablemente debido a complejidades no modeladas en la historia demográfica
por lo que las comparaciones de L deben interpretarse con precaución. En los resultados subyacente, así como los procesos de error que afectan a los SNPs de baja y alta frecuencia.
presentados aquí, se informó el logaritmo de verosimilitud ( LL).

ajuste del modelo


Bondad de ajuste Utilizamos ABC para adaptarse a un modelo demográfico de los MCA de cada africana
Definimos una estadística de bondad de ajuste que hemos utilizado para evaluar si los MCA populationusing el abc Rpackage ( 41). Usando AMODEL poblaciones relatingAfrican y no
calculadas bajo un modelo demográfico explica la mayor africanos con el Neandertal y Denisovan

Durvasula y Sankararaman, Sci. Adv. 2020; 6: eaax5097 12 de febrero de 2020 6 de 9


SC I ENCE ADVANCE S | ARTÍCULO DE INVESTIGACIÓN

linajes como base, que encajan en el tiempo de división, mezcla de tiempo, la fracción de mezcla, y Fig. S17. Los modelos que prevén la estructura en el ancestro de los humanos modernos y arcaicos no pueden explicar los MCA

observado.
el tamaño efectivo de la población de un linaje (sección S5.2) introgresión .We dibujó valores para
Fig. S18. Los modelos que prevén estructura ancestral de la literatura no pueden explicar los MCA observado.
cada uno de los parámetros froma distribución anterior, simulado 300 Mb utilizando ms ( 42), y
calculado los MCA para la simulación resultante. Repetimos este procedimiento 75.000 veces. Se Fig. S19. Modelo A.1: El flujo de genes desde la parte posterior rama humana moderna antecesor en el antepasado de los humanos modernos

utilizó el “ NeuralNet ” establecer en el paquete R abc para calcular distribuciones posteriores más de antes del evento fuera de África.

Fig. S20. Modelo SA.1: Modelo simplificado del flujo de genes desde la parte posterior rama humana moderna antecesor en el
cada uno de los cuatro parámetros con una tolerancia de 0,005. Por el momento mezcla y tiempo
antepasado de los humanos modernos antes del evento fuera de África. Fig. S21. Modelo A.2: El flujo de genes de la rama humana
de división, se presenta la distribución posterior en unidades de años mediante la convolución del
moderna antecesor en la rama africana después de que el evento fuera de África.
tiempo de generación posterior con un uniformdistribution más de [25, 33] para incorporar la
incertidumbre en el tiempo de generación. Fig. S22. Modelo sA.2: Modelo simplificado del flujo de genes de la rama humana moderna antecesor en la rama africana después

de que el evento fuera de África. Fig. S23. Modelo B.1: El flujo de genes de la rama arcaica en el antepasado de los humanos

modernos antes del evento fuera de África.

Fig. S24. Modelo sB.1: Modelo simplificado del flujo de genes de la rama arcaica en el antepasado de los humanos modernos antes
inferencia de ascendencia local del evento fuera de África.

Utilizamos Archie ( 23) para inferir los segmentos de los genomas en 50 YRI y 50 individuos Fig. S25. Modelo B.2: el flujo de genes de la rama arcaica en la rama africana después del evento fuera ofAfrica.

MSL que probablemente rastrear su ascendencia a un arcaico AMODEL population.We


Fig. S26. Modelo sB.2: Modelo simplificado del flujo de genes de la rama arcaica en la rama africana después del evento
trainedArchIEon donde una población arcaica divide 12.000 generaciones BP y introgresión
fuera de África.
2000 generaciones BP a una fracción mezcla 2% (sección S7) . Hemos calculado el tiempo Fig. S27. Modelo C.1: El flujo de genes de una rama arcaica desconocida en el antepasado de los humanos modernos antes del

coalescente para los segmentos clasificamos como arcaico y segmentos que clasifica como evento fuera de África.

descargado de
nonarchaic utilizando la posterior decodificación fromMSMCusing un individuo representativo Fig. S28. Modelo SC.1: modelo simplificado del flujo de genes de una rama arcaica desconocida en el antepasado de los humanos

modernos antes del evento fuera de África. Fig. S29. Modelo C.2: el flujo de genes de una rama arcaica desconocida en la rama
de ambos riales y NMM ( 24). También se calculó el tiempo de divergencia entre los segmentos
africana después del evento fuera de África.
escalado arcaicas y nonarchaic con genomas de prueba fromhunter-recolectores poblaciones,
poblaciones central AfricanPygmy y poblaciones arcaicas. Esta divergencia escalado se Fig. S30. Modelo SC.2: modelo simplificado del flujo de genes de una rama arcaica desconocida en la rama africana después del

calcula como el número de mutaciones específicas para el segmento restado del número de evento fuera de África.

Fig. S31. Las simulaciones de los-mejor ajuste parámetros para los modelos A, B, C (sección S3). Fig. S32. A.2 modelo con un
mutaciones compartidas entre el segmento y el genoma de ensayo. Dividimos este número

http://advances.sciencemag.org/
tamaño de población de 0:01 norte un en la población introgresión. Fig. S33. A.2 modelo con un tamaño de población de 1 × 10 - 4 norte
por el número de separación de los sitios en el segmento de normalizar la tasa de mutación
un en la población introgresión. Fig. S34. A.2 modelo con un tamaño de población de 1 × 10 - 4 norte un en la población
local. introgresión y la migración entre CEU y YRI en los últimos 20 ka. BP Fig S35. A.2 modelo con un tamaño de población de 1 ×
10 - 5 norte un en la población introgresión, que se bifurca 200 ka BP

Fig. S36. A.2 modelo en el que las divisiones introgresión de población al mismo tiempo como la población arcaico (550 ka BP) con

MATERIALES COMPLEMENTARIOS un tamaño de población de 0,01 norte a.

El material suplementario para este artículo está disponible en http://advances.sciencemag.org/cgi/ contenido / full / 6/7 / Fig. S37. A.2 modelo en el que las divisiones de población introgresión al mismo tiempo como la población arcaico, 765 ka BP

eaax5097 / DC1

Sección S1. modelos demográficos actuales no pueden explicar los MCA Fig. S38. Estimaciones de los parámetros usando ABC para el modelo A.1 incluyendo identificación errónea ancestral (e1) y error de

Sección S2. Los MCA no puede ser explicado por las desviaciones de panmixia en el ancestro de los humanos modernos y genotipificación en el arcaico (e2).

arcaicos Fig. S39. Estimaciones de los parámetros usando ABC para el modelo A.2 incluyendo identificación errónea ancestral (e1) y error

el 18 de febrero 2020
Sección S3. Exploración de modelos de introgresión en los antepasados ​de la actual africanos Sección S4. exploración de de genotipificación en el arcaico (e2). Fig. S40. Marginados CSF conjuntos de riales y CEU de las simulaciones. Fig. S41.

parámetros del modelo A Distribución de frecuencias de los alelos de SNPs arcaicas neutros de modelo C con 13% introgresión y un tiempo de introgresión

Sección S5. Estimación de parámetros para el modelo de mejor ajuste de introgresión arcaica sección S6. la migración de 42 ka BP Fig. S42. mapa de frecuencias segmento arcaico para MSL y riales. Fig. S43. CSF desde el modelo de referencia

continua versus un solo pulso Sección S7. ascendencia inferencia local Sección S8. discusión extensa sección S9. ms teniendo en cuenta las mutaciones recurrentes. Tabla S1. Descripción de los modelos examinados en este trabajo. Tabla S2.

comando líneas Fig. S1. modelo demográfica de Prüfer et al. (15) ( véase la sección S1 para más detalles). Fig. S2. Hemos simulado datos de la Prüfer et al. (15) modelo y añadido en error identificación errónea ancestral y genotipo error en el

topologías modelo demográfico para introgresión en los antepasados ​de la actual africanos simulaciones en las Figs. S20, arcaico. Tabla S3. ajustes del modelo para modelos nulos incluyendo estructura y salidas de panmixia en el ancestro Modern

S22, S24, S26, S28, y S30. Fig. S3. topologías modelo demográfico de los resultados matemáticos. humano (MH).

Fig. S4. MCA desde 1000 Genomas Fase 3 datos en todas las poblaciones africanas incluidas en el conjunto de datos. Tabla S4. ajustes del modelo para los modelos alternativos, incluyendo mezcla de otros linajes. Tabla S5. ajustes del modelo para los modelos

alternativos usando una demografía simplificado. Tabla S6. ajustes del modelo de las variaciones de modelo A. Tabla S7. Que mejor se ajusta

Fig. S5. MCA desde 1000 Genomas de fase 3 en los datos de la población Luhya. Fig. S6. MCA desde 1000 Genomas Fase valores de los parámetros para todas las poblaciones utilizando ABC. Tabla S8. PAG valores de una prueba de bondad de ajuste para los parámetros

3 datos en el CEU y CHB. Fig. S7. Robustez de los CSF en riales a través de mutación tipos y los genomas conjunto de de mejor ajuste para cada clase de modelos demográficos.

datos Fase 1 1000.

Fig. S8. Robustez de los CSF en riales para determinar el genotipo de los umbrales de calidad en los genomas arcaicos. Fig. S9. Apéndice A. El MCA es uniforme bajo la estructura en la población arcaico. Apéndice B. Los MCA

MCA en YRI al usar fuentes alternativas para el alelo ancestral. Fig. S10. MCA en YRI cuando se controla para la conversión parcial es simétrica bajo el modelo A. Referencias ( 43 - 55)

de genes y selección de fondo. Fig. S11. Las simulaciones del modelo de línea de base (la sección S1) tanto con una identificación

errónea ancestral (e1) y error de genotipificación en el arcaico (E2). Fig. S12. tasa de mutación y variación de la tasa de
Ver / Solicitar un protocolo para este papel a partir de Bio-protocolo.
recombinación. Fig. S13. Las simulaciones del modelo demográfico inferidas de Hsieh et al. (19) relacionando las poblaciones yoruba,

Baka, y Biaka.

REFERENCIAS Y NOTAS
Fig. S14. Las simulaciones de un modelo demográfico con la estructura y el gen de flujo en África. Fig. S15. Los modelos con la 1. S. Mallick, H. Li, M. Lipson, I. Mathieson, M. Gymrek, F. Racimo, M. Zhao, N. Chennagiri,
migración continua ( metro en unidades de migrantes por generación) desde los linajes introgresión divisiones de linaje. S. Nordenfelt, A. Tandon, P. Skoglund, I. Lazaridis, S. Sankararaman, Q. Fu, N. Rohland,
G. Renaud, Y. Erlich, T. Willems, C. Gallo, JP Spence, YS Song, G. Poletti, F. Balloux,
Fig. S16. modelos demográficos actuales de la literatura no pueden explicar la forma de los MCA observados en la fig. G. van Driem, P. de Knijff, IG Romero, AR Jha, DM Behar, CM Bravi, C. Capelli,
S4. T. Hervig, A. Moreno-Estrada, OL Posukh, E. Balanovska, O. Balanovsky,

Durvasula y Sankararaman, Sci. Adv. 2020; 6: eaax5097 12 de febrero de 2020 7 de 9


SC I ENCE ADVANCE S | ARTÍCULO DE INVESTIGACIÓN

S. Karachanak-Yankova, H. Sahakyan, D. Toncheva, L. Yepiskoposyan, C. Tyler-Smith, P. Moorjani, J. Pickrell, JC Mullikin, SH Vohr, RE Green, I. Hellmann, PLF Johnson,
Y. Xue, MS Abdullah, A. Ruiz-Linares, CM Beall, A. Di Rienzo, C. Jeong, H. Blanche, H. Cann, JO Kitzman, J. Shendure, EE Eichler, ES Lein, TE Bakken,
EB Starikovskaya, E. Metspalu, J. Parik, R. Villems, BM Henn, U. Hodoglugil, R. Mahley, LV Golovanova, VB Doronichev, MV Shunkov, AP Derevianko, B. Viola, M. Slatkin,
A. Sajantila, G. Stamatoyannopoulos, JTS Wee, R. Khusainova, E. Khusnutdinova, D. Reich, J. Kelso, S. Pääbo, la secuencia completa del genoma de un Neanderthal de las montañas de Altai. Naturaleza
S. Litvinov, G. Ayodo, D. Comas, MF Hammer, T. Kivisild, W. Klitz, CA Winkler, D. Labuda, 505, 43 - 49 (2014).
M. Bamshad, LB Jorde, SA Tishkoff, WS Watkins, M. Metspalu, S. Dryomov, 19. PH Hsieh, KR Veeramah, J. Lachance, SA Tishkoff, JD Wall, MF Hammer,
R. Sukernik, L. Singh, K. Thangaraj, S. Pääbo, J. Kelso, N. Patterson, D. Reich, El Simons genoma proyecto de RN Gutenkunst, Todo el genoma análisis de secuencia de África Occidental y Central pigmeos cazadores-recolectores

diversidad: 300 genomas de 142 poblaciones diversas. Naturaleza 538, revelan una historia demográfica compleja e identificar genes candidatos en virtud de la selección natural positiva. Res

201 - 206 (2016). genoma. 10.1101 / gr.192971.115, (2016).

2. RE Green, J. Krause, AW Briggs, T. Maricic, U. Stenzel, M. Kircher, N. Patterson, H. Li, 20. P. Skoglund, JC Thompson, ME Prendergast, A. Mittnik, K. Sirak, M. Hajdinjak, T. Salie,
W. Zhai, MH-Y. Fritz, NF Hansen, EY Durand, A.-S. Malaspina, JD Jensen, N. Rohland, S. Mallick, A. Peltzer, A. Heinze, I. Olalde, M. Ferry, E. Harney, M. Michel,
T. Marques-Bonet, C. Alkan, K. Prüfer, M. Meyer, HA Burbano, JM Bueno, R. Schultz, K. Stewardson, JI Cerezo-Román, C. Chiumia, A. Crowther, E. Gomani-Chindebvu,
A. Aximu-Petri, A. Butthof, B. Höber, B. Höffner, M. Siegemund, A. Weihmann, C. Nusbaum, AO Gidna, KM Grillo, IT Helenius, G. Hellenthal, R. Helm, M. Horton, S. López,
ES Lander, C. Russ, N. Novod, J. Affourtit, M. Egholm, C. Verna, P. Rudan, D. Brajkovic, AZP Mabulla, J. Parkington, C. Shipton, MG Thomas, R. Tibesasa, M. Welling,
Ž. Kucan, I. Gu š ic, VB Doronichev, LV Golovanova, C. Lalueza-Fox, M. de la Rasilla, J. Fortea, VM Hayes, DJ Kennett, R. Ramesar, M. Meyer, S. Pääbo, N. Patterson, AG Morris,
A. Rosas, RW Schmitz, PLF Johnson, EE Eichler, D. Falush, E. Birney, JC Mullikin, N. Boivin, R. Pinhasi, J. Krause, D. Reich, reconstrucción de estructura de la población africano prehistóricos. Célula 171, 59 -

M. Slatkin, R. Nielsen, J. Kelso, M. Lachmann, D. Reich, S. Pääbo, A borrador de la secuencia del genoma neandertal. Ciencias 71.e21 (2017).

328, 710 - 722 (2010). 21. S. Sankararaman, N. Patterson, H. Li, S. Pääbo, D. Reich, La fecha del cruce entre neandertales y los
3. D. Reich, RE Green, M. Kircher, J. Krause, N. Patterson, EY Durand, B. Viola, AW Briggs, humanos modernos. PLOS Genet. 8, e1002947 (2012).
U. Stenzel, PLF Johnson, T. Maricic, JM Bueno, T. Marques-Bonet, C. Alkan, P. Fu, 22. BM Henn, TE Steele, TD Weaver, Aclarar modelos distintos de los orígenes humanos modernos en África. Curr. Opin.
S. Mallick, H. Li, M. Meyer, EE Eichler, M. Stoneking, M. Richards, S. Talamo, MV Shunkov, Gineta. Prog. 53, 148 - 156 (2018).
AP Derevianko, J.-J. Hublin, J. Kelso, M. Slatkin, S. Pääbo, la historia genética de un grupo hominin arcaico de 23. A. Durvasula, S. Sankararaman, un modelo estadístico para la inferencia libre de referencia de ascendencia local de arcaico. PLOS

descargado de
Denisova cueva en Siberia. Naturaleza 468, 1053 - 1060 (2010). Genet. 15, e1008175 (2019).

4. M. Meyer, M. Kircher, M.-T. Gansauge, H. Li, F. Racimo, S. Mallick, JG Schraiber, F. Jay, 24. S. Schiffels, R. Durbin, inferir tamaño de la población humana y la historia separación de múltiples secuencias del
K. Prüfer, C. de Filippo, PH Sudmant, C. Alkan, P. Fu, R. Do, N. Rohland, A. Tandon, genoma. Nat. Gineta. 46, 919 - 925 (2014).
M. Siebauer, RE Green, K. Bryc, AW Briggs, U. Stenzel, J. Dabney, J. Shendure, 25. S. Kudaravalli, J.-B. Veyrieras, ser más extraña, ET Dermitzakis, JK Pritchard, los niveles de expresión de genes son un

J. Kitzman, MF Hammer, MV Shunkov, AP Derevianko, N. Patterson, AM Andrés, objetivo de la selección natural reciente en el genoma humano. Mol. Biol. Evol. 26, 649 - 658 (2009).

EE Eichler, M. Slatkin, D. Reich, J. Kelso, S. Pääbo, una secuencia del genoma de alta cobertura de un individuo
Denisovan arcaico. Ciencias 338, 222 - 226 (2012). 26. SR Grossman, KG Andersen, I. Shlyakhter, S. Tabrizi, S. Winnicki, A. Yen, DJ Park,

http://advances.sciencemag.org/
5. Browning SR, BL Browning, Y. Zhou, S. Tucci, JM Akey, Análisis de datos de secuencia humana revela dos pulsos D. Griesemer, EK Karlsson, SH Wong, M. Cabili, RA Adegbola, RNK Bamezai, AVS Hill,
de mezcla Denisovan arcaico. Célula 173, 53 - 61.e9 (2018). FO Vannberg, JL Rinn; 1000 Proyecto Genoma, ES Lander, SF Schaffner, PC Sabeti, identificación de adaptaciones en los

6. M. Kuhlwilm, I. Gronau, MJ Hubisz, C. de Filippo, J. Prado-Martínez, M. Kircher, Q. Fu, últimos datos genómicos a gran escala. Célula 152, 703 - 713 (2013).

HA Burbano, C. Lalueza-Fox, M. de la Rasilla, A. Rosas, P. Rudan, D. Brajkovic, Ž. Kucan, 27. Consorcio Internacional HapMap, KA Frazer, DG Ballinger, Dr. Cox, DA Hinds,
I. Gu š ic, T. Marques-Bonet, AM Andrés, B. Viola, S. Pääbo, M. Meyer, A. Siepel, LL Stuve, RA Gibbs, JW Belmont, A. Boudreau, P. Hardenbol, SM Leal, S. Pasternak,
S. Castellano, el flujo de genes antigua de los primeros humanos modernos en los neandertales del Este. DA Wheeler, TD Willis, F. Yu, H. Yang, C. Zeng, Y. Gao, H. Hu, W. Hu, C. Li, W. Lin,
Naturaleza 530, 429 - 433 (2016). S. Liu, H. Pan, X. Tang, J. Wang, W. Wang, J. Yu, B. Zhang, Q. Zhang, H. Zhao, H. Zhao,
7. V. Plagnol, JD Wall, Posible estructura ancestral en las poblaciones humanas. PLOS Genet. 2, J. Zhou, SB Gabriel, R. Barry, B. Blumenstiel, A. Camargo, M. Defelice, M. Faggart,
E105 (2006). M. Goyette, S. Gupta, J. Moore, H. Nguyen, RC Onofrio, M. Parkin, J. Roy, E. Stahl,
8. Martillo MF, AE Woerner, FL Méndez, JC Watkins, JD Wall, pruebas genéticas para la mezcla arcaico en África. Proc. E. Winchester, L. Ziaugra, D. Altshuler, Y. Shen, Z. Yao, W. Huang, X. Chu, Y. Él, L. Jin, Y. Liu,
Natl. Acad. Sci. Estados Unidos 108, 15123 - 15128 (2011). Y. Shen, W. Sun, H. Wang, Y. Wang, Y. Wang, X. Xiong, L. Xu, MM Waye, SK Tsui,
9. J. Lachance, B. Vernot, CC Elbers, B. Ferwerda, A. Froment, J.-M. Bodo, G. Lema, W. Fu, H. Xue, JT Wong, LM Galver, JB Ventilador, K. Gunderson, SS Murray, AR Oliphant,
TB Nyambo, TR Rebbeck, K. Zhang, JM Akey, SA Tishkoff, la historia evolutiva y la adaptación de las secuencias de MS Chee, A. Montpetit, F. Chagnon, V. Ferretti, M. Leboeuf, JF Olivier, MS Phillips,

el 18 de febrero 2020
todo el genoma de alta cobertura de diversas cazadores recolectores africanos. Célula 150, 457 - 469 (2012). S. Roumy, C. Sallée, A. Verner, TJ Hudson, PY Kwok, D. Cai, DC Koboldt, RD Miller,
L. Pawlikowska, P. Taillon-Miller, M. Xiao, LC Tsui, W. Mak, YQ Song, PK Tam,
10. PH Hsieh, AE Woerner, JD Wall, J. Lachance, SA Tishkoff, RN Gutenkunst, Y. Nakamura, T. Kawaguchi, T. Kitamoto, T. Morizono, A. Nagashima, Y. Ohnishi, A. Sekine,
análisis basados ​en modelos MF Hammer, de los datos de todo el genoma revelan una compleja historia evolutiva implica T. Tanaka, T. Tsunoda, P. Deloukas, CP Bird, M. Delgado, ET Dermitzakis, R. Gwilliam,
introgresión arcaica de los pigmeos de África Central. Res genoma. 26, 279 - 290 (2016). S. Hunt, J. Morrison, D. Powell, ser más extraña, P. Whittaker, DR Bentley, MJ Daly,
PI de Bakker, J. Barrett, YR Chretien, J. Maller, S. McCarroll, N. Patterson, I. Pe ' er, A. Price,
11. J. Hey, Y. Chung, A. Sethuraman, J. Lachance, S. Tishkoff, VC Sousa, Y. Wang, Filogenia estimación por integración S. Purcell, DJ Richter, P. Sabeti, R. Saxena, SF Schaffner, PC Sham, P. Varilly,
sobre el aislamiento con migración modelos. Mol. Biol. Evol. 35, D. Altshuler, LD Stein, L. Krishnan, AV Smith, MK-Tello Ruiz, GA Thorisson,
2805 - 2818 (2018). A. Chakravarti, PE Chen, DJ Cutler, CS Kashuk, S. Lin, GR Abecasis, W. Guan,
12. AP Ragsdale, S. Gravel, Modelos de mezcla arcaica y la historia reciente de las estadísticas de dos locus. PLOS Genet. 15, Y. Li, HM Munro, ZS Qin, DJ Thomas, G. McVean, A. Auton, L. Bottolo, N. Cardin,
e1008204 (2019). S. Eyheramendy, C. Freeman, J. Marchini, S. Myers, C. Spencer, M. Stephens, P. Donnelly,
13. H. Chen, RE Green, S. Pääbo, M. Slatkin, El espectro alelo frecuencia conjunta en especies estrechamente relacionadas. Genética LR Cardon, G. Clarke, DM Evans, AP Morris, BS Weir, T. Tsunoda, JC Mullikin,
177, 387 - 398 (2007). ST Sherry, M. Feolo, A. Skol, H. Zhang, C. Zeng, H. Zhao, I. Matsuda, Y. Fukushima,
14. MA Yang, A.-S. Malaspina, EY Durand, M. Slatkin, la estructura antigua en África poco probable para explicar DR Macer, E. Suda, CN Rotimi, CA Adebamowo, I. Ajayi, T. Aniagwu, PA Marshall,
Neandertal y similitud genética no africanos. Mol. Biol. Evol. 29, 2987 - 2995 (2012). C. Nkwodimmah, CD Royal, MF Leppert, M. Dixon, A. Peiffer, R. Qiu, A. Kent,
K. Kato, N. Niikawa, SI Adewole, BM Knoppers, MW Foster, EW Clayton, J. Watkin,
15. K. Prüfer, C. de Filippo, S. Grote, F. Mafessoni, P. Korlevi C, M. Hajdinjak, B. Vernot, L. Skov, RA Gibbs, JW Belmont, D. Muzny, L. Nazareth, E. Södergren, GM Weinstock,
P. Hsieh, S. Peyregne, D. Reher, C. Hopfe, S. Nagel, T. Maricic, Q. Fu, C. Theunert, DA Wheeler, I. Yakub, SB Gabriel, RC Onofrio, DJ Richter, L. Ziaugra, BW Birren,
R. Rogers, P. Skoglund, M. Chintalapati, M. Dannemann, BJ Nelson, Key FM, P. Rudan, MJ Daly, D. Altshuler, RK Wilson, LL Fulton, J. Rogers, J. Burton, NP Carter,
Ž. ku C una, I. Gu š yo C, LV Golovanova, VB Doronichev, N. Patterson, D. Reich, EE Eichler, CM Clee, M. Griffiths, MC Jones, K. McLay, RW Plumb, MT Ross, SK Sims,
M. Slatkin, MH Schierup, A. Andrés, J. Kelso, M. Meyer, S. Pääbo, A de alta cobertura Neandertal genoma DL Willey, Z. Chen, H. Han, L. Kang, M. Godbout, JC Wallenburg, P. L ' archevêque,
de Vindija en Croacia. Ciencias 358, eaao1887 (2017). G. Bellemare, K. Saeki, H. Wang, D. An, H. Fu, Q. Li, Z. Wang, R. Wang, AL Holden,
16. B. Paten, J. Herrero, S. Fitzgerald, K. Beal, P. Flicek, I. Holmes, E. Birney, Genome-wide-nivel de nucleótidos LD Brooks, JE McEwen, MS Guyer, VO Wang, JL Peterson, M. Shi, J. Spiegel, LM Sung,
antepasado mamífero reconstrucción. Res genoma. 18, 1829 - 1843 (2008). LF Zacharia, FS Collins, K. Kennedy, R. Jamieson, J. Stewart, un segundo mapa de haplotipos generación humana de

17. S. Gravel, BM Henn, RN Gutenkunst, AR Indap, GT Marth, AG Clark, F. Yu, RA Gibbs; El Proyecto 1000 Genomas, CD más de 3,1 millones de SNPs. Naturaleza 449, 851 - 861 (2007).

Bustamante, la historia demográfica y el intercambio alelo raro en las poblaciones humanas. Proc. Natl. Acad. Sci. 28. LB Barreiro, G. Laval, H. Quach, E. Patin, L. Quintana-Murci, la selección natural ha impulsado diferenciación de la población

Estados Unidos 108, 11983 - 11988 (2011). en los humanos modernos. Nat. Gineta. 40, 340 - 345 (2008).

18. K. Prüfer, F. Racimo, N. Patterson, F. Jay, S. Sankararaman, S. Sawyer, A. Heinze, G. Renaud, 29. D. Xu, P. Pavlidis, RO Taskent, N. Alachiotis, C. Flanagan, M. DeGiorgio, R. Blekhman,
PH Sudmant, C. de Filippo, H. Li, S. Mallick, M. Dannemann, Q. Fu, M. Kircher, S. Ruhl, O. Gokcumen, arcaico introgresión de homínidos en África contribuye a MUC7 variación genética salival
M. Kuhlwilm, M. Lachmann, M. Meyer, M. Ongyerth, M. Siebauer, C. Theunert, A. Tandon, funcional. Mol. Biol. Evol. 34, 2704 - 2715 (2017).

Durvasula y Sankararaman, Sci. Adv. 2020; 6: eaax5097 12 de febrero de 2020 8 de 9


SC I ENCE ADVANCE S | ARTÍCULO DE INVESTIGACIÓN

30. JD Wall, KE Lohmueller, V. Plagnol, Detección antigua mezcla y la estimación de parámetros demográficos inmultiple 45. M. Petr, S. Pääbo, J. Kelso, B. Vernot, límites de selección a largo plazo contra Neandertal introgresión. Proc. Natl. Acad.

humanpopulations. Mol. Biol. Evol. 26, 1823 - 1827 (2009). Sci. ESTADOS UNIDOS, 1639 - 1644 (2019).

31. CM Schlebusch, H. Malmström, T. Günther, P. Sjödin, A. Coutinho, H. Edlund, 46. ​K. Prüfer, SNPAD: Una antigua persona que llama genotipo ADN. bioinformática 34, 4165 - 4171 (2018).

AR Munters, M. Vicente, M. Steyn, H. Soodyall, M. Lombard, M. Jakobsson, Southern genomas ancestrales 47. BC Haller, PW Messer, Delgado 2: Flexible, simulaciones interactivas adelante genéticos.
africanos estiman moderna divergencia humana a hace 350.000 a 260.000 años. Ciencias 358, 652 - 655 (2017). Mol. Biol. Evol. 34, 230 - 240 (2017).
48. JN Fenner, la estimación de la Cruz-cultural del intervalo de generación humana para su uso en estudios de divergencia

32. JK Pickrell, N. Patterson, P.-R. Loh, M. Lipson, B. Berger, M. Stoneking, B. Pakendorf, genética basada en la población. A.m. J. Phys. Anthropol. 128, 415 - 423 (2005).

D. Reich, antiguo ascendencia eurasiática al oeste en el sur y el este de África. Proc. Natl. Acad. Sci. Estados Unidos 111, 2632 - 2637

(2014). 49. HR Kunsch, La navaja de bolsillo y la rutina de carga para las observaciones estacionarias generales.

33. K. Harvati, C. Stringer, R. Grün, M. Aubert, P. Allsworth-Jones, CA Folorunso, The tarde calvaria edad de piedra Ana. Stat. 17, 1217 - 1241 (1989).
de Iwo Eleru, Nigeria: Morfología y cronología. MÁS UNO 6, 50. AR Quinlan, IM Hall, BEDTools: Un conjunto flexible de servicios públicos para la comparación de las características genómicas. bioinformática

e24024 (2011). 26, 841 - 842 (2010).

34. GP Rightmire, Medio y los homínidos del Pleistoceno más tarde en África y el sudoeste de Asia. 51. A. Frankish, M. Diekhans, A.-M. Ferreira, R. Johnson, I. Jungreis, J. Loveland, JM Mudge,
Proc. Natl. Acad. Sci. Estados Unidos 106, 16046 - 16050 (2009). C. Sisu, J. Wright, J. Armstrong, I. Barnes, A. Berry, A. Bignell, SC Sala, J. Chrast,
35. I. Crévecoeur, A. Brooks, I. Ribot, E. Cornelissen, P. Semal, Abierto por la piedra restos humanos de edad Ishango (República F. Cunningham, T. Di Domenico, S. Donaldson, IT Fiddes, C. García Girón, JM González,
Democrática del Congo): Nuevos conocimientos sobre la diversidad Pleistoceno tardío humanos modernos en África. J. Hum. Evol. 96, T. Grego, M. Hardy, T. Hourlier, T. Hunt, OG Izuogu, J. Lagarde, FJ Martin, L. Martínez,
35 - 57 (2016). S. Mohanan, P. Muir, FCP Navarro, A. Parker, B. Pei, F. Pozo, M. Ruffier, BM Schmitt,
36. El Consorcio Genomas 1000 Proyecto, A. Auton, LD Brooks, RM Durbin, EP Garrison, E. Stapleton, M.-M. Suñer, I. Sycheva, B. Uszczynska-Ratajczak, J. Xu, A. Yates, D. Zerbino,
HM Kang, JO Korbel, JL Marchini, S. McCarthy, GA McVean, GR Abecasis, una referencia global para la Y. Zhang, B. Aken, JS Choudhary, M. Gerstein, R. Guigó, TJP Hubbard, M. Kellis, B. Paten,
variación genética humana. Naturaleza 526, 68 - 74 (2015). A. Reymond, ML Tress, P. Flicek, anotación de referencia GENCODE para los genomas humanos y de ratón. Nucleicos Res

37. El chimpancé secuenciación y análisis Consortium, la secuencia inicial del genoma de chimpancé y la comparación ácidos. 47, D766 - D773 (2019).

con el genoma humano. Naturaleza 437, 69 - 87 (2005). 52. JD Wall, MA Yang, F. Jay, SK Kim, EY Durand, LS Stevison, C. Gignoux, A. Woerner,

descargado de
38. DP Locke, LW Hillier, WC Warren, KC Worley, LV Nazareth, DM Muzny, S.-P. Yang, MF Hammer, M. Slatkin, los niveles más altos de ascendencia neandertal en los asiáticos orientales que en los europeos. Genética

Z. Wang, AT Chinwalla, P. Minx, M. Mitreva, L. Cook, KD Delehaunty, C. Fronick, 194, 199 - 209 (2013).

H. Schmidt, LA Fulton, RS Fulton, JO Nelson, V. Magrini, C. Pohl, TA Graves, 53. L. Skov, R. Hui, V. Shchur, A. Hobolth, A. Scally, MH Schierup, R. Durbin, Detectar introgresión arcaico usando un
C. Markovic, A. Cree, HH Dinh, J. Hume, CL Kovar, GR Fowler, G. Lunter, S. Meader, grupo afuera unadmixed. PLOS Genet. 14, e1007641 (2018).
A. Heger, CP Ponting, T. Marques-Bonet, C. Alkan, L. Chen, Z. Cheng, JM Kidd, 54. M. Kimura, Solución de un proceso de deriva genética aleatoria con un modelo continuo.
EE Eichler, S. White, S. Searle, AJ Vilella, Y. Chen, P. Flicek, J. Ma, B. Raney, B. Suh, Proc. Natl. Acad. Sci. Estados Unidos 41, 144 - 150 (1955).

R. Burhans, J. Herrero, D. Haussler, R. Faria, O. Fernando, F. Darré, D. Farré, E. Gazave, 55. RC Griffiths, el espectro de frecuencia de una mutación, y su edad, en un modelo de difusión general. Theor. Población.

http://advances.sciencemag.org/
M. Oliva, A. Navarro, R. Roberto, O. Capozzi, N. archidiácono, GD Valle, S. Purgato, Biol. 64, 241 - 251 (2003).
M. Rocchi, MK Konkel, JA Walker, B. Ullmer, MA Batzer, AFA Smit, R. Hubley,
C. Casola, DR Schrider, MW Hahn, V. Quesada, XS Puente, GR Ordoñez, C. López-Otín, Expresiones de gratitud: Agradecemos a K. Lohmueller, N. Patterson, M. Lipson, M. Schumer, P. Moorjani,
T. Vinar, B. Brejova, A. Ratan, RS Harris, W. Miller, C. Kosiol, HA Lawson, V. Taliwal, AL Martins, TV Kent, P. Skoglund, y los miembros de los laboratorios Sankararaman y lohmueller para comentarios útiles. Fondos: AD
A. Siepel, A. Roychoudhury, X. Ma, J. Degenhardt, CD Bustamante, RN Gutenkunst, es apoyado por la NSF Graduate Research Fellowship DGE-1650604, y SS se apoya, en parte, por el NIH
T. Mailund, JY Dutheil, A. Hobolth, MH Schierup, OA Ryder, Y. Yoshinaga, PJ de Jong, subvenciones R00GM111744 y R35GM125055, una beca de investigación Sloan Alfred P., y un regalo de la Fundación
GM Weinstock, J. Rogers, ER Mardis, RA Gibbs, RK Wilson, comparativo y análisis demográfico de los genomas Okawa.
orangután. Naturaleza 469, 529 - 533 (2011). Contribuciones de autor: AD y SS diseñado y llevado a cabo el estudio. AD y SS escribió el documento. Conflicto de intereses: Los
39. P. Fu, M. Hajdinjak, OT Moldovan, S. Constantin, S. Mallick, P. Skoglund, N. Patterson, autores declaran que no tienen intereses en conflicto. Los datos y la disponibilidad de materiales: Todos los datos necesarios para
N. Rohland, I. Lazaridis, B. Nickel, B. Viola, K. Prüfer, M. Meyer, J. Kelso, D. Reich, evaluar las conclusiones del documento están presentes en el papel y / o el material complementario. están disponibles en la
S. Pääbo, un ser humano moderno temprano de Rumania con un ancestro Neandertal reciente. página web del proyecto 1.000 Genomas www.internationalgenome.org/data datos de secuenciación. ascendencia llamadas
Naturaleza 524, 216 - 219 (2015). locales están disponibles en https://sriramlab.cass.idre.ucla.edu/public/. Los datos adicionales relacionados con este documento
40. G. McVicker, D. Gordon, C. Davis, P. Green, firmas genómicas generalizadas de la selección natural en la evolución de los pueden solicitarse a los autores.

el 18 de febrero 2020
homínidos. PLOS Genet. 5, e1000471 (2009).

41. K. Csilléry, O. François, MGB Blum, abc: An R paquete para el cálculo bayesiano aproximado (ABC). Métodos
Ecol. Evol. 3, 475 - 479 (2012). Enviado 29 de de marzo de 2019 Aceptado el 3

42. RR Hudson, muestras de generación de acuerdo con una Wright - Fisher modelo neutral de genética de de diciembre de 2019 Publicado el 12 de de

variación. bioinformática 18, 337 - 338 (2002). febrero de 2020

43. GA Watterson, sobre el número de separación de los sitios en los modelos genéticos y sin recombinación. Theor. 10.1126 / sciadv.aax5097
Población. Biol. 7, 256 - 276 (1975).

44. K. Harris, R. Nielsen, inferir historia demográfica de un espectro de longitudes de haplotipos compartidos. PLOS Genet. 9, e1003521
Citación: A. Durvasula, S. Sankararaman, Recuperación de señales fantasma introgresión arcaica en las poblaciones africanas. Sci.

(2013). Adv. 6, eaax5097 (2020).

Durvasula y Sankararaman, Sci. Adv. 2020; 6: eaax5097 12 de febrero de 2020 9 de 9


La recuperación de las señales fantasma introgresión arcaica en las poblaciones africanas

Arun Durvasula y Sriram Sankararaman

Sci Adv 6 (7), eaax5097.


DOI: 10.1126 / sciadv.aax5097

descargado de
Artículo herramientas
http://advances.sciencemag.org/content/6/7/eaax5097

complementarios http://advances.sciencemag.org/content/suppl/2020/02/10/6.7.eaax5097.DC1
materiales

http://advances.sciencemag.org/
Referencias Este artículo cita 53 artículos, 12 de los cuales se puede acceder de forma gratuita
http://advances.sciencemag.org/content/6/7/eaax5097#BIBL

PERMISOS http://www.sciencemag.org/help/reprints-and-permissions

el 18 de febrero 2020

El uso de este artículo está sujeta a la Términos de servicio

(ISSN 2375-2548) es una publicación de la Asociación Americana para el Avance de la Ciencia, 1200 Nuevo
Los avances de la ciencia
York Avenue NW, Washington, DC 20005. El título Los avances de la ciencia es una marca registrada de la AAAS.

Los autores, algunos derechos reservados; licenciatario exclusivo Asociación Americana para el Avance de la
Ciencias. Sin pretensión de originales Funcionamiento del Gobierno de los Estados Unidos. Distribuido bajo una licencia Creative Commons Reconocimiento No Comercial Copyright © 2020
Licencia 4.0 (CC BY-NC).

También podría gustarte