Documentos de Académico
Documentos de Profesional
Documentos de Cultura
autor manuscrito
Naturaleza. Autor manuscrito; disponible en PMC 2013 mayo 03.
autor Manuscrito
Una lista completa de los autores y afiliaciones aparece en la parte final del artculo.
Abstracto
La poblacin de las Amricas ha sido objeto de una amplia investigacin gentica, arqueolgica y lingstica; Sin embargo, las
preguntas centrales siguen sin resolverse 1-5. Una cuestin polmica es si el acuerdo se produjo a travs de una sola 6-8 o
El patrn de dispersiones dentro de las Amricas tambin es poco conocido. Para abordar estas cuestiones en una resolucin ms alta que
antes era posible, hemos reunido los datos de 52 17 grupos siberianos nativos americanos y genotipo en 364,470 polimorfismos de
nucletido nico. Mostramos que los nativos americanos descienden de al menos tres corrientes de flujo de genes de Asia. La mayora
descienden por completo de una sola poblacin ancestral que llamamos First American. Sin embargo, los hablantes de lenguas
esquimales-Aleut desde el rtico heredan casi la mitad de su ascendencia de una segunda corriente de flujo de genes de Asia y el
Chipewyan de habla Na-Dene desde Canad heredan aproximadamente una dcima parte de su ascendencia de una tercera corriente. Se
demuestra que el poblamiento inicial seguida de una expansin hacia el sur facilitado por la costa, con divisiones en la poblacin
secuenciales y poco flujo de genes despus de la divergencia, especialmente en Amrica del Sur. Una excepcin importante es en
Chibchan-altavoces en ambos lados del istmo Panam, que tienen ascendencia tanto del Norte y del Sur.
autor Manuscrito
La liquidacin de las Amricas tuvo lugar hace al menos 15.000 aos a travs de Beringia, un puente de tierra entre Asia y
Amrica que existi durante las edades de hielo 1-5. La mayora de los anlisis de la diversidad gentica de nativos americanos han
examinado loci individuales, particularmente el ADN mitocondrial o el cromosoma Y, y algunas interpretaciones de estos modelo
de datos de la solucin de Amrica como una sola onda migratoria de Asia 6-8. Hemos reunido muestras de poblaciones nativas de
Canad hasta el extremo sur de Amrica del Sur, ellos genotipo de polimorfismo de nucletido nico (SNP microarrays), y
fusionamos nuestros datos con otros seis conjuntos de datos. El conjunto de datos combinado consta de 364,470 SNPs genotipo
en 52 poblaciones de nativos americanos (493 muestras; la Figura 1A; Tabla S1); 17 poblaciones siberianas (245 muestras;
Figura S1; Tabla S2); y otros 57 poblaciones (1.613 muestras) (Nota S1).
autor Manuscrito
Los usuarios pueden ver, imprimir, copiar, descargar y texto y mina de datos, los contenidos en dichos documentos, a los fines de la investigacin acadmica, a condicin de que la totalidad
de Condiciones de uso: http://www.nature.com/authors/editorial_policies /license.html#terms
*
A quin debe dirigirse la correspondencia: reich@genetics.med.harvard.edu (DR) y a.ruizlin@ucl.ac.uk (AR-L.). solicitudes de acceso a datos deben
dirigirse a gbedoya@quimbaya.udea.edu.co (GB) y AR-L.
# Direccin actual: Departamento de Ciencia BIOANALYTICAL Nestec Ltd, Nestl Research Center de Lausana, Suiza.
+ Direccin actual: Global Biotech Consulting Group, Ciudad de Mxico, Mxico
Contribuciones de autor. DR, NBF, ALP y AR-L. concibi el proyecto. DR, NP, DC, AT, SM, NR y AR-L. anlisis realizados. DR y AR-L. escribi el documento con
el aporte de todos los co-autores. AR-L. ensamblado la recogida de muestras, dirigida trabajo experimental, y coordinado el estudio. Todos los dems autores
contribuyeron a la recoleccin de muestras y datos.
Acceso a los datos. Los datos analizados aqu estn disponibles para la investigacin sin fines de lucro en la historia de la poblacin en virtud de un acuerdo de acceso de datos interinstitucional con la
Universidad de Antioquia, Colombia. Pregunta relacionada con el acceso a datos deben ser enviados conjuntamente con GB (gbedoya@quimbaya.udea.edu.co) y AR-L. (A.ruizlin@ucl.ac.uk).
Reich et al. Pgina 2
Una complicacin en el estudio de la historia gentica de nativos americanos es mezclado con los inmigrantes europeos y africanos
autor Manuscrito
desde 1492. El anlisis Cluster diecisis muestra que muchas de las muestras que examinamos tienen alguna mezcla no nativo (un
promedio de 8,5%; la Figura 1B; Tabla S1; Tabla S3). Para hacer frente a esto, validamos nuestras inferencias usando tres enfoques
independientes. En primer lugar, nos limita el anlisis a 163 nativos americanos de 34 poblaciones sin evidencia de mezcla (Nota
S2). En segundo lugar, nos resta la contribucin esperada de ascendencia europea y africana a las estadsticas que utilizamos para
aprender acerca de las relaciones de poblacin (Nota S3). En tercer lugar, inferimos que la probabilidad de ascendencia no nativo en
cada segmento genmico y segmentos enmascarados con ms de una probabilidad despreciable de esta ascendencia (Nota S4;
Figura S2; Figura 1B). Nuestros inferencias a partir de estos tres enfoques son concordantes (Figura S3, la figura S4).
Hemos construido un rbol (Figura 1 C) usando F ST distancias entre pares de poblaciones, que en trminos generales est de
acuerdo con la geografa y lingsticas categoras 17 ( rboles sobre la base de los datos enmascarados y desenmascarados son
autor Manuscrito
similares; La figura S3). Una divisin temprana separa los asiticos de los nativos americanos y los extremos noreste siberianos
(Chukchi, Naukan, Koryak), consistente con estudios que han identificado variantes panamericanas compartidos con los
siberianos del noreste 6,7,10,18. altavoces EskimoAleut y siberianos noreste forman un grupo que se separa de otras poblaciones de
nativos americanos por una rama interna de largo. En Amrica, el rbol muestra una serie de divisiones en una secuencia
aproximada de norte a sur que comienza con el rtico, seguido por el norte de Amrica del Norte, el norte / centro y sur de
Mxico, Baja Centroamrica / Colombia, y terminando en tres grupos de Amrica del Sur (los Andes, la regin del Chaco y el este
de Sudamrica). Este patrn de divisiones es consistente con una expansin de la poblacin de norte a sur, una inferencia que
tambin est apoyado por la correlacin negativa entre la heterocigosidad y la distancia desde el estrecho de Bering (r = -0,48, P
= 0,007). Esta correlacin aumenta si usamos distancias menor costo, que consideran las costas como facilitadores de la
migracin 19-21, y persiste si excluimos cuatro poblaciones nativas de Amrica del Norte con ascendencia de las corrientes
Los rboles proporcionan un modelo simplificado de la historia que no da cabida a la posibilidad de flujo de genes despus de la
separacin de la poblacin. La evidencia circunstancial de que algunas poblaciones de nativos americanos pueden no ajustarse a un
simple rbol proviene de anlisis de conglomerados, que infiere Siberianrelated ascendencia en algunos del norte norteamericanos
(Figura 1B), y de estudios solo lugar que han identificado variantes genticas comunes entre Eurasia y Amrica del Norte que estn
ausentes de Amrica del Sur 11,22,23. Sin embargo, estos mtodos no pueden distinguir ascendencia compartida de mezcla despus de la
separacin de la poblacin. El advenimiento de los conjuntos de datos de todo el genoma ha permitido el desarrollo de una 4 Prueba de
Poblacin de si los conjuntos de cuatro poblaciones son consistentes con un rbol. Esta prueba es robusta a la que afecta el sesgo de
Para cada una de las 52 poblaciones de nativos americanos, a su vez, se prueba la hiptesis de que se ajusten al rbol: (( Prueba
de Poblacin, El sur de nativos americanos), (Outgroup1, Outgroup2)) por 45 pares de 10 grupos externos asiticos. Se utiliz un
Hotelling T- examen para evaluar si todos 4 Prueba de Poblacin F 4 Las estadsticas de esta forma son consistentes con la
expectativa de cero (Nota S6). La prueba no es significativa para 47 poblaciones, en consonancia con su derivado de la misma,
presumiblemente primera oleada de la colonizacin de Amrica, y nos llaman a esta ascendencia First American (Tabla 1). Por
Latina muestran evidencia muy significativa de la ascendencia de los flujos adicionales de flujo de genes de Asia, con posterioridad
autor Manuscrito
a la poblamiento inicial de Amrica, que confirmamos a travs de la Hotelling T- de prueba y una prueba complementaria (Nota S6):
Este de Groenlandia Inuit (P <10 -9), West Groenlandia Inuit (P <10 -9), Isleos Aleutianas (P = 9 10 -5) y Chipewyan (P <10 -9). El
recientemente secuenciado del genoma de un 4000 aos de edad Saqqaq paleoesquimal de Groenlandia 25 Tambin tiene pruebas
(Nota S6).
El examen de los valores de la F 4 las estadsticas nos permite inferir el nmero mnimo de eventos de flujo de genes de Asia a
Amrica del consistentes con los datos. Se espera que cada corriente de flujo de genes para producir un vector distinto de F 4 estadsticas,
lo que constituye una firma de cmo se relaciona la migracin de la poblacin ancestral que hoy en da las poblaciones de Asia. Al
encontrar el nmero mnimo de vectores cuyas combinaciones lineales son necesarios para producir el vector observado en cada
poblacin, inferimos que un mnimo de tres eventos de flujo de genes procedentes de Asia son necesarios para explicar los datos
de todas las poblaciones de nativos americanos en conjunto, incluyendo el Saqqaq Paleo -Eskimo (Nota S6). Estos tres episodios
autor Manuscrito
corresponden a Primera ascendencia americana (distribuida por todo el continente americano) y dos corrientes adicionales de flujo
de genes detectados en un subconjunto del norte de Amrica del Norte (este de Groenlandia Inuit, West inuit de Groenlandia, las
islas del Aleutianas, Chipewyan y Saqqaq). La Tabla 1 muestra que F 4 estadsticas en los isleos inuit y Aleutianas son consistentes
con derivar los no-primeras porciones americanas de su ascendencia de la misma corriente despus del flujo de genes de Asia,
proporcionando soporte para ascendencia compartida profunda entre estos grupos lingsticamente enlaces 12,26. El Na-Dene
hablando Chipewyan tiene un patrn diferente de F 4 estadsticas de altavoces esquimales-Aleut, lo que implica que descienden al
menos en parte a partir de una corriente separada del flujo de genes asitica (P <10 -9 para comparaciones con el inuit de
Groenlandia; Tabla 1). Esto es consistente con la hiptesis de que las lenguas Nadene marcan una migracin distinta de Asia 9,17. Dado
que slo tenemos datos de un grupo de habla Na-Dene, una direccin importante para el trabajo futuro ser probar si el origen
asitico distinta detectamos en el Chipewyan es una firma compartida a lo largo de altavoces Na-Dene. Por ltimo, la Saqqaq 25 tener
un vector de F 4 estadsticas coherentes con la de la Chipewyan, lo que plantea la posibilidad de que el Saqqaq y Chipewyan ambos
llevan el material gentico de la misma corriente despus del flujo de genes de Asia en las Amricas, post data la primera migracin
autor Manuscrito
Para desarrollar un modelo explcito para la solucin de las Amricas, se utiliz el marco Mezcla Grfico (AG) 24. AGs son
generalizaciones de los rboles que se adaptan a la posibilidad de un nmero limitado de eventos de flujo gen unidireccionales. Son
poderosas herramientas para el aprendizaje de la historia porque hacen predicciones acerca de los valores de F- estadsticas (por
ejemplo, F 4) que se puede utilizar para probar el ajuste de un modelo propuesto 24 ( Nota S7). La figura 2 presenta una AG en relacin
poblaciones de nativos americanos y del Viejo Mundo seleccionados que es un buen ajuste a los datos en el sentido de que ninguna de
autor Manuscrito
las F- estadsticas predichas por el modelo son ms de 3 errores estndar a partir de lo que se observa. Esto apoya la hiptesis de los
tres linajes de profundidad en los nativos americanos: el linaje asitico que lleva a primeros americanos es la ms profundamente
divergentes, mientras que los linajes asiticos que lleva a hablantes esquimal-aleutianos y los Na-Dene hablando chipewyan estn ms
estrechamente relacionados y descender desde una putativo poblacin ancestral siberiano ms estrechamente relacionados con Han
poblaciones y la chipewyan derivan grandes proporciones de sus genomas a partir de primeros antepasados americanos: un estimado de
autor Manuscrito
57% para los hablantes esquimal-aleutianos, y el 90% en el Chipewyan, reflejando probablemente los principales eventos de mezcla de
las dos corrientes posteriores de la migracin asitica con los primeros americanos que encontrado despus de su llegada (Nota S7). La
alta proporcin de Primera ascendencia americana explica por qu los esquimales-Aleut y poblaciones chipewyan cluster con primeros
americanos en los rboles como la figura 1C a pesar de tener algunos de sus antepasados de las corrientes posteriores de la migracin
asitica, y explica la observacin de que algunas mutaciones genticas que son compartidos por todos nativos americanos, pero estn
ausentes en otros lugares 6,7,10,18. Tambin inferir back-migracin de las poblaciones relacionadas con los esquimales-Aleut de Amrica en
farnortheastern Siberia (obtenemos un excelente ajuste a los datos cuando se modela la Chukchi Naukan y costera como mezclas de
grupos relacionados con la Groenlandia Inuit y los asiticos; Figura 2 ; Nota S7). Esto explica los hallazgos previos de alelos
A continuacin utiliza los AG para desarrollar un modelo para la historia de las poblaciones que obtienen toda su ascendencia de la
primera migracin de Amrica, sin ascendencia de las corrientes posteriores del flujo de genes de Asia. La Figura 3 presenta una AG
hemos construido para 16 poblaciones seleccionadas de los nativos americanos y 2 grupos externos, que es un buen ajuste a los datos
de que la mayor | Z | score para una diferencia entre lo observado y predicho F- estadsticas mayores es de entre los 3,2
11.781 de estadsticas hemos probado (Nota S7) (La AG de la figura 3 utiliza los datos de enmascarado, sin
embargo, un conjunto coherente de relaciones se infiere para muestras unadmixed;. Figura S4) Este modelo
proporciona un ajuste estadstico mejorado en gran medida a los datos en comparacin con el rbol de la Figura 1C
y conduce a varias inferencias novedosas. (I) Una fraccin relativamente grande de la poblacin de Amrica del Sur
se ajustan a la AG sin necesidad de eventos de mezcla, que Nuestra hiptesis refleja una historia de flujo limitado de
genes entre estas poblaciones desde su divergencia inicial. En contraste, slo una pequea fraccin de las
poblaciones mesoamericanas encaja en la AG, lo que podra reflejar ya sea una mayor tasa de migracin entre los
autor Manuscrito
grupos vecinos o nuestro muestreo denso en Mesoamrica que nos permite detectar eventos de flujo de genes ms
sutiles. F ST = 0.014 entre los zapotecas y una poblacin ancestral planteado la hiptesis de que todos los de Amrica
Central y Amrica del Sur), lo que sugiere que el tamao efectivo de la poblacin en Mesoamrica han sido
relativamente grande desde la colonizacin de la regin. (Iii) El modelo infiere tres eventos de mezcla consistentes
con las ubicaciones geogrficas y afiliaciones lingsticas (Nota S7). El Inga tiene tanto ascendencia andina y
amaznica, en consonancia con ellos hablando un idioma quechua pero que viven en las laderas orientales de los
Andes de Colombia e interactuar tanto con los grupos de las tierras bajas amaznicas vecinas. El tallo Guaran de
dos cadenas distintas de ascendencia dentro de Amrica del Sur oriental. El evento mezcla ms llamativa se
encuentra en la Costa Rica Cabecar (Figura 3) y otras poblaciones Chibchanspeaking (Nota S7) de la zona de
Isthmo-Colombia. Uno de los linajes que detectamos en estas poblaciones se produce definitivamente en la radiacin
de las poblaciones de Amrica del Sur, por lo que la presencia de estas poblaciones en la parte baja de
Centroamrica sugiere que hubo flujo gentico inverso a travs del istmo Panam despus de la liquidacin inicial de
autor Manuscrito
Amrica del Sur. Ha habido controversia sobre si Chibchan-hablantes de menor Amrica Central representan
descendientes directos de los primeros colonos en la regin o ms reciente
la migracin a travs del istmo, y nuestros resultados apoyan la opinin de que la migracin ms reciente ha contribuido la mayor parte
autor Manuscrito
Este es el estudio ms completo de la diversidad gentica en los nativos americanos hasta la fecha, y la primera para dar
cuenta de la mezcla reciente no nativo. Nuestros anlisis muestran que la gran mayora de las poblaciones de nativos
americanos-Canad a la punta sur de Chile-derivan su ascendencia de un First American poblacin ancestral homognea,
presumiblemente el que cruz el estrecho de Bering hace ms de 15.000 aos 6-8. Tambin documentamos al menos dos
corrientes adicionales de flujo de genes de Asia a Amrica, que nos permite rechazar la idea de que todos los nativos
americanos actuales se derivan de una sola ola de migracin 6-8, consistente con escenarios ms complejos propuestos por
otros estudios 9-15. En particular, los tres linajes asiticos distintas detectamos: "First American", "Eskimo-Aleut", y una separada
en el Na-Dene hablando Chipewyan, son consistentes con un modelo de tres ondas propuesto por Greenberg, Turner y Zegura
basado principalmente en la morfologa dental y una controvertida interpretacin de los datos lingsticos 9. Sin embargo,
nuestro anlisis tambin documentan extensa mezcla entre primeros americanos y los subsiguientes flujos de migrantes
asiticos, que no fue predicho por el modelo de Greenberg y sus colegas, de manera que los altavoces esquimales-Aleut y el
autor Manuscrito
Chipewyan derivan ms de la mitad de su ascendencia de primeros americanos. Nuevas perspectivas sobre la historia de
nativos americanos se beneficiarn de la aplicacin de anlisis similares a las realizadas aqu para todo el genoma secuencias
y los datos de las muchas poblaciones mezcladas en las Amricas que no identifican a s mismos como indgenas 28-30.
mtodos Resumen
Las muestras de ADN que analizamos se recogieron durante varias dcadas. Para cada muestra, se verific que el consentimiento
informado se obtuvo consistentes con estudios de historia de la poblacin y que la aprobacin institucional se haba obtenido en el pas
autor Manuscrito
de recogida. supervisin y aprobacin tica para este proyecto fue proporcionado por el Servicio Nacional de tica de la Investigacin
Nacional de Salud, Comit Central de Londres (Ref # 05 / Q0505 / 31). El conjunto de datos se basa en la fusin de datos de la matriz
iluminacin SNP recin generadas para este estudio (incluyendo 273 muestras nativos americanos) con los datos de otros seis
estudios. Aplicamos estrictos procedimientos de curacin y validacin de datos al conjunto de datos resultante de la fusin. Se utiliz el
software ascendencia inferencia local para identificar segmentos del genoma en cada muestra nativos americanos y de Siberia, sin
evidencia de mezcla reciente europeos o africanos, y cre un conjunto de datos que enmascara los segmentos de origen
potencialmente no nativo. La mayora de los anlisis se llevan a cabo en el conjunto de datos de mscaras; Sin embargo, se confirm
principales inferencias en un subconjunto de 163 muestras de nativos americanos que no tena evidencia de mezcla europea o
africana. Hemos utilizado la agrupacin y neighborjoining rboles basados en modelos para obtener una visin general de las
relaciones entre poblacin, y luego, si la prueba de conjuntos propuestos cuatro poblaciones fueron consistentes con tener una relacin
simple rbol con el Prueba Poblacin 4, que generalizamos a travs de un Hotelling T- prueba. Se analiz la correlacin de las
diferencias de frecuencia de alelos entre poblaciones para inferir el nmero mnimo de eventos de flujo de genes que se produjeron
autor Manuscrito
entre Asia y Amrica. Nos encajan los patrones de correlacin en las diferencias de frecuencia de alelos para modelos propuestos de la
mtodos
autor Manuscrito
Las muestras analizadas aqu se recogieron para estudios previos largo de varias dcadas. Hemos revisado la documentacin disponible
para cada poblacin para confirmar que todas las muestras se recogieron con el consentimiento informado que abarca estudios genticos de
la historia de la poblacin. se obtuvo la aprobacin institucional para el uso de cada conjunto de muestras en este tipo de investigacin antes
de este estudio en el pas de recogida. La aprobacin para este estudio tambin fue proporcionado por el Servicio Nacional de tica de la
genotipado
Todas las muestras fueron genotipo utilizando matrices Illumina, y el conjunto de datos analizados aqu es el resultado de la
fusin de datos de siete fuentes diferentes (Nota S1). El genotipado que se llev a cabo especficamente para este estudio se
autor Manuscrito
llev a cabo en el Instituto Broad de Harvard y el MIT, con la excepcin de 10 muestras chipewyan que fueron genotipo de la
Universidad McGill (no se observaron diferencias sistemticas entre estos y las 5 muestras chipewyan genotipo en el Broad
Institute). Tabla S3 especifica los detalles para cada una de las 493 muestras de nativos americanos. Un total de 419
muestras se genotipo a partir de ADN genmico, y 74 a partir de material todo el genoma amplificado (WGA) preparados,
Requerimos> 95% exhaustividad genotipado para cada SNP y muestra. Hemos fusionado los datos obtenidos especficamente
para este estudio con otros seis conjuntos de datos. Nosotros muestras ms alejados que eran valores atpicos en PCA con
relacin a otros de su grupo, mostr un exceso de velocidad de los heterocigotos en comparacin con la tasa esperada de la
autor Manuscrito
frecuencia en la poblacin, o tena evidencia de ser un segundo grado relativo o ms cerca de otra muestra en el estudio (Nota
S1). Los anlisis genticos se resumen en la Nota S1 encontraron subestructura en algunas poblaciones (mayas, zapotecas y
Nganasan); usamos etiquetas como Maya1 y Maya2 para indicar los subgrupos.
Para cada individuo nativos americanos, se utiliz HAPMIX 31 para modelar sus haplotipos ancestrales con dos paneles: (i) las
poblaciones del Viejo Mundo (una piscina de 408 europeos y africanos del oeste 130) y (ii) las poblaciones nativo, un grupo de
todas las poblaciones de nativos americanos y de Siberia. haplotipo fase en el panel ancestral, que es necesaria para HAPMIX, se
determin mediante la eliminacin gradual ambos grupos de muestras juntos usando Beagle 32. Nos enmascarado segmentos del
genoma que tenan un nmero esperado de> 0,01 cromosomas no nativos americanos de acuerdo con HAPMIX, conservando as los
autor Manuscrito
segmentos con una probabilidad extremadamente alta nominal de ser homocigticos para ascendencia indgena. Mltiples anlisis
reportados en los materiales complementarios indican que nuestro procedimiento de enmascaramiento produce inferencias acerca de
Utilizamos EIGENSOFT para llevar a cabo la PCA y calcular por pares poblacin F ST33.
Se utiliz la clasificacin de Greenberg 17,36. Se consider que el uso de clasificaciones alternativas; Sin embargo, otros (como Campbell 37) no
plantear la hiptesis de vnculos entre las lenguas a un nivel lo suficientemente profundo como para comparar a las relaciones genticas en
distancias euclidianas del estrecho de Bering (64.8N 177.8E) y la ubicacin de cada poblacin (Tabla S1) se calcularon
utilizando grandes distancias de arco sobre la base de un Lambert azimutal proyeccin igual rea. distancias de menor costo
autor Manuscrito
entre los mismos puntos se calcularon utilizando PATHMATRIX 19, lo que nos permite construir un mapa coste espacial que
incorpora el contorno costero de las Amricas. Se compararon las siguientes / costes costeras interiores relativos: 1: 2, 1: 5,
1:10, 1:20, 1:30, 1:40, 1:50, 1: 100, 1: 200, 1: 300, 1: 400, y 1: 500. Hemos calculado un coeficiente de correlacin de Pearson
entre la heterocigosidad para cada poblacin y su distancia menor costo del estrecho de Bering (Nota S5).
Se utiliz el 4 Prueba de Poblacin para evaluar si los conjuntos de propuestas de cuatro poblaciones fueron consistentes con un rbol.
Para cada uno de 52 Las poblaciones de prueba, se evalu su consistencia con el derivado de la misma poblacin de origen asitico
como nativos americanos del sur mediante el estudio de las estadsticas de la forma F 4 ( Sur americanos nativos, Poblacin de prueba;
Outgroup1, Outgroup2), donde los dos grupos externos son los 45 (= 10 9/2) pares posibles de 10 grupos externos asiticos (chinos
autor Manuscrito
Han y 9 poblaciones siberianas con al menos diez muestras de cada uno y sin incluir el Naukan y Chukchi que hemos demostrado tener
cierta Primera ascendencia americana debido hacer una copia de la migracin a travs del estrecho de Bering, lo que resultan
inadecuados como grupos externos (Nota S6 y S7 Nota)). Se aplic un Hotelling T- prueba para evaluar si el conjunto de todos los
posibles F 4 estadsticas fue consistente con cero despus de tener en cuenta su estructura de correlacin, lo que resulta en una sola
prueba de hiptesis para si el Poblacin de prueba es consistente con tener la misma relacin con el panel de poblaciones asiticas
como el conjunto de El sur de nativos americanos muestras utilizadas como grupo de referencia. Tambin se generaliz esta prueba
mediante el estudio de la matriz de todos F 4 estadsticas de forma simultnea y estadsticas de computacin que miden si el F 4 estadsticas
visto en juegos propuestos de las poblaciones nativas americanas son consistentes con que deriva de un nmero determinado de
migraciones asiticas. En la Nota S6 mostramos que si ha habido norte corrientes distintas de flujo de genes de Asia en las Amricas,
entonces la matriz de todas las posibles F 4 estadsticas pueden tener rango de no ms de N-1 ( haciendo caso omiso de ruido de
muestreo). El caso
autor Manuscrito
N = 1 reduce a calcular una Hotelling T 2 estadstica. Tambin hemos desarrollado una prueba de razn de verosimilitud, la generalizacin de
la Hotelling T- prueba, para evaluar la evidencia estadstica para valores mayores de NORTE,
lo que nos permite estimar el nmero mnimo de intercambios entre Asia y Amrica que son necesarios para explicar los
datos genticos.
mezcla grficos
autor Manuscrito
Se utiliz el marco Mezcla Grfico (AG) 24 para adaptarse a los modelos de separacin de la poblacin, seguido de mezcla a los datos.
Un AG hace predicciones sobre las correlaciones en las estadsticas de diferenciacin frecuencia de los alelos ( F- estadsticas) que se
observa entre todos los pares, triples, cudruples y de las poblaciones 24, y estos pueden ser comparados con los valores observados
(junto con un error estndar de un bloque de la navaja de bolsillo) para probar hiptesis acerca de las relaciones de poblacin (Nota
S7). No tenemos una prueba formal de bondad de ajuste para si un determinado AG ajusta a los datos de correccin para el nmero
de hiptesis probadas y nmero de grados de libertad, pero el uso de dos aproximaciones. En primer lugar, examinamos individuo F- estadsticas,
en busca de los que son> 3 errores estndar de expectativa indicativo de un mal ajuste. En segundo lugar, se calcula una 2 estadstica
para el partido entre el observado y predicho F- estadsticas, teniendo en cuenta la matriz de covarianza entre los emprica F- estadsticas
calcula en base a un bloque de la navaja de bolsillo. Esto resulta en un P-valor nominal, pero no est claro a nosotros en la actualidad
si la matriz de covarianza emprica que obtenemos puede ser equiparado con la matriz de covarianza terico que se necesita para
calcular un valor P formal. Para una complejidad grfica fija (nmero de aristas de deriva y pesos de mezcla), sin embargo, podemos
comparar la 2 valor para los diferentes grficos de mezcla para obtener una prueba formal de si algunas topologas son
autor Manuscrito
significativamente mejores ajustes; esto da como resultado la coloracin de los bordes en la Figura 3, que muestra que muestra
puntos de insercin alternativos para bordes de mezcla son igualmente buenos ajustes.
Material suplementario
autores
autor Manuscrito
David Reich 1,2, *, Nick Patterson 2, Desmond Campbell 3,4, Arti Tandon 1,2, Stphane Mazieres 3,5, Nicolas
Ray 6, Maria V. Parra 3,7, Winston Rojas 3,7, Constanza Duque 3,7, Natalia Mesa 3,7, Luis F. Garca 7, Omar
Triana 7, Silvia Blair 7, Amanda Maestre 7, Juan C. Dib 8, Claudio M. Bravi 3,9, Graciela Bailliet 9, Daniel Corach 10,
Tabita Hnemeier 3,11, Maria-Ctira Bortolini 11, Francisco M. Salzano 11, Mara Luisa Petzl-Erler 12, Vctor
Acua-Alonso 13, Carlos Aguilar-Salinas 14, Samuel CanizalesQuinteros 14,15, Teresa Tusie-Luna 14,15, Laura
Riba 14,15, Maricela RodrguezCruz diecisis, Mardia Lpez-Alarcn diecisis, Ramn Coral-Vzquez 17, Thelma
Canto-Cetina 18,
Irma Silva Zolezzi- 19, #, Juan Carlos Fernndez-Lpez 19, Alejandra V. Contreras 19,
Gerardo Jimnez Snchez 19, +, Mara Jos Gmez-Vzquez 20, Julio Molina 21,
ngel Carracedo 22, Antonio Salas 22, Carla Gallo 23, Giovanni Poletti 23, David B. Witonsky 24, Gorka
Alkorta-Aranburu 24, Rem I. Sukernik 25, Ludmila Osipova 26,
autor Manuscrito
Sardana Fedorova 27, Ren Vasquez 28, Mercedes Villena 28, Claudia Moreau 29,
Ramiro Barrantes 30, David Pauls 31, Laurent Excoffier 32, Gabriel Bedoya 7, ,
Francisco Rothhammer 33, Jean Michel Dugoujon 34, Georges Larrouy 34, William Klitz 35, Damian Labuda 29, Judith
Kidd 36, Kenneth Kidd 36, Anna Di Rienzo 24, Nelson
B. Freimer 37, Alkes L. Price 2,38, y Andrs Ruiz-Linares 3, *,
afiliaciones
autor Manuscrito
2 Instituto Broad del MIT y de Harvard, Cambridge, Massachusetts, EE.UU. 3 Departamento de Gentica, Evolucin y
California en Berkeley, Oakland, California, EE.UU. 36 Departamento de Gentica de la Facultad de Medicina, New
Massachusetts, EE.UU.
Expresiones de gratitud
Estamos muy agradecidos a los voluntarios que proporcionaron las muestras que hicieron posible este estudio. Agradecemos a ED Ruiz para la asistencia en la coleccin que
autor Manuscrito
implica la mixteca, zapoteca y mixe; A. Carnevale, M. Crawford, M. Metspalu, FC Nielsen, X. Soberon, R. y E. Villems Willersley para facilitar el intercambio de datos
procedentes de Mxico, Siberia y las poblaciones del rtico; y C. Stevens y A. Crenshaw para asistencia con genotipado. Agradecemos a P. Bellwood, D. Bolnick, K. Bryc, J.
Diamond, T. Dillehay, R. Gonzalez-Jos, M. Hammer, J. Hill, B. Kemp, S. LeBlanc, D. Meltzer, P. Moorjani, A. Moreno-Estrada, B. Pakendorf, J. Pickrell, M. Ruhlen, DG Smith,
M. Stoneking, N. Tuross y A. Williams para crticas reflexivos y discusiones valiosos. Apoyo fue proporcionado por NIH otorga NS043538 (AR-L.), NS037484 y MH075007
(NBF), GM079558 (AD), GM079558-S1 (AD), GM057672 (KKK y JRK), HG006399 (DR, NP & ALP); por una subvencin HOMINID NSF 1032255 (DI + NP); por los Institutos
Canadienses de Investigacin en Salud de subvencin (DL); por una subvencin Universidad de Antioquia CODI (GB); por una beca FIS PS09 / 02368 (AC); por un MICINN
conceder SAF2011-26983 (AS); por un Wenner-Gren Beca de la Fundacin ICRG-65 (AD & RS); por Fundacin Rusa para la Investigacin Bsica Subvenciones
06-04-048182 (RS) y 02-06-80524a (LO); por una rama siberiana de la Academia Rusa de Ciencias campo Grant (LO); por una subvencin PIR CNRS Amazonie (J.- por un
Wenner-Gren Beca de la Fundacin ICRG-65 (AD & RS); por Fundacin Rusa para la Investigacin Bsica Subvenciones 06-04-048182 (RS) y 02-06-80524a (LO); por una
rama siberiana de la Academia Rusa de Ciencias campo Grant (LO); por una subvencin PIR CNRS Amazonie (J.- por un Wenner-Gren Beca de la Fundacin ICRG-65 (AD &
RS); por Fundacin Rusa para la Investigacin Bsica Subvenciones 06-04-048182 (RS) y 02-06-80524a (LO); por una rama siberiana de la Academia Rusa de Ciencias
campo Grant (LO); por una subvencin PIR CNRS Amazonie (J.-
MARYLAND); y por los fondos de puesta en marcha de la Escuela Mdica de Harvard (DR) y la Escuela de Harvard de Salud Pblica (ALP).
referencias
autor Manuscrito
1. Cavalli-Sforza, LL .; Menozzi, P .; Piazza, A. La Historia y Geografa de los genes humanos. Princeton, UP: 1994.
2. Meltzer, DJ. Primeros pueblos en un mundo nuevo: la colonizacin de Amrica era de hielo. University of California Press; 2009.
3. Goebel T, Aguas MR, O'Rourke DH. A finales del Pleistoceno dispersin de los humanos modernos en las Amricas. Ciencia.
2008; 319: 1497-1502. [PubMed: 18339930]
4. Dillehay TD. Un estudio ms exhaustivo en los primeros estudios de Amrica. Proc. Natl. Acad. Sci. EE.UU. 2009; 106: 971-978.
[PubMed: 19164556]
5. O'Rourke DH, Raff JA. La historia gentica humana de las Amricas: la ltima frontera. Curr. Biol. 2010; 20: R202-R207.
[PubMed: 20178768]
6. Tamm E, et al. Beringian punto muerto y la propagacin de los fundadores americanos nativos. Ms uno. 2007: 1-6.
7. Una cocina, Miyamoto MM, Mulligan CJ. Un modelo de colonizacin de tres etapas para la poblacin de las Amricas. Ms uno.
2008; 3: e1596. [PubMed: 18270583]
8. Fagundes NJ, et al. genmica de las poblaciones mitocondriales soporta un solo origen pre-Clovis con una ruta costera para la
autor Manuscrito
poblacin de las Amricas. A.m. J. Hum. Gineta. 2008; 82: 583-592. [PubMed: 18313026]
9. Greenberg JH, Turner CG, Zegura SL. La liquidacin de las Amricas: Una comparacin de la lingstica, dental, y la
evidencia gentica. Curr. Antrop. 1986; 27: 477-497.
10. Lell JT, et al. El doble origen y afinidades de Siberia de los cromosomas Y de nativos americanos. A.m
J.Hum.Genet. 2002; 70: 192-206. [PubMed: 11731934]
11. Bortolini MC, et al. evidencia del cromosoma Y para diferentes historias demogrficas antiguas en las Amricas. A.m. J.
Hum. Gineta. 2003; 73: 524-539. [PubMed: 12900798]
12. Volodko NV, et al. la diversidad del genoma mitocondrial en siberianos rticas, con especial referencia a la historia evolutiva
de Beringia y pleistocnico poblamiento de Amrica. Am J Hum Genet. 2008; 82: 1084-1100. [PubMed: 18452887]
autor Manuscrito
13. Ray N, et al. Una evaluacin estadstica de los modelos para el establecimiento inicial del continente americano hace hincapi en la
importancia del flujo de genes con Asia. Mol. Biol. Evol. 2010; 27: 337-345. [PubMed: 19805438]
14. de Azevedo S, et al. Evaluacin de modelos microevolutivos la terminacin anticipada del Nuevo Mundo: la importancia del flujo
de genes recurrente con Asia. A.m. J. Phys. Anthropol. 2011; 146: 539-
552. [PubMed: 21805463]
15. Perego UA, et al. Distintivas rutas de migracin paleoindios de Beringia marcados por dos haplogrupos de ADN mitocondrial
raros. Curr. Biol. 2009; 19: 1-8. [PubMed: 19135370]
16. Alexander DH, Novembre J, Lange K. rpida estimacin basado en un modelo de ascendencia en individuos no relacionados.
Genome Res. 2009; 19: 1655-1664. [PubMed: 19648217]
17. Ruhlen, M. Una gua para las lenguas del mundo. Stanford University Press; 1991.
18. Schroeder KB, et al. Un alelo privada ubicua en las Amricas. Biol. Letn. 2007; 3: 218-223. [PubMed: 17301009]
autor Manuscrito
19. Ray N. PATHMATRIX: una herramienta de sistema de informacin geogrfica para calcular distancias efectivas entre muestras. Mol.
Ecol. Notas. 2005; 5: 177-180.
20. Wang S, et al. La variacin gentica y la estructura de la poblacin en los nativos americanos. PLoS Genet. 2007; 3: e185. [PubMed:
18039031]
21. Yang NN, et al. Contrastando los patrones de diversidad nuclear y ADN mitocondrial en poblaciones de nativos americanos. Ann
Hum Genet. 2010; 74: 525-538. [PubMed: 20887376]
22. Brown MD, et al. ADNmt haplogrupo X: Un antiguo enlace entre Europa / Asia occidental y Amrica del Norte?
Am.J.Hum.Genet. 1998; 63: 1852-1861. [PubMed: 9837837]
23. Karafet TM, et al. fuente ancestral de Asia (s) del nuevo mundo haplotipos fundadores del cromosoma. Am.J.Hum.Genet.
1999; 64: 817-831. [PubMed: 10053017]
24. Reich D, Thangaraj K, N Patterson, Precio DP, L. Singh La reconstruccin de la historia de la poblacin india. Naturaleza. 2009; 461:
489-494. [PubMed: 19779445]
25. Rasmussen M, et al. Ancient secuencia del genoma humano de un extinguido paleo-esquimales. Naturaleza. 2010; 463: 757-762.
[PubMed: 20148029]
autor Manuscrito
26. Balter M. arqueologa. La poblacin de las Aleutianas. Ciencia. 2012; 335: 158-161. [PubMed: 22246747]
27. R. Cooke Prehistoria de los nativos americanos en el puente continental de Amrica Central: La colonizacin, la dispersin, y la
divergencia. J archaeol. Res. 2005; 13: 129-187.
28. Wang S, et al. patrones geogrficos de la mezcla del genoma en latn mestizos americanos. PLoS Genet. 2008; 4: e1000037.
[PubMed: 18369456]
29. Bryc K, et al. papel Coloquio: patrones de todo el genoma de la estructura de la poblacin y la mezcla entre las poblaciones
latinos / hispanos. Proc. Natl. Acad. Sci. EE.UU. 2010; 107 (Supl 2): 8954-
8961. [PubMed: 20445096]
30. Pared JD, et al. La variacin gentica en los nativos americanos, deducida de SNP latina y resequencing datos. Mol. Biol. Evol.
2011; 28: 2231-2237. [PubMed: 21368315]
31. Precio AL, et al. deteccin sensible de segmentos cromosmicos de ascendencia distinta en poblaciones mezclados. PLoS
Genet. 2009; 5: e1000519. [PubMed: 19543370]
32. Browning SR, Browning BL. El rpido y preciso ajuste de fase haplotipo y desaparecidos-datos inferencia para estudios de asociacin de todo
autor Manuscrito
el genoma mediante el uso de la agrupacin haplotipo localizada. Am J Hum Genet. 2007; 81: 1084-1097. [PubMed: 17924348]
33. Patterson N, Precio DP, la estructura del Reich D. Poblacin y el anlisis propio. PLoS Genet. 2006; 2: 2074-2093.
34. Saitou N, Nei M. El mtodo de unin de vecinos: un nuevo mtodo para la reconstruccin de rboles filogenticos. Mol.Biol.Evol.
1987; 4: 406-425. [PubMed: 3447015]
35. Liu K, Muse SV. PowerMarker: un entorno de anlisis integrado para el anlisis de marcador gentico. Bioinformtica. 2005;
21: 2128-2129. [PubMed: 15705655]
36. Greenberg, JH. Idioma en las Amricas. Stanford University Press; 1987.
37. Campbell, L. lenguas indgenas de Amrica: los lingstica histrica de los nativos de Amrica. Prensa de la Universidad de Oxford; 1997.
autor Manuscrito
autor Manuscrito
autor Manuscrito
autor Manuscrito
que usa el aditivo muestra evidencias de cierta ascendencia relacionados con Eurasian West y subsahariana-relacionados-africana en
muchos nativos americanos antes de enmascaramiento (parte superior), pero poco despus (parte inferior). lneas verticales gruesas
denotan principales grupos lingsticos, y las lneas finas verticales separan las poblaciones individuales. (C) Vecino-Participar rbol
basado en F ST distancias relativas de nativos americanos a poblaciones no seleccionadas de Amrica (tamaos de muestra entre
parntesis). Datos nativos americanos y siberianos se analizaron despus de enmascarar pero los rboles consistentes se obtuvieron en
un subconjunto de muestras completamente unadmixed (Figura S3). Algunas poblaciones tienen evidencia de subestructura, y nos
crculos rellenos y los linajes que descienden de ellos son de color: First American (azul), ancestros de los
Na-Dene habla Chipewyan (verde) y los esquimales-Aleut (rojo). El modelo tambin infiere una migracin de
personas relacionadas con altavoces esquimales-Aleut a travs del estrecho de Bering, con lo primeros genes de
Amrica a Asia (el Naukan se muestran, pero el Chukchi muestran un patrn similar; Nota S7). ST
Se muestra un grfico Aditivo (AG) que representa las relaciones entre las 16 poblaciones de nativos americanos seleccionados
con enteramente Primera ascendencia americana junto con 2 grupos externos (Yoruba) y Han. El Inga de Colombia se modela
como una mezcla de los Andes y ascendencia amaznica. El Guarani de Paraguay son aptos como una mezcla de hebras
separadas de ascendencia de Amrica del Sur oriental. El Cabcar de Centroamrica se modela como una mezcla de filamentos de
ascendencia relacionados con los sudamericanos y norteamericanos, apoyando la espalda a la migracin desde el sur en Amrica
para los linajes de mezcla conducen a la Cabecar que producen un ajuste similar a los datos en el sentido de que la 2 estadstica
autor Manuscrito
est dentro de 3,84 de la AG se muestra. El color rojo indica que el linaje de Amrica del Sur que contribuye a la Cabcar
se separ despus de la divergencia de las poblaciones andinas, y la coloracin azul muestra que el otro linaje presente en
tabla 1
Los nativos americanos descienden de al menos tres corrientes de flujo de genes de Asia
autor Manuscrito
agrupaciones poblacin sometida a prueba Valor P para esto muchas corrientes asiticas ser Nmero mnimo de corrientes de
suficiente para explicar los datos flujo de genes de Asia necesario para
explicar los datos
1 2 3
Notas: Utilizamos el mtodo descrito en la Nota S6 para probar formalmente si las agrupaciones especificadas de las poblaciones nativas americanas son consistentes con los
descensos de 1, 2, 3 o corrientes de flujo de genes de Asia. Utilizamos First American para referirse a un grupo de 43 poblaciones de Mesoamrica hacia el sur, y Eskimo-Aleut
para referirse a un grupo de este y el oeste de Groenlandia inuit y aleutianos. Probamos 3 o 4 grupos de poblacin (cuando hay 3 agrupaciones, el nmero mximo de flujos
podemos rechazar es 2, por lo que el valor P para 3 flujos es siempre 1). Se requieren al menos dos corrientes de flujo de genes asitico para explicar todas las filas (P <10-9).
Los Chipewyan, esquimales-Aleut y primeros americanos solamente se puede explicar conjuntamente por al menos tres corrientes.
autor Manuscrito
autor Manuscrito