Está en la página 1de 38

La expresión de múltiples genes adquiridos

horizontal es una característica de ambos


genomas de vertebrados e invertebrados
 Alastair Crujiente † 1 ,
 Chiara Boschetti † 1 ,
 Malcolm Perry 1 , 2 , 3 ,
 Alan Tunnacliffe 1 Autor de correo electrónicoy
 Gos Micklem 2 , 3 autor de correo electrónico


contribuido igualmente

Genome Biology 2015 16: 50


DOI: 10.1186 / s13059-015-0607-3
© crujiente y col .;BioMed Central.2015
Recibido: 25 Septiembre 2014
Aceptado 4 de febrero el año 2015
Publicado: 13 Marzo el año 2015

Abstracto
Fondo
Un concepto fundamental en la biología es que el material hereditario, el
ADN, se pasa de padres a hijos, un proceso llamado transferencia
vertical de genes. Un mecanismo alternativo de adquisición de genes es
a través de la transferencia horizontal de genes (HGT), que implica el
movimiento de material genético entre diferentes especies. HGT es bien
conocido en organismos unicelulares como las bacterias, pero su
existencia en organismos superiores, incluyendo animales, no está bien
establecida, y es objeto de controversia en los seres humanos.

resultados
Hemos aprovechado la reciente disponibilidad de un número suficiente
de genomas de alta calidad y transcriptomes para llevar a cabo un
examen detallado de HGT en 26 especies de animales (10 primates, 12
moscas y cuatro nematodos) asociado y un análisis simplificado en otro
14 vertebrados. análisis comparativos filogenéticos y de todo el genoma
muestran que HGT en animales normalmente da lugar a decenas o
cientos de genes activos "extranjeras", mayormente relacionados con el
metabolismo. Nuestros análisis sugieren que mientras que moscas de la
fruta y nematodos han seguido adquirir genes extraños en toda su
evolución, los humanos y otros primates han ganado relativamente pocos
desde su ancestro común. También resolvemos la controversia en torno
a la evidencia previa de HGT en los seres humanos y proporcionar al
menos 33 nuevos ejemplos de genes horizontal adquiridos.

conclusiones
Se argumenta que HGT ha ocurrido y sigue ocurriendo, en una escala
previamente insospechada en metazoos y es probable que hayan
contribuido a la diversificación bioquímica durante la evolución animal.

Alastair crujiente y Chiara Boschetti contribuyeron igualmente a este


trabajo.

Fondo
La adquisición de los genes de un organismo que no sea un antepasado
directo (es decir, la transferencia horizontal de genes (HGT) también
llamado transferencia lateral de genes) se conoce bien en bacterias y
eucariotas unicelulares, donde juega un papel importante en la evolución
[ 1 ], con estimaciones recientes sugieren que, en promedio, 81% de los
genes procariotas han participado en HGT en algún momento [ 2 ]. Sin
embargo, relativamente pocos casos se han documentado en los
organismos multicelulares [ 3 - 7 ]. Informes de HGT en animales se
limitan generalmente a la descripción de la transferencia de solamente
uno o unos pocos genes, por lo que el alcance de la transferencia
horizontal de genes en animales poco claras. Los ejemplos incluyen la
transferencia de genes fúngicos para la biosíntesis de carotenoides al
pulgón del guisante, que resulta en una pigmentación roja y se cree que
es beneficioso para el áfido [ 8 ] y la transferencia de una sintasa cisteína
a partir de una bacteria en el linaje de artrópodos (probablemente dos
transferencias independientes sobre un ancestro fitófagos ácaros y un
ancestro de lepidópteros), que permite la desintoxicación de cianuro
producido por plantas huésped [ 9 ]. Esta actividad también se encuentra
en los nematodos en las que puede haber sido adquiridos por HGT de
las plantas [ 9 ]. Otros ejemplos de putativamente HGT de adaptación se
han caracterizado en los nematodos parásitos de las plantas, que
producen la pared celular enzimas degradantes de un número de genes
transferidos horizontalmente [ 3 ], y el escarabajo broca del café, donde
una mananasa se ha transferido a partir de bacterias que permiten la
hidrolización del fruto del café galactomanano [ 10 ].

En casos excepcionales, se han reportado altos niveles de HGT en


animales, pero esto se ha atribuido a los estilos de vida de los
organismos receptores. Por ejemplo, en rotíferos bdelloidea, que son
asexuales desecación tolerante, de hasta aproximadamente 10% de los
transcritos de derivar de genes horizontalmente adquiridos [ 11 -
13 ]. Resultados de desecación, tanto en la rotura del ADN [ 14 , 15 ] y la
pérdida de integridad de la membrana (revisado en [ 16 ]), ambos de los
cuales puede potenciar HGT. Otro ejemplo inusual es la transferencia de
la totalidad del genoma (> 1 Mb) de la bacteriaWolbachia en la mosca de
la fruta Drosophila Ananassae, aunque relativamente pocos genes de
Wolbachia se transcriben en este caso [ 17 ]. Los genes
de Wolbachia con frecuencia se transfieren a los invertebrados [ 17 , 18 ],
probablemente debido a la asociación a largo plazo (ya sea parasitaria o
mutualista) entre la bacteria y sus anfitriones mantiene sus genomas en
las proximidades. Además, como Wolbachia infecta con frecuencia los
testículos y los ovarios de sus anfitriones, que tiene acceso a sus líneas
germinales, un requisito previo para la transmisión de los genes
adquiridos a la siguiente generación.

Estos estudios han conducido a la percepción de que HGT se produce


con muy poca frecuencia en la mayoría de los animales, especialmente
en los vertebrados [ 5 , 6 ]. Por otra parte, existen preocupaciones sobre
la validez de los ejemplos de HGT informaron en los seres humanos
[ 19 - 22 ]. El informe original de la secuencia del genoma humano [ 19 ]
describe procariota-a-vertebrado HGT descubierto mediante la alineación
de las secuencias humanas a los de un pequeño número de especies (no
muchos genomas estaban disponibles en el momento), incluyendo sólo
dos metazoos, D. melanogaster yCaenorhabditis elegans. Cualquier
proteína alinear a las bacterias pero no a estos dos metazoos, o a los
otros dos proteomas eucariotas utilizados (Arabidopsis
thaliana y Saccharomyces cerevisiae), fueron considerados como un
resultado de prokaryote a vertebrados HGT. Sin embargo, estas cuatro
especies eucariotas no contienen ortólogos de todos los genes humanos
"nativos" (es decir, aquellos que no adquirieron horizontalmente), lo que
lleva a una identificación incorrecta de HGT (falsos positivos) y el
posterior rechazo de muchos casos en los análisis filogenéticos [ 20 -
22 ]. El problema (la disponibilidad de un número limitado de los
genomas eucariotas para la comparación en los estudios de HGT) ha
disminuido en la década intervalo; miles de proteomas (incluyendo varios
primates) ya están disponibles en UniProt, lo que permite la predicción de
HGT mediante la alineación de cientos de especies y la validación
posterior filogenético, como se muestra en trabajos recientes en los
invertebrados (por ejemplo, [ 12 , 23 , 24 ]). En el ser humano, sin
embargo, no ha habido estudios de seguimiento desde el documento
inicial del genoma, y la verdadera escala de HGT en los seres humanos,
y metazoos general, sigue sin estar claro.

Para remediar esto, inicialmente identificamos no metazoos de metazoos


HGT en múltiples Drosophila, Caenohabditis y primates (incluyendo
humanos) especies. Debido a la controversia en torno a los estudios en
humanos [ 19 - 22 ], después cogimos nuestro análisis un paso más allá
mediante la comparación de varias especies estrechamente relacionadas
y la combinación de información sobre transferido horizontalmente (
'extranjeros') los genes que se encuentran en más de una especie en el
grupo, reduciendo de este modo la identificación errónea de HGT
causada por alineaciones espurias. De esta manera, se identificaron
hasta cientos de genes extraños activos en animales, incluyendo los
seres humanos, lo que sugiere que HGT ofrece importantes
contribuciones a la evolución de los metazoos.

resultados
Especies de Drosophila, especies y primates Caenorhabditis tienen
hasta cientos de genes extraños activos
Para determinar la escala de HGT en todos los grupos taxonómicos bien
caracterizados, se examinaron 12 especies de
Drosophila, Caenorhabditis cuatro especies de primates y 10 (Figura 1 )
para los que los genomas de alta calidad y transcriptomes están
disponibles. Para cada gen transcrito, se calculó el índice de HGT, h (la
diferencia entre los bitscores de la mejor no metazoos y los mejores
partidos de metazoos), lo que da una medida cuantitativa relativa de la
eficacia de un determinado gen se alinea con la no metazoos frente
metazoos secuencias, con números positivos indican una mejor
alineación de las secuencias no metazoos [ 12 ]. Por ejemplo,
el C. elegans gen gut-obstruido 1 (GOB-1), que codifica una fosfatasa
trehalosa-6-fosfato, tiene una mejor coincidencia no metazoan con un
bitscore de 135 y un mejor partido metazoan con un bitscore de 39,3 que
resulta en un índice HGT de 95.7. Como estábamos interesados en algo
más que muy reciente HGT, se excluyeron los miembros del phylum la
especie de ensayo 'de los partidos metazoos. Esto nos permitió
identificar HGT durante períodos evolutivos que abarca cientos de
millones de años, mientras que sólo la identificación de HGT que se ha
producido desde la divergencia de las especies de prueba 'de sus
especies más estrechamente relacionadas (probablemente hasta
decenas de millones de años). De aquí en adelante, cuando nos
referimos a los partidos a las secuencias de metazoos, nos referimos a
estos subconjuntos.
Figura 1
Las relaciones filogenéticas de los principales grupos taxonómicos estudiados. Los
números azules indican la ortholog grupos de asignación a cada rama (HGT). Los eventos
pueden haber ocurrido en cualquier lugar a lo largo de la rama, no sólo cuando se indique el
número. Eventos que se encuentran en la base del árbol se han producido en cualquier lugar
entre el origen de la phylum y la base del árbol. Los árboles no están dibujados a escala entre
sí.

Nos primero identificado un nivel de base de HGT (llamada clase C)


mediante el uso de umbrales conservadoras de h ≥30 (como en [ 12 ])
(que significa que el gen se alinea mucho mejor, y por lo tanto es mucho
más similares, a los genes no metazoos) y bitscore del mejor partido del
no-metazoos ≥100 (excluyendo así los malos alineamientos a los no
metazoos).El ejemplo dado anteriormente (GOB-1) pasa a estos
umbrales y, por tanto, es al menos de clase C HGT. A continuación, esta
información para cada especie se combinó para cada
taxón (Drosophila, Caenorhabditis y primates) para construir grupos
ortholog. Para cada grupo ortólogo se calculó el valor medio de todos los
miembros h (h Orth) y definimos los genes con h Orth ≥30 como de clase B, un
subconjunto de la clase C. Estos genes son, en promedio, como predijo
HGT en todas las especies estudiadas se encuentran en. El gen GOB-
1 tiene homólogos en C. brenneri, C. briggsae y C. japonica, con valores
de h = 102, h = 97,1 y h = 86,4, respectivamente, dando un promedio
de h (h Orth) de 95,3 y, como tal GOB-1 (ands sus homólogos) son también
clase B HGT. Por último, se aplicó un filtro aún más estrictos para definir
la clase A genes extraños (un subconjunto de la clase B), que tenía sólo
alineaciones muy pobres para metazoos secuencias y cuya ortólogos, tal
como se utiliza para definir la clase B, también tenía alineaciones
igualmente deficientes de metazoos secuencias. Para ello, hemos
identificado las secuencias cuya mejor partido a un metazoos tenido un
bitscore <100 y cuyos grupos ortólogo no contienen genes con partidos
de metazoos bitscore ≥100 (Figura 2 A). El gen GOB-1 no tiene
metazoos coincide con bitscore ≥100 (mejor partido metazoos = 39,3) y
lo mismo es cierto para sus homólogos (los resultados más de 37, 38,9
y 36,6, respectivamente), como tal, también es de clase A HGT.
Figura 2
Genes HGT por clase. (A) El panel izquierdo muestra una representación esquemática de las
clases HGT: clase B y C genes tienen índice h ≥ 30 y bitscore de los mejores no metazoos
BLASTX golpeado ≥ 100 (que se distinguen por h Orth, que no se muestra en esta figura),
mientras que los genes de clase a, además, deben haber bitscore <100 para el mejor de los
metazoos BLASTX golpeado. El panel derecho muestra los resultados para todos los genes
en H. sapiens, un código de colores de acuerdo a su clasificación (clase A: rojo, clase B:
naranja, clase C:, genes nativos azules: gris) (B) Box-trama de la serie de genes en cada
clase, para los tres principales. taxones analizados (Drosophila spp Caenorhabditis spp,
primates especies..), un código de colores de acuerdo con el mismo esquema (clase a: rojo,
clase B: naranja, clase C: azul).

a continuación, se realizó un análisis filogenético de todos los genes de


cada una de las clases anteriores y se encontró que un promedio de 55%
de todos los genes de clase C, el 65% de todos los genes de clase B y el
88% de todos los genes de clase A se validaron filogenéticamente como
extranjera. Esta validación y posterior análisis manual (archivos
adicionales 1y 2 ) sugirió que, si bien minimizar los falsos positivos como
C → B → A, se pierden algunos verdaderos positivos. Por lo tanto, los
genes de clase A representan una estimación mínima del nivel de HGT
para una especie determinada.

Hemos encontrado que Caenorhabditis especies tienen, en promedio,


173, 127 y 68 genes en clases HGT C, B y A, respectivamente. Por el
contrario, las especies de Drosophila tienen un menor número de genes
extraños activos que, en promedio, 40 genes de la clase C, 25 en la
clase B, y sólo cuatro de los niveles de la clase A. Primate HGT se sitúan
entre las de los taxones de invertebrados, con un promedio de 109, 79 y
32 genes de cada especie en las clases C, B y A, respectivamente
(Figura 2 B, archivos adicionales 2 y 3 ).

genes extraños identificados son poco probable que se explica por


las hipótesis alternativas
Para verificar que los genes extraños que hemos identificado en efecto,
pertenecen a la especie en estudio y no son la contaminación (este es un
problema en una serie de secuencias del genoma de los animales; ver
"validación filogenético 'en el archivo adicional 1 ), hemos probado si
fueron encontrados en los mismos andamios genómica como (es decir,
estaban vinculados a) genes de origen de los metazoos (genes
nativos). A través de todas las especies que encontramos un promedio
de sólo nueve genes de clase C por especie (6,6%) de los genes
extraños que no estaban ligados a los genes nativos (archivo
adicional 2 ), con proporciones correspondientemente bajas para la clase
B y A genes. La demostración de estos altos niveles de vinculación sólo
fue posible debido a la alta calidad de las asambleas de estos
genomas. Aunque la mayoría de las especies mostraron un alto grado de
vinculación, había tres valores extremos (véase la disposición 1 ), pero
incluso si todos los genes disociados fueron la contaminación, que no es
necesariamente el caso, esto tendría un impacto mínimo en los niveles
de HGT detectado.

Una hipótesis alternativa para explicar nuestros datos es que los genes
nos etiqueta como extranjera en cualquiera de las especies individuales
son en realidad el resultado de descenso vertical convencional, pero se
han perdido en todos los otros linajes de animales. El principio de
parsimonia nos dice que debemos elegir la explicación más simple, que
puede ser determinado mediante la comparación de la tasa de pérdida
de genes y la tasa de ganancia de genes por HGT. Sin embargo,
mientras que la tasa de pérdida de genes con el tiempo se puede
estimar, en este momento no podemos estimar con precisión la tasa de
HGT sobre nada menos que el tiempo transcurrido desde el ancestro
común de todos los metazoos, debido a los datos limitados. Las tasas
que en realidad debería ser comparadas son las tasas de pérdida de
genes y HGT en las primeras ramas del árbol eucariota, pero estas tasas
son especialmente difícil de determinar ya que los períodos muy largos
de tiempo involucrados significan que la determinación ortólogo
(necesaria para encontrar qué genes se han perdido / ganado) es
difícil. Por otra parte, las estimaciones de la tasa de pérdida de genes
normalmente publicada tratar todos los genes como iguales, pero la tasa
real varía entre los tipos de genes y tipos de organismos (por ejemplo,
parásitos tienen mayores tasas de pérdida [ 25 , 26 ]). Como HGT implica
la transferencia de sólo un subconjunto de genes (véase la
sección Muchos genes codifican horizontal adquiridos para actividades
enzimáticas ', más abajo), una tasa de pérdida de genes genérico no es
comparable a la tasa de HGT.

Dadas estas dificultades se intentó diferenciar entre las dos hipótesis con
un método diferente. Nos fijamos en las funciones de los genes foráneos
y los compararon con los de los genes nativos que se sabe que se han
perdido en todos los otros linajes de animales, pero no se predijeron
como extranjera (los genes para que la hipótesis alternativa es
verdadera) y encontramos diferencias significativas entre los genes
extraños que hemos identificado y genes nativos que cumplen estos
criterios (ver la sección Muchos genes codifican horizontal adquiridos
para actividades enzimáticas ', más abajo). Por lo tanto, si bien no se
puede descartar por completo la hipótesis de pérdida de genes, parece
una explicación poco probable para las decenas o cientos de genes
extraños por genoma que observamos.

Identificación de nuevos genes extraños y la confirmación de


ejemplos previamente reportados
El primer informe de la secuencia del genoma humano resaltada 223
secuencias de proteínas (de los cuales 113 fueron confirmados como
presente en el genoma por PCR) que se propusieron que se originan a
partir de bacterias por HGT [ 19]. Mientras que algunos de estos genes
fueron confirmados más tarde como extranjera, muchos fueron
rechazados [ 20 -22 de ]. En el momento de la escritura, es difícil de
evaluar todas estas secuencias debido a que algunos identificadores
primeros no se han mantenido, pero hemos sido capaces de confirmar o
reclamar 17 ejemplos de informes anteriores como extraños (algunos
también confirmado por otros estudios, el archivo adicional 4 ). Por otra
parte, hemos identificado hasta 128 genes foráneos adicionales en el
genoma humano (128 clase C, de los cuales 93 son de clase B y 33
clase A), dando un total de genes 145 de clase C, de las cuales 110 son
de clase B y 39 clase A .

Entre estos ejemplos, recuperamos los que codifican las hialuronano


sintasas (HAS1-3). Estos se propusieron originalmente como ejemplos
de procariotas a-metazoan HGT [ 19 ], pero más tarde rechazaron
[ 20 ]; Sin embargo, ninguno de los estudios consideró taxones extranjera
distinta de las bacterias. Hemos sido capaces de identificar los tres
hialuronano sintasas en la categoría A HGT, procedentes de los hongos,
una evaluación con el apoyo de nuestro análisis filogenético
(Figura 3 ). Los genes de HAS aparecen en una amplia variedad de los
cordados, pero no en los metazoos no cordados, lo que sugiere que el
resultado de la transferencia de un solo gen en la época de la ancestro
común de Chordata, antes de someterse a duplicaciones para producir
los tres genes se encuentran en primates . A medida que el papel de
réplica original [ 20 ] sólo se centra en la reciente HGT, y no buscar
coincidencias eucariotas fuera Chordata, no podían detectar esta antigua
HGT.
figura 3
Árbol filogenético para la HAS1 gen humano. Para cada rama se muestra el nombre de la
especie y UniProt. El gen humano bajo análisis se muestra en naranja, las proteínas de los
cordados están en rojo, otros metazoos en negro, hongos en las plantas de color rosa, en
verde, protistas en gris, arqueas en azul claro y bacterias en azul oscuro. Los números indican
los valores de apoyo ALRT para cada rama, si es superior a 0,75 (en las ramas terminales
cortos los valores de apoyo no se muestran).

También identificamos casos de HGT informaron recientemente que no


se han analizado en detalle a pesar de las consecuencias potencialmente
interesantes de tal hallazgo. Por ejemplo, la masa grasa y la obesidad
gen asociado (FTO, en el archivo adicional 5 : Figura S1 A) parece estar
presente sólo en las algas marinas y los vertebrados [ 27 , 28 ], que es
una distribución altamente inusual. Otro gen propuso que se ha
transferido horizontalmente es el gen del grupo sanguíneo ABO (ABO, en
el archivo adicional 5 : Figura S1 B), que se sugiere para mejorar el
mutualismo entre los vertebrados y las bacterias [ 29 ]. Se identificaron
estos dos genes en la categoría A HGT con la validación filogenético
(archivo adicional 3 ).

En los invertebrados, Dunning Hotopp et al. [ 17 ] informaron de la


transferencia horizontal de casi todo el genomaWolbachia en
el D. genoma ananassae y la expresión de 44 genes
anteriormente Wolbachia, como se evidencia mediante amplificación por
PCR de sus transcripciones en las moscas que habían sido curados
de Wolbachia y parcial re-secuenciación de
la D. Ananassae genoma. Estos genes todavía no se incluyen en el
genoma oficial de D. ananassae,probablemente debido a proyectos de
secuenciación del genoma eucariota pantalla rutinariamente para y no
incluyen secuencias bacterianas en el supuesto de que estos
representan contaminación. En consecuencia, no estaban en el conjunto
de datos a prueba en este estudio y por lo tanto no aparecen entre los
genes identificados en el extranjero D.Ananassae. Sin embargo, hemos
encontrado un gen en D. Ananassae, GF19976, que no ha sido
identificado previamente como extrañas y que pueden proceder
de Wolbachia.

Parkinson y Blaxter [ 30 ] identificaron cuatro genes horizontalmente


adquiridos en C. elegans. Se identificaron todos estos, tres como HGT
clase B y el cuarto en la categoría A (resaltado en amarillo en el archivo
adicional 3 ), pero también descubrieron otros 135 genes de la clase C,
de los cuales 113 fueron de clase B y 71 clase A (Adicional
presentar 3 ). Esta discrepancia con Parkinson y Blaxter [ 30 ] surge en
gran medida debido a que estos autores alineados C. eleganssecuencias
con un solo no metazoos (S. cerevisiae). En consecuencia, hemos
identificado tres de los cuatro genes extraños conocidos como hongos en
su origen, con el cuarto también alinear bien a las proteínas de hongos
(aunque nos encontramos con que se originó a partir de un protista). En
general, sin embargo, sólo 4% a 15% de C. elegans HGT (dependiendo
de la clase) es de origen fúngico (archivo adicional 2 ), con bastante más
(52% a 72%) se deriven de las bacterias (no evaluados en la ref.
[ 30 ]). Como se mencionó en la sección de antecedentes, hay pruebas
de que los genes filogenético cisteína sintasa igual que encontraron en
los nematodos, incluyendo C. elegans (cysl1 - 4), pueden haber sido
adquiridos a partir de plantas [ 9 ]. Nuestro análisis apoya esta conclusión
con los cuatro genes ser de clase B HGT de origen vegetal y tres están
filogenéticamente validado. HGT también se produce en un número de
otros nematodos, en particular, los nematodos de la raíz parasitarias, en
el que tantos como aproximadamente 3% de todos los genes pueden ser
adquiridos horizontalmente [ 3 , 24 ].

Muchos código genes horizontalmente adquirido para actividades


enzimáticas
En procariotas, genes horizontalmente adquiridos tienden a ser
operativo, típicamente codifican enzimas, en lugar de informativo, es
decir, los genes implicados en la transcripción y la traducción
[ 31 ]. Recientemente se ha sugerido que la conectividad de red es una
consideración más importante que la función [ 32 ], pero, no obstante,
más genes extraños identificados tienen que ver con el metabolismo. En
consonancia con esto, el 83% de los genes extraños en las codifican
enzimas de rotíferos bdelloid [ 12 ]. Para determinar si esto se aplica a
HGT lo largo de los metazoos, primero inspeccionamos ontología de
genes (GO) términos que se encontraron en niveles inesperadamente
altos entre la clase A genes extraños ( 'términos enriquecido GO'), a
continuación, determina que van términos que se indican las actividades
enzimáticas, y finalmente calculó el porcentaje de actividad de las
enzimas para ambos términos enriquecidos y un-enriquecido. En casi
todas las especies Caenorhabditis y primates, los términos de GO
enriquecido fueron significativamente más probable (prueba de ji
cuadrado: 3E-9 ≤ P ≤ 0,05; archivo adicional 2 ) para describir las
actividades enzimáticas que un mandato de la ONU enriquecido (en
promedio, 42% de los enriquecido términos se refieren a la enzima
actividades vs. 26% de los términos de las Naciones Unidas; enriquecida
de ficheros adicionales 2 ). En las especies de Drosophila, términos
insuficientes se enriquecieron para realizar el cálculo. GO términos
enriquecidos en los genes de clase B también eran más propensos a
relacionarse con la enzima actividades. El segundo grupo más grande de
códigos de genes foráneos para las proteínas unidas a la membrana,
otra categoría de genes operacionales. Por lo tanto, al igual que en
procariotas [ 22 ], HGT está sesgada hacia los genes operacionales en
los metazoos.

Una posible explicación alternativa para los genes sugeridas que el


resultado de HGT es que son en realidad el producto de descenso
vertical en las especies en cuestión, pero se han perdido en todos los
otros linajes de animales (como se discutió anteriormente en ' es poco
probable que se explicará genes extraños identificados por hipótesis
alternativas '). Esta explicación es más probable en los primates como su
HGT es predominantemente antigua (véase la sección " transferencia
horizontal de genes es a la vez antigua y permanente " más adelante), lo
que reduce el número de veces que el gen se debe perder. Para probar
esta hipótesis, la misma GO análisis se realizó en genes nativos que se
encuentran en los cordados y no en metazoos no cordados (es decir, los
genes que se han perdido en todos los metazoos no cordados, una
posible explicación alternativa para el extranjero putativa genes que
identifican). En todas las especies de primates, los términos de GO
enriquecido para estos genes (en comparación con los de todos los
demás genes nativos) fueron significativamente menos probable (prueba
de ji cuadrado: P ≤0.05; archivo adicional 2 ) para describir las
actividades enzimáticas que los términos y las Naciones Unidas
(enriquecido en promedio, un 4% frente a 20%; el archivo
adicional 2 ).Esto es lo contrario del resultado de genes foráneos, lo que
sugiere que una hipótesis alternativa de la pérdida de genes no explica
nuestros resultados.

funciones de genes extraños


Muchos genes foráneos son, al igual que muchos genes nativos,
actualmente no caracterizados, incluso en organismos modelo
intensamente estudiados; por ejemplo, el gen humano
ENSG00000136830 (extranjera) se anota 'Familia con similitud de
secuencia 129, el miembro B', pero no hay información sobre su
función. Donde genes extranjeros tienen anotación significativa, es claro
que el código para una amplia variedad de diferentes funciones a través
de una amplia gama de categorías, algunas de las cuales pueden
solaparse. Aquí se describen las seis categorías más destacadas, de
mayor a menor, a través de C. elegans, D. melanogaster y el ser humano
(archivo adicional 3 ).

En C. elegans, la mayor categoría incluye genes conectados a la


respuesta inmune innata (16 genes), incluyendo los genes que se dirigen
específicamente a las paredes celulares bacterianas (familia lys), genes
de segmentación hongos (por ejemplo, endochitinases) y otros genes
más generales del sistema inmune (por ejemplo thn-3 y penas hay-4). La
categoría de segundo más grande comprende ocho genes implicados en
el metabolismo de los lípidos, incluyendo la descomposición de ácidos
grasos de beta-oxidación (por ejemplo, la familia CoA sintetasa de ácidos
grasos, ACS-11), así la síntesis de ácidos grasos (por ejemplo, ácido
graso desaturasa, grasa-1). La tercera categoría incluye cuatro genes
implicados en la modificación de macromoléculas, que abarca
actividades tales como fosforilación, metilación y ubiquitinación. La cuarta
categoría abarca las respuestas de estrés, e incluye una proteína de
choque térmico (DNJ-16), una proteína LEA (lea-1) y dos genes
implicados en la vía de síntesis de trehalosa: trehalosa-6-fosfato
fosfatasa (GOB-1) y trehalose- fosfato sintasa (TPS-1). La producción de
trehalosa permite C. elegans dauer larvas sobreviven a la desecación
extrema [ 33 ], mientras que las proteínas LEA también están vinculados
a la tolerancia del estrés hídrico en C. elegans [ 34] y otros invertebrados,
así como plantas y microorganismos (revisado en [ 35 ]). La quinta
categoría consiste en actividades antioxidantes (un gen; glutatión
peroxidasa, GPX-2) y la sexta categoría es el metabolismo de
aminoácidos, también consta de un solo gen, que codifica la síntesis de
asparagina (ASN-2).
Hay muchos menos genes extraños en D. melanogaster, pero sí vemos
genes pertenecientes a algunas de las mismas categorías que
en C. elegans, a saber, la modificación macromolécula (dos genes), la
respuesta inmune innata (tres genes) y la respuesta al estrés (tres
genes). Los tres D. melanogaster genes de respuesta inmune todos
pertenecen a la misma familia de proteínas, que está implicado en la
fagocitosis de las bacterias, mientras que los tres genes de respuesta al
estrés están todos involucrados en la vía de la síntesis de trehalosa: dos
fosfatasas de trehalosa (FBgn0031907, FBgn0031908) y un trehalosa-
fosfato sintasa (Tps1). Mientras que este último gen tiene el mismo
nombre que una C.elegans trehalosa-fosfato sintasa (tps1 / TPS-1), la
alineación muestra que son diferentes, especialmente fuera del dominio
catalítico, lo que sugiere que no se originan en el mismo evento HGT (en
el archivo adicional 5 : Figura S2). Del mismo modo las fosfatasas de
trehalosa no se han conservado entre las especies.

En el ser humano, encontramos genes en cinco de las seis categorías:


aminoácidos metabolismo (dos genes), de modificación de la
macromolécula (15 genes), el metabolismo de los lípidos (13 genes), la
actividad antioxidante (cinco genes) y la respuesta inmune innata (siete
genes) . Los genes del metabolismo lipídico incluyen genes con
funciones similares a la C. elegans genes, tales como la descomposición
de los ácidos grasos por la beta-oxidación (por ejemplo, enoil-CoA,
hidratasa / 3-hidroxiacil CoA deshidrogenasa, EHHADH), así como una
amplia variedad de otras funciones, incluyendo la formación de
glicolípidos a través de la extensión de cadena (por ejemplo, globosido
alfa-1,3-N-acetilgalactosaminiltransferasa 1, GBGT1) transportadores y
transmembrana necesarios para homestasis de lípidos (por ejemplo,
unión a ATP casete, subfamilia G (blanco), miembro 5, ABCG5). Los
genes de la respuesta inmune innata incluyen genes implicados en la
respuesta inflamatoria (por ejemplo, immunoresponsive 1 homólogo,
IRG1), genes para la señalización de células inmunes (por ejemplo, 3-
quinasa fosfatidilinositol-4,5-bifosfato, gamma subunidad catalítica,
PIK3CG) y genes antimicrobianos (por ejemplo, inhibidores de la
peptidasa del epidídimo, EPPIN).

No encontramos ninguna de los mismos genes extraños en común a


través de las tres especies, porque nuestro método se opone a esto:
tales genes habrían estado presentes en un ancestro común y sería
cribado como metazoos. Sin embargo, sí encontramos funciones
compartidas, como la ruta de síntesis de trehalosa en los
invertebrados. Pocos genes se encuentran en vías compartidos. Esto
puede indicar que las transferencias ocurran un gen a la vez, con cada
gen que se integra por separado en las redes metabólicas del
organismo. En términos generales no vemos diferencias entre las
especies en las funciones codificadas por los genes extranjeros, excepto
en la categoría de respuesta inmune: la mayoría de los genes de
invertebrados codifican enzimas que descomponen las paredes de las
células bacterianas y fúngicas, lo que parece conferir una adaptación
clara ventaja, mientras que los genes humanos tienen más
probabilidades de código para la señalización y regulación de la
respuesta inmune y tienen ventajas menos evidentes para el
organismo. Esto probablemente refleja las diferencias de edad entre los
vertebrados e invertebrados HGT (véase la sección " transferencia
horizontal de genes es a la vez antigua y permanente ", más abajo), con
los genes extraños, más recientemente adquiridos en los invertebrados
que tienen un papel más claro que los antiguos genes extraños en los
vertebrados, que han tenido más tiempo para integrarse en redes.

Los genes extraños predominantemente se originan a partir de


bacterias y protistas
Al calcular h, la probabilidad taxón de origen de un gen extraño se toma
como el taxón de la proteína de mejor coincidencia. Las bacterias y
protistas son los donantes más comunes en todos los grupos (Figura 4 ),
lo que podría reflejar la abundancia relativa de la especie de los donantes
en los entornos de los organismos receptores. La validación filogenético
de los genes extraños se indica de vez en cuando un origen diferente
que el cálculo original (basado en alineaciones y el índice h), pero ambos
métodos de acuerdo en promedio 92% de las veces; realizar el análisis
se muestra en la Figura 4 utilizando orígenes filogenéticamente
predichos en lugar muestra el mismo patrón de los donantes (datos no
mostrados). La identidad de la especie donante real es mucho más difícil
de determinar, ya que el "donante" identificado es casi seguro que sólo
las especies más estrechamente relacionadas actualmente
secuenciados. Este es especialmente el caso de mayores eventos HGT
donde el mismo gen extraño aparece en más de una especie, es decir,
donde la transferencia horizontal es anterior a la divergencia de las
especies. Sin embargo, encontramos una serie de transferencias
recientes (presente sólo en una sola especie estudiados) que fueron
identificados como originarios específicamente deWolbachia, con un
ejemplo en cada D. Ananassae, C. briggsae y C. japonica (GF19976,
CBG07424 y Cjp-UBC-6, respectivamente).

Figura 4
La media de origen de clase C genes foráneos para cada taxón. Los números muestran
contribución porcentual dentro de cada taxón (fila). El mismo análisis para los de clase B o A
genes muestran patrones muy similares. El esquema de color es como en la figura 3 : el
origen de las arqueas es de color azul claro, a partir de bacterias es de color azul oscuro, de
protistas es gris, a partir de plantas es de color verde y de hongos es de color rosa.

Nuestro método también identificó putativo HGT de virus: aunque es raro,


tanto en Drosophila y Caenorhabditis, hasta 50 más genes extraños de
origen viral por especie fueron identificados en los primates ( 'Clase V':
archivos adicionales 2 y 3 ).La mayoría de estos genes sólo se alinean
con las secuencias virales y de metazoos, haciendo que la dirección de
la transferencia no está claro, y por lo tanto los excluyó del resto de
nuestro análisis.

Los genes foráneos son más propensos a contener intrones como


genes nativos
Los muchos genes extraños que se originan a partir de bacterias
originalmente habrían carecido de intrones, pero pueden ellos han
ganado mientras que cada vez adaptado a la especie receptora
(domesticación). Para probar esto se analizó si los genes extranjeros de
origen bacteriano tienen intrones. Las especies
de Drosophila generalmente tienen muy pocos genes extraños para
llevar a cabo el análisis, pero en tres especies Caenorhabditis (todos
excepto C. japonica) y todos los primates el porcentaje de genes
extraños bacteriana de origen con intrones es de alrededor de 95%. Para
las tres clases de gen extraño (C, B y A), no hubo diferencia significativa
entre la proporción de genes extraños bacteriana de origen con intrones
y la proporción de genes nativos con intrones (según lo medido por una
prueba de chi-cuadrado; adicional presentar 2 ). Lo mismo puede decirse
de genes extraños en su conjunto (todos los orígenes, de ficheros
adicionales 2).Esta observación también hace que sea poco probable
que la HGT detectado es en realidad la contaminación del genoma con
secuencias bacterianas, ya que carecerían de intrones. La
excepción, C. japonica , tiene muchos menos genes extraños de origen
bacteriano con intrones que los genes nativos en las tres clases ( P <8E-
6), con un promedio de sólo el 29% de los genes extraños de origen
bacteriano con intrones. También cuenta con un número
significativamente menor de clase A con genes extraños intrones que los
genes nativos con intrones ( P <0,001), como se explica más adelante.

transferencia horizontal de genes es a la vez antigua y permanente


Para determinar si el HGT detectado es antiguo (antes de la divergencia
del taxón estudiado), o se ha producido a lo largo de la evolución de un
determinado taxón, estudiamos los grupos ortholog extranjeros (en
representación de la fundación de eventos HGT) para cada taxón en los
árboles filogenéticos correspondientes . En Drosophila especies, hay una
amplia correspondencia entre la longitud de la rama (tiempo) y el número
de eventos HGT lo largo de cada rama, lo que sugiere que HGT ha
ocurrido a través de Drosophila evolución y es probable que sea continua
(Figura 1 ).

Lo mismo se puede deducir de


los Caenorhabditis especies. Curiosamente, un número mucho mayor de
eventos HGT se han producido en C. japonica que en la otra
estudiado Caenorhabditis especies o sus ancestros comunes, y sus
genes foráneos también tienen diferentes propiedades: es la única
especie estudiados en un número significativamente menor de múltiples
genes exón se encuentran entre los genes extraños de origen procariota
que entre los genes nativos (archivo adicional 2 ). Genes procariotas
transferidos presumiblemente requieren algún tiempo para adquirir
intrones, y la menor proporción de genes extraños que contienen intrones
es consistente con comparativamente recientes acontecimientos
HGT. Una explicación alternativa es que la C. japonica genoma está
contaminada, ya que alrededor de dos veces ya que muchos de sus
genes foráneos son disociados de genes nativos como en otras especies
(archivo adicional 2 ). Sin embargo, incluso si todos los genes disociados
son considerados como la contaminación y se descuentan, todavía
habría más eventos HGT únicas para C. japonica de única para la otra
estudió Caenorhabditis especies.

La distribución de los eventos de transferencia es diferente en los


primates, con la mayoría de los grupos extranjeros de mapeo a la base
del árbol (un ancestro común de los primates), lo que sugiere que la
mayoría de HGT en primates es antigua. En estos casos no estamos
infiriendo que el evento HGT ocurrió en el ancestro común más reciente
de todos los primates, sino que se produjo en algún momento entre el
ancestro común de los cordados y el ancestro común de los primates, es
decir, antes del período de tiempo que se muestran en la Figura 1 . Por
ejemplo, en el caso de HAS1 (Figura 3 ), que se encuentra en una amplia
variedad de los cordados, el evento HGT probablemente ocurrió poco
después de la ancestro común de Chordata surgió.

Los genes extraños se someten a la duplicación y se distribuyen por


todo el genoma
Genes horizontalmente adquiridos pueden someterse a la duplicación y
la diversificación: por ejemplo, los tres hialuronano sintasas en el Homo
sapiens pertenecen al mismo grupo ortólogo y probablemente el
resultado de un solo evento de transferencia, seguido de
duplicaciones. Se observó el mismo escenario de otros genes
en H. sapiens (por ejemplo, los cuatro deiminases peptidil arginina y los
nueve miembros de la familia; PRAME archivo adicional 3 ), y también en
otras especies. En un caso extremo (las juntas aciltransferasas
pertenecientes al mismo grupo ortholog en C. elegans , archivo
adicional 3 ) tantos como 30 genes probablemente son producto de un
solo evento HGT.

Preguntar si existen someterse a HGT más frecuentes "puntos calientes"


en los genomas estudiados, que trazan las ubicaciones de genes
extraños en los cromosomas o andamios de los genomas respectivos
(archivo adicional 5 : Figura S3).No se encontraron pruebas de "puntos
calientes", pero el número limitado de eventos HGT por especie y la
frecuente ocurrencia de reordenaciones cromosómicas durante la
evolución, que complican las comparaciones entre especies, hacen que
sea difícil llegar a conclusiones fiables.

HGT es una característica general de los genomas cordados


Debido a que existe información limitada sobre HGT en los cordados,
también identificó genes extraños para otras 14 especies de vertebrados
(archivo adicional 2 ). Encontramos 60 a 240 genes de clase C
(aproximadamente el 0,4% al 1,3%) a través de todas estas especies, en
línea con nuestros hallazgos para Drosophila , Caenorhabditis y
primates, lo que sugiere que HGT no se limita a unos pocos grupos de
animales. No probamos para identificar los genes de clase A y B, como
nuestro método no produce ortholog grupos fiables para las especies
separadas por grandes distancias evolutivas.

Discusión
HGT se produce a bajas, pero apreciables, los niveles en todas las
especies animales que examinamos; que ha ocurrido con el tiempo y se
sigue produciendo; se origina principalmente de bacterias y protistas; y
los genes afectados con frecuencia de código para las actividades
enzimáticas. Curiosamente, los niveles generales de HGT no parecen ser
visiblemente diferentes en vertebrados e invertebrados. Esto es
sorprendente, dada la diferencia de complejidad entre los grupos, pero
puede explicarse por la HGT mayores observada en primates, lo que
sugiere que la HGT de vertebrados puede haber ocurrido en una fase
anterior de la evolución de los vertebrados. Todos los genomas de
animales que examinamos contienen genes extraños expresados y las
circunstancias lo tanto inusuales, como un estilo de vida y la desecación
asexual tolerancia, no son necesarios para la transferencia, aunque tales
características podrían acelerar las tasas de HGT, como en el rotíferos
bdelloidea.

Hemos sido capaces de mejorar en los estudios anteriores de HGT en


organismos modelo [ 19 , 30 ], por dos razones principales. El primero es
el número mucho mayor de especies, incluyendo muchos más metazoos,
ahora representados en las bases de datos de secuencia utilizados para
la comparación. Esto reduce la tasa de falso descubrimiento, al aumentar
el número de especies en las que un gen se debe perder antes de que se
llama incorrectamente HGT en las especies en las que se encuentra. En
el documento genoma humano original [ 19 fueron utilizados] sólo dos
metazoos, D.melanogaster y C. elegans , al tiempo que utiliza cientos de
especies. También se examinó la transferencia de los taxones múltiples,
en lugar de sólo las bacterias [ 19 ] o los hongos [ 30 ], lo que reduce la
tasa de falsos negativos: una de las réplicas del documento original
humana [ 20 ] correctamente rechazados hialuronano sintasas como
procariotas a los vertebrados transferir, pero no logró identificarlo como la
transferencia-hongo-a vertebrados porque las secuencias de hongos no
se consideraron como posibles donantes.

La segunda mejora importante es el uso de múltiples especies animales


estrechamente relacionados cuando las pruebas de HGT, lo que permite
la construcción de grupos ortholog. Esto reduce la tasa de falso
descubrimiento mediante el control de las alineaciones espurios que
pudieran identificar incorrectamente un gen como extranjera en la
minoría de especies en un grupo. En particular, esto aumenta nuestra
precisión en la búsqueda de HGT mayor, que es probable que se
encuentre en más de una especie.

La manifestación más clara de HGT dependería de identificación fiable


de la especie donante, pero la fuente de un gen extraño sólo puede ser
rastreado hasta el organismo existente más próxima con un genoma
secuenciado. La identificación de la especie donante para nada pero el
más reciente HGT se complica aún más por la evolución de la secuencia
de ambos receptor y el donante; como consecuencia, la certeza absoluta
en la asignación de más HGT es inalcanzable. Para dar cabida a este
problema, se ha definido un conjunto de clases HGT que muestran
niveles diferentes de validación filogenético. Mientras que la clase A HGT
tiene el más alto grado de validación (88%), los niveles de la clase C
HGT son más directamente comparables con los de estudios recientes -
porque en la mayoría de los casos de cerca especies relacionadas no
están disponibles, por lo que los grupos ortholog no se pueden construir -
sin embargo, incluso esta clase, como mínimo estrictamente
seleccionado de los genes se valida del 55% (que asciende a un niño de
ocho a 58 genes adicionales validados por especie en la parte superior
de los de la clase a).

Aunque la validación filogenético es visto como el "patrón oro" para el


descubrimiento de HGT, es importante tener en cuenta que muchos de
clase A genes extraños (68%) no tienen alineaciones metazoos (bitscore
<50) por lo que no tiene por qué ser, de hecho, no puede ser, validado
como HGT de esta manera. En estos casos, la falta de coincidencias con
genes de metazoos, junto con partidos claras a secuencias no metazoos,
es suficiente para demostrar HGT, mientras que la filogenética se pueden
utilizar para sugerir el origen de dichas secuencias. Otro problema con la
validación filogenético surge cuando se utiliza de una manera
automatizada: para el más alto grado de exactitud, árboles sólo debe
contener ortólogos, pero la determinación de ortólogos muy grandes
conjuntos de secuencias requiere anotación manual. Los árboles
filogenéticos para la validación HGT también son sensibles a la
contaminación, lo que está muy extendida en los genomas depositados
en UniProt (véase la disposición 1 ). Nos encontramos alrededor del 13%
de nuestros árboles no validados se valida si una sola proteína
metazoos, la agrupación dentro de otro taxón sin otras proteínas de
metazoos, eran en realidad no es contaminación metazoos, aumentando
el nivel de HGT validado de forma proporcional. Como muchas de estas
secuencias son probablemente la contaminación es evidente que sin las
bases de datos de muy alta calidad enfoques filogenéticos pierden
fiabilidad.

Aunque la mayoría de los estudios de HGT miran especies aisladas, el


uso de múltiples especies estrechamente relacionadas para definir
grupos ortholog, y por lo tanto la clase B HGT, reduce el problema de la
contaminación potencial preguntando a ese candidato secuencias
foráneas están presentes en todo el taxón. Sólo vemos un aumento
modesto en la validación filogenética entre la clase C (donde no se
utilizaron los datos ortholog) y HGT clase B (55% a 65%), pero esto se
basa en el uso de los genomas de alta calidad y es de esperar un mayor
incremento al utilizar los genomas de menor calidad.

Nuestro análisis probablemente subestima la verdadera magnitud de


HGT en los animales por varias razones. En primer lugar, establecemos
un umbral conservador para el índice HGT, es decir, h ≥ 30, para
minimizar la tasa de falsos positivos, pero probablemente hay genes por
debajo de este umbral que también se adquieren en sentido
horizontal. En segundo lugar, aunque difícil de detectar con los datos
disponibles, los metazoos-a-metazoos HGT sigue siendo plausible y es
conocido por algunas relaciones huésped-parásito [ 36 ]. Algunas de
estas transferencias puede ser mediada por virus, y en nuestro estudio
se excluyeron específicamente potencial HGT mediada por virus debido
a la ambigüedad en la dirección de transferencia. En tercer lugar, los
proyectos del genoma eucariótico quitan rutinariamente secuencias
bacterianas de sus montajes en el supuesto de que son la
contaminación; por ejemplo, esto ha dado lugar a la eliminación de todo
informó anteriormente HGT de la D. Ananassae genoma. Como
resultado, es posible que hayamos perdido más ejemplos de HGT de
bacterias en nuestro estudio, y tal selección puede explicar los niveles
más bajos de HGT visto en lasDrosophila especies. Mientras que
algunos de detección de contaminación es claramente necesario, el
potencial de secuencias aparentemente bacterianas que proceden de
HGT no debe ser ignorada durante el montaje del genoma; esta
observación pone de relieve la importancia del uso de asambleas del
genoma de alta calidad, como lo hicimos aquí, en la búsqueda de HGT.

Es importante tener en cuenta la probabilidad de otras explicaciones para


nuestros resultados. La más evidente es la posibilidad de que los genes
extraños observados fueron heredados por descenso vertical, pero se
han perdido de todas las otras especies de metazoos observados fuera
del phylum de interés.El aumento del número de especies de metazoos
genomas con alta calidad y transcriptomes En el futuro, la luz ayuda
cobertizo sobre esta posibilidad. Mientras tanto, se observó una
diferencia notable entre todas las clases de HGT y los genes nativos que
se encuentran en los cordados, pero no en otros metazoos. De este
modo, los genes que están aparentemente ausentes en otros animales
que los cordados son significativamente menos propensos a tener GO
términos de actividad de las enzimas que otros genes nativos (4% vs.
20%), mientras que en contraste a los candidatos HGT son
significativamente más propensos a tener los términos de GO para las
actividades de enzimas (42% vs. 26%). Aunque no podemos descartar
por completo la pérdida de genes como una explicación de nuestras
observaciones, estos hallazgos, junto con las otras líneas de evidencia
presentados, sugieren que HGT es la explicación más probable.

conclusiones
Aunque las tasas observadas de adquisición de los genes transferidos
horizontalmente en eucariotas son generalmente más bajos que en los
procariotas, parece que, lejos de ser una ocurrencia rara, HGT ha
contribuido a la evolución de muchos, tal vez todos, los animales y que el
proceso está en curso en la mayoría linajes. Entre decenas y cientos de
genes extraños se expresan en todos los animales que encuestamos,
incluidos los seres humanos. La mayoría de estos genes tienen que ver
con el metabolismo, lo que sugiere que HGT contribuye a la
diversificación bioquímica durante la evolución animal.

materiales y métodos
Fuentes de datos
Genomas, proteomas y transcriptomes, gffs de Drosophila especies se
obtuvieron de FlyBase [ 37 , 38 ]. Anotación adicional se obtuvo de
FlyMine [ 39 , 40 ]. Todos los datos en Caenorhabditis especies se
obtuvieron de WormBase [ 41 , 42], mientras que los datos sobre las
especies de primates y cordados se obtuvieron de Ensembl [ 43 , 44 ],
con la excepción de los grupos ortholog que se obtuvieron de OrthoMCL
[ 45 , 46 ]. Versiones del genoma utilizados se muestran en el archivo
adicional 2 .

Determinación del índice de HGT, h


El flujo de trabajo para este paso se muestra en archivo adicional 5 :
Figura S4. Para cada especie estudiada, todas las transcripciones fueron
alineados con BLASTX [ 47 ] a dos bases de datos de proteínas
derivadas de proteomas completos en UniProt, uno que consiste en
proteínas de metazoos (con exclusión de las proteínas de las especies
en el mismo phylum como las especies estudiadas - Arthropoda,
Nematoda o Chordata) , el otro de proteínas no metazoos. El índice
HGT, h , se calculó restando el bitscore del mejor partido de los
metazoos de la de la mejor partido del no-metazoos [ 12 ]. La mayoría de
las transcripciones en todas las especies tienen h <0, lo que indica que
coincidan mejor metazoos proteínas, como sería de esperar a partir de la
transferencia de genes vertical a través del árbol de la vida, en el que
han tenido más tiempo para divergir de proteínas no metazoos que de los
metazoos . Por lo tanto, las transcripciones con h > 0, que son menos
divergen de proteínas no metazoos que metazoos, deberían haber sido
adquiridos por transferencia horizontal de los no metazoos. En lugar de
simplemente tomar todas las transcripciones con h > 0, es necesario que
se alinean mucho mejor a las proteínas de metazoos no a las proteínas
de metazoos y definen candidato (clase C) genes HGT como aquellos
con h≥30 que también tienen un mejor no metazoos bitscore ≥100. El
umbral del 30 fue elegido porque detallado análisis en nuestro estudio
anterior [ 12 ] encontró este umbral para ser el mejor compromiso entre
sensibilidad y especificidad.Como bitscore es una medida logarítmica de
similitud de secuencia, 30 es una gran diferencia en la calidad de
alineación.Para cada gen, h fue heredado de la transcripción con el
partido con la más alta bitscore.

Para la Drosophila , Caenorhabditis y especies de primates estudiados,


todas las proteínas en cada grupo se alinean entre sí con BLASTP,
utilizando un punto de corte de 1E-5. Ortholog grupos se determinaron a
partir de esta alineación usando MCL con I = 15 [ 48 ]. Este valor se
determinó mediante la comparación de los grupos ortholog a los grupos
preexistentes (más detalles en el archivo adicional 1 ).

Para cada gen de clase C, la media h valor de los miembros de su grupo


ortólogo se determinó ( h Orth ); si esto era ≥30 el gen se considera que es
un gen de clase B. Los genes de clase A se define como un subconjunto
de los genes de clase B sin metazoos coincide con bitscore ≥100 y
ningún miembro de su grupo respectivo ortólogo con metazoos coincide
con bitscore ≥100. El número de cada clase para cada especie se indican
en el archivo adicional 2 .

validación filogenético
Nos filogenéticamente validado todos los genes extranjeros que tengan
algún metazoos coincide con bitscore ≥50 utilizando un método basado
en el utilizado anteriormente, la producción de árboles sin raíces
[ 12 ]. Se utilizó una validación estricta, lo que requiere que los árboles no
mostraron evidencia de que el gen extraño era metazoos. Se
consideraron los árboles validado si el gen extraño era monofilético, ya
sea con un solo taxón donante o con múltiples posibilidades taxones
donante y no era monofilético con el metazoos. En los casos en que los
genes extraños se monofilético con ambos los metazoos y el donante (s)
el árbol no fue validado. No se exigió el taxón "propia-phylum
'(Arthropoda, Chordata, Nematoda) para ser monofilético, como en los
casos de reciente HGT los mejores partidos de este taxón no son
ortólogos al gen extraño. Para más detalles, véase el archivo adicional 1 .

Todos los árboles filogenéticos que contiene metazoos coincide con


bitscore ≥50 están disponibles en [ 49 ].

validación Manual
Los 145 genes humanos clasificados como HGT también fueron
sometidos a validación manual. La transcripción con la mejor bitscore
BLASTX a partir del análisis anterior era-BLASTX compara con la base
de datos de secuencias de proteínas no redundante (nr), con exclusión
de los cordados (Identificación del taxón: 7711), vertebrados (taxón id:
7742) o Metazoa (Identificación del taxón: 33208 ), a su vez, el uso de la
página web NCBI [ 50 , 51 ]. Los resultados fueron inspeccionados
manualmente y las alineaciones comprueba la fiabilidad. Los mismos 145
transcripciones también se analizaron de acuerdo con los protocolos
publicados [ 12 ]; En resumen, se compararon las secuencias (usando
NCBI-BLAST-2.2.27 +) [ 47] en contra de los proteomas completos de
UniProt. La comparación se realiza con bases de datos en el Reino
específicos que contienen exclusivamente Metazoa (taxón id: 33208),
Eubacteria (taxón id: 2), Archaea (taxón id: 2157), hongos (taxón id:
4751), plantas (Identificación del taxón: 3193) y protistas (eucariotas sin
Metazoa, hongos y plantas) secuencias.Bitscores se registraron para el
mejor éxito en cada taxón y h calculado según se describe. Los
resultados se analizaron manualmente para comprobar si hay acuerdo
con el análisis utilizando la base de datos nr y el análisis automatizado.

pruebas de vinculación genoma


Para cada gen extraño, identificamos a los que contig / andamio se
asigna y se determinó si los genes nativos (para los queh <30) también
se encontraron en esa contig. Si es así se consideró el gen transferido
horizontalmente para ser ligado a un gen nativo. Los resultados se
muestran en el archivo adicional 2 . La discusión de las especies con
más bajos que los niveles medios de vinculación está contenida en el
archivo adicional 1 .

Caracterización funcional de genes


Para determinar si los genes transferidos horizontalmente codifican
enzimas, examinamos GO anotación [ 52 ]. Un cálculo más directa
usando números de la CE no es posible debido a la falta de anotación de
la CE en la mayoría de las especies estudiadas. GO términos utilizados
en las especies ensayadas fueron anotados manualmente para indicar si
se hace referencia a una actividad enzimática. Se realizó una prueba
hipergeométrica para calcular por especies que van términos fueron
enriquecidos en cada clase de gen extraño (umbral
de P ≤0.05). Benjamini-Hochberg múltiples pruebas de corrección se
realizó para reducir la tasa de falsos positivos. A continuación, calcula si
las enzimas fueron significativamente más representadas en el
enriquecida en comparación con los términos no-enriquecido utilizando
una prueba de chi-cuadrado (umbral de P ≤0.05). Los resultados se
muestran en el archivo adicional 2 .
La identificación de genes no HGT que se encuentran en los
cordados y no en metazoos no cordados
Las especies de metazoos utilizados en el análisis (tanto el 40 estudiaron
y aquellos con proteomas completos en la base de datos UniProt) se
colocaron en un filogenético, árbol binario basado en la taxonomía NCBI
(archivo adicional 5 : Figura S5). Este árbol tiene seis branchpoints entre
el origen de los metazoos y los filos en el que las especies estudiadas se
encuentran (Arthropoda, Nematoda, Chordata), lo que significa que se
requeriría un mínimo de seis pérdidas de genes (uno en cada una de
estas branchpoints) para una HGT evento que se produzca en la base de
los filos que parece ser HGT, cuando en realidad se trataba de un
resultado de la pérdida de genes. También hay que señalar que ya que
no todas HGTS identificadas se producen en la base de los filos, como
se muestra en la Figura 1 , el número de pérdidas de genes requeridos
es mayor para gran parte de la HGT.

Para cada especie de primates estudiados se identificaron todos los no-


HGT (es decir, nativos) los genes que se han perdido por lo menos en
estos seis branchpoints utilizando un BLAST alineación de la base de
datos de los metazoos de UniProt. Para cada branchpoint donde una
pérdida debe ocurrir hay un número variable de especies; si no hay
coincidencias con bitscore ≥100 a cualquier proteína en estas especies a
continuación, una pérdida de genes se considera que se ha producido en
el grupo correspondiente. Estos genes no HGT fueron luego analizadas
con base en sus términos GO, como se hizo anteriormente para los
genes HGT (arriba), con la comparación que se hace con los genes no
HGT que no tienen este patrón de pérdida.

Los intrones
Para determinar si los intrones están presentes en las tasas
significativamente diferentes en los genes nativos vs. extranjera, se
comparó el número de genes nativos con intrones en el número de genes
de cada clase de HGT con intrones utilizando una prueba de chi-
cuadrado (umbral de p ≤0.05 ). Los resultados se muestran en el archivo
adicional 2 .

Validación y discusión de los métodos está contenida en el archivo


adicional 1 .

Descripción de los archivos de datos adicionales


Están disponibles con la versión online de este documento los siguientes
datos adicionales. Archivo adicional 1 contiene la validación y discusión
de los métodos utilizados en este trabajo, así como las leyendas de los
otros archivos adicionales.Archivo adicional 2 es una tabla de niveles
HGT y análisis para todas las especies. Archivo adicional 3 es una tabla
de los genes adquiridos en forma
horizontal H. sapiens , D. melanogaster y C. elegans , que aparece por
clase. Archivo adicional 4es una tabla de H. sapiens genes previamente
identificados como horizontalmente transferidos. Archivo
adicional 5contiene las figuras complementarias - Figura S1 muestra los
árboles filogenéticos de los genes humanos se discuten en la sección
" Identificación de nuevos genes extraños y confirmación de ejemplos se
informó anteriormente ". Figura S2 muestra el alineamiento de
aminoácidos entre la C. elegans genes de trehalosa-fosfato sintasa TPS-
1 y la D. melanogastertrehalosa-fosfato sintasa gen Tps1. Figura S3
muestra la posición de genes extraños en
el D. melanogaster y C. eleganscromosomas. Figura S4 muestra el flujo
de trabajo utilizado para identificar HGT. Figura S5 muestra el árbol
filogenético simplificado de especies utilizadas en el análisis. Figura S6
muestra los árboles filogenéticos de los seis genes humanos marcados
originalmente como horizontalmente adquirido, y posteriormente
rechazada, que son recuperados.

declaraciones
Expresiones de gratitud
Este trabajo fue apoyado por el Consejo Europeo de Investigación
(AdG233232). Agradecemos a Tim Barraclough útil para los comentarios
sobre el manuscrito.

Archivos adicionales

Archivo adicional 1: Validación y discusión de los métodos.

La disposición 2: niveles HGT y análisis para todas las especies.

La disposición 3: genes horizontalmente adquiridos en H. sapiens, D.


melanogaster y C. elegans, que aparece por clase y clases
funcionales.

La disposición 4: H. genes sapiens previamente identificadas como


horizontalmente transferidos.

La disposición 5: figuras complementarias.

Conflicto de intereses

Los autores declaran que no tienen intereses en competencia.

Contribuciones de los autores

CA, CB, AT y GM concibe el estudio y escribió el documento. CA y MP


escribió el código para el análisis de datos. CA y CB analizaron los
datos.Todos los autores leyeron y aprobaron el manuscrito final.

referencias
1. Polz MF, Alm EJ, Hanage WP. transferencia horizontal de genes y la evolución de la
estructura de la población de bacterias y arqueas.Trends Genet. 2013; 29: 170-5.Ver
artículo PubMed Central PubMed

2. Dagan T, Artzy-Randrup Y, Martin W. redes modulares y el impacto acumulativo de


transferencia lateral en la evolución del genoma procariota. Proc Natl Acad Sci EE.UU.. 2008;
105: 10039-44.Ver artículo PubMed Central PubMed
3. Scholl EH, Thorne JL, McCarter JP, Ave DM. Horizontalmente genes en nematodos parásitos
de plantas transferido: un enfoque genómico de alto rendimiento. Biol genoma. 2003; 4:
R39.Ver artículo PubMed Central PubMed

4. Keeling PJ, Palmer JD. transferencia horizontal de genes en eucariotas evolución. Nat Rev
Genet. 2008; 9: 605-18.Ver artículo en PubMed

5. Dunning Hotopp JC. transferencia horizontal de genes entre bacterias y animales. Trends
Genet. 2011; 27: 157-63.Ver artículo PubMed Central PubMed

6. Implicaciones Syvanen M. evolutivas de la transferencia horizontal de genes. Annu Rev


Genet. 2012; 46: 341-58.Ver artículo en PubMed

7. Boto L. transferencia horizontal de genes en la adquisición de nuevos rasgos por los


metazoos. Proc Roy Soc B, Biol Sci. 2014; 281: 20132450.

8. Moran NA, transferencia de Jarvik T. lateral de genes de hongos subyace en la producción de


carotenoides en los áfidos. Ciencia. 2010; 328: 624-7.Ver artículo en PubMed

9. Wybouw N, Dermauw W, Tirry L, Stevens C, Grbić M, Feyereisen R, et al. Un gen transferido


horizontalmente a partir de bacterias protege artrópodos de envenenamiento por cianuro
planta huésped. eLife. 2014; 3: e02365.Ver artículo PubMed Central PubMed

10. R Acuña, Padilla BE, Flórez-CP Ramos, Rubio JD, Herrera JC, Benavides P, et al. La
transferencia horizontal de adaptación de un gen bacteriano para una plaga de insectos
invasivos de café. Proc Natl Acad Sci EE.UU. A. 2012; 109:. 4197-202Ver artículo PubMed
Central PubMed

11. Boschetti C, Pouchkina-Stantcheva N, P Hoffmann, Tunnacliffe A. Exteriores genes y nuevos


genes de proteínas hidrofílicas participan en la respuesta a la desecación de la bdelloidea
rotíferos ricciae Adineta . J Exp Biol. 2011; 214: 59-68.Ver artículo en PubMed

12. Boschetti C, Carr A, quebradizo A, Eyres I, Wang-Koh Y, Lubzens E, et al. La diversificación


bioquímica a través de la expresión del gen extraño en rotíferos bdelloid. PLoS Genet. 2012;
8: e1003035.Ver artículo PubMed Central PubMed
13. Flot JF, Hespeels B, Li X, Noel B, Arkhipova I, Danchin EG, et al. Pruebas para la evolución
genómica ameiotic en el bdelloidea rotíferosvaga Adineta . Naturaleza. 2013; 500: 453-7.Ver
artículo en PubMed

14. Mattimore V, Battista JR. Radioresistance de Deinococcus radiodurans : funciones necesarias


para sobrevivir a la radiación ionizante, también son necesarios para sobrevivir a la
desecación prolongada. Diario de Bacteriología. 1996; 178: 633-7.PubMed Central PubMed

15. Neumann S, Reuner A, Brümmer M, Schill RO. Daño en el ADN en las células de
almacenamiento de tardígrados anhydrobiotic. Comp Physiol Biochem Mol Un Integr
Physiol. 2009; 153: 425-9.Ver artículo en PubMed

16. Crowe JH, Hoekstra FA, Crowe LM. Anhidrobiosis. Annu Rev Physiol. 1992; 54: 579-99.Ver
artículo en PubMed

17. Dunning Hotopp JC, Clark ME, Oliveira DC, Foster JM, Fischer P, Muñoz Torres MC, et
al. Generalizada transferencia lateral de genes de las bacterias intracelulares para eucariotas
multicelulares. Ciencia. 2007; 317: 1753-6.Ver artículo en PubMed

18. Kondo N, N Nikoh, Ijichi N, M Shimada, fragmento Fukatsu T. genoma de la


Wolbachia endosymbiont transferido al cromosoma X del insecto huésped. Proc Natl Acad Sci
EE.UU.. 2002; 99: 14280-5.Ver artículo PubMed Central PubMed

19. Lander ES, Linton LM, Birren B, C Nusbaum, Zody MC, Baldwin J, et al. secuenciación inicial y
el análisis del genoma humano.Naturaleza. 2001; 409: 860-921.Ver artículo en PubMed

20. Salzberg SL, Blanco O, Peterson J, Eisen JA. genes microbianos en el genoma humano: la
transferencia lateral de genes o pérdida?Ciencia. 2001; 292: 1903-6.Ver artículo en PubMed

21. Stanhope MJ, Lupas A, Italia MJ, Koretke KK, Volker C, Brown JR. Los análisis filogenéticos
no soportan transferencia horizontal de genes de las bacterias a los
vertebrados. Naturaleza. 2001; 411: 940-4.Ver artículo en PubMed

22. Genereux DP, Logsdon JM. Mucho ruido y pocas bacterias-a-vertebrados transferencia lateral
de genes. Trends Genet. 2003; 19: 191-5.Ver artículo en PubMed

23. Chapman JA, Kirkness EF, Simakov O, Hampson SE, Mitros T, Weinmaier T, et al. El genoma
dinámica de Hydra . Naturaleza. 2010; 2010: 592-6.Ver artículo
24. Paganini J, Campan-Fournier A, Da Rocha M, Gouret P, P Pontarotti, Wajnberg E, et
al. Contribución de la transferencia lateral de genes a la composición del genoma y la
capacidad parásita de nematodos de la raíz. Más uno. 2012; 7: e50875.Ver artículo PubMed
Central PubMed

25. Ochman H, Moran NA. Genes perdidos y los genes encontrados: evolución de la patogénesis
bacteriana y la simbiosis. Ciencia. 2001; 292: 1096-9.Ver artículo en PubMed

26. Mitreva M, Jasmer DP, DS Zarlenga, Wang Z, Abubucker S, Martin J, et al. El borrador del
genoma del nematodo parásito Trichinella spiralis . Nat Genet. 2011; 43: 228-35.Ver
artículo PubMed Central PubMed

27. Fredriksson R, Hägglund M, Olszewski PK, Stephansson O, Jacobsson JA, Olszewska AM, et
al. El gen de la obesidad, FTO, es de origen antiguo, hasta reguladas durante la privación de
alimentos y se expresa en las neuronas de los núcleos relacionadas con la alimentación del
cerebro. Endocrinol. 2008; 149: 2062-71.Ver artículo

28. Robbens S, P Rouzé, Gallo JM, Primavera J, Worden AZ, Van de Peer gen Y. La FTO,
implicado en la obesidad humana, sólo se encuentra en los vertebrados y algas marinas. J Mol
Evol. 2008; 66: 80-4.Ver artículo en PubMed

29. Brew K, P Tumbale, Acharya KR. Familia 6 glicosiltransferasas en los vertebrados y las
bacterias: la inactivación y la transferencia horizontal de genes pueden aumentar el
mutualismo entre los vertebrados y las bacterias. J Biol Chem. 2010; 285: 37121-7.Ver
artículo PubMed Central PubMed

30. Parkinson J, M. Blaxter SIMITRI - visualizar relaciones de similitud para grupos de


secuencias. Bioinformática. 2003; 19: 390-539.Ver artículo en PubMed

31. Jain R, Rivera MC, Lago JA. transferencia horizontal de genes entre los genomas: la hipótesis
de la complejidad. Proc Natl Acad Sci EE.UU.. 1999; 96: 3801-6.Ver artículo PubMed
Central PubMed

32. Cohen S, T Gophna, Pupko T. La hipótesis de la complejidad revisited: conectividad en lugar


de la función constituye un obstáculo para la transferencia horizontal de genes. Mol Biol
Evol. 2011; 28: 1481-9.Ver artículo en PubMed
33. Erkut C, Penkov S, Khesbak H, Vorkel D, Verbavatz JM, Fahmy K, et al. La trehalosa hace
que la larva dauer de Caenorhabditis elegansresistentes a la desecación extrema. Curr
Biol. 2011; 21: 1331-6.Ver artículo en PubMed

34. Erkut C, Vasilj A, S Boland, Habermann B, Shevchenko A, Kurzchalia televisión. Estrategias


moleculares de la Caenorhabditis eleganslarvas dauer para sobrevivir a la desecación
extrema. Más uno. 2013; 8: e82473.Ver artículo PubMed Central PubMed

35. Un Tunnacliffe, Hincha DK, Leprince O, proteínas Macherel D. LEA: versatilidad de forma y
función. En: Lubzens E, J Cerda, Clark MS, editores. Latencia y la resistencia en ambientes
hostiles. Los temas de la genética actual, vol. 21. Berlin: Springer; 2010. p. 91-108

36. Wijayawardena BK, Minchella DJ, DeWoody JA. Los anfitriones, parásitos y la transferencia
horizontal de genes. Tendencias Parasitol.2013; 29: 329-38.Ver artículo en PubMed

37. Flybase. [ Http:. // Flybase org / ]

38. St Pierre SE, Ponting L, R Stefancsik, McQuilton P, y el Consorcio FlyBase. FlyBase 102 -
enfoques avanzados a interrogar FlyBase.Nucleic Acids Res. 2014; 42: D780-8.Ver
artículo PubMed Central PubMed

39. Flymine [ http:.. // Www flymine org / ]

40. Lyne R, Smith R, Rutherford K, Wakeling M, Varley A, Guillier F, et al. FlyMine: una base de
datos integrada para Drosophila y Anophelesgenómica. Biol genoma. 2007; 8: R129.Ver
artículo PubMed Central PubMed

41. Wormbase [ http:.. // Www wormbase org / ]

42. Yook K, Harris TW, Bieri T, Cabunoc A, Chan J, Chen WJ, et al. WormBase 2012: más
genomas, más datos, nueva página web. Nucleic Acids Research. 2012; 40: D735-41.Ver
artículo PubMed Central PubMed

43. Ensembl [ http: // www. Ensembl org. ]

44. Flicek P, Amode MR, Barrell D, Beal K, K Billis, Brent S, et al. Ensembl 2014. Nucl Acids
Res. 2014; 42: D749-55.Ver artículo PubMed Central PubMed

45. OrthoMCL [ http:. // OrthoMCL org / OrthoMCL / ]


46. Chen M, Mackey AJ, Jr Stoeckert CJ, Roos DS. OrthoMCL-DB: consultar una amplia colección
de múltiples especies de los grupos ortholog. Nucl Acids Res. 2006; 34: D363-8.Ver
artículo PubMed Central PubMed

47. Camacho C, Coulouris G, Avagyan V, Ma N, Papadopoulos J, Bealer K, et al. BLAST +:


arquitectura y aplicaciones. BMC Bioinform. 2009; 10: 421.Ver artículo

48. Enright AJ, Van Dongen S, Ouzounis CA. Un algoritmo eficiente para la detección a gran
escala de familias de proteínas. Nucl Ac Res.2002; 30: 1575-84.Ver artículo

49. Los archivos del árbol. [ Http:. // Dx doi org / 10. 6084 / M9 figshare 1.304.479... ]

50. NCBI [ http:.... // Www NCBI NLM NIH gov / ]

51. Acland A, Agarwala R, Barrett T, Beck J, Benson DA, Bollin C, et al. Recursos de base de
datos del Centro Nacional de Información Biotecnológica. Nucl Acids Res. 2013; 41:. D8-
20Ver artículo

52. Ashburner M, bola de CA, Blake JA, Botstein D, Butler H, cereza JM, et al. Ontología de
genes: herramienta para la unificación de la biología. Nat Genet. 2000; 25: 25-9.Ver
artículo PubMed Central PubMed

También podría gustarte