Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Abstracto
La reconstrucción del ancestro mitocondrial tiene un gran impacto en nuestra comprensión del
origen de las mitocondrias. Estudios previos se han centrado en gran medida en la reconstrucción
del último ancestro común de todas las mitocondrias contemporáneas (protomitocondrias), pero
no en las premitocondrias más informativas (el último ancestro común de las mitocondrias y su
clado hermano alfaproteobacteriano). Utilizando un enfoque filogenómico y aprovechando el
aumento del muestreo taxonómico de genomas alfaproteobacterianos y eucariotas, reconstruimos
los metabolismos tanto de las protomitocondrias como de las premitocondrias. Nuestra
reconstrucción representa una proto-mitocondria más aerodinámica que las predichas por
estudios anteriores, y reveló varios conocimientos novedosos sobre los metabolismos eucariotas
derivados de las mitocondrias, incluido el metabolismo de los lípidos. Lo más sorprendente es que
se predijo que la premitocondria poseía un tipo de plastidio / parásito de translocasa ATP / ADP
que importa ATP del huésped, que postula la premitocondria como un parásito de energía que
contrasta directamente con el papel actual de las mitocondrias como productor de energía de la
célula. Además, se predijo que la premitocondria codificaba un gran número de genes flagelares y
varias citocromo oxidasas que funcionaban bajo un bajo nivel de oxígeno, apoyando firmemente el
hallazgo anterior de que el ancestro mitocondrial era probablemente móvil y capaz de fosforilación
oxidativa en condiciones microóxicas.
Introducción
Las mitocondrias son orgánulos eucariotas de origen bacteriano. Conocida como la teoría
endosimbiótica, ahora es ampliamente aceptada que las mitocondrias se originaron una vez a
partir de una alfaproteobacteria probablemente hace dos mil millones de años [1]. Sin embargo,
no está claro qué constituyó la endosimbiosis inicial entre la alfaproteobacteria y su huésped [2],
[3], [4]. Específicamente, ¿cuál fue el papel desempeñado por el ancestro mitocondrial que inició
la endosimbiosis? ¿Las mitocondrias se originaron bajo condición óxica, microóxica o anóxica? ¿Las
mitocondrias surgieron al mismo tiempo o después de la aparición del núcleo? ¿Cuál fue la fuerza
impulsora detrás de la simbiosis inicial [4], [5]? Se han propuesto varias hipótesis para explicar las
circunstancias de los eventos endosimbióticos fundadores [4], [6], [7], [8]. La "hipótesis del
hidrógeno" propone la sintrofia metabólica entre una H2-productora de alfaproteobacteria y una
H2-arquea dependiente como fuerza impulsora detrás de la endosimbiosis [4]. Esta hipótesis
permite la posibilidad de un origen simultáneo de mitocondria y núcleo, con la misma
alfaproteobacteria también contribuyendo al surgimiento del núcleo al fusionar su genoma con el
genoma del huésped [3]. Por lo tanto, la "hipótesis del hidrógeno" desafía directamente el modelo
tradicional de endosimbiosis en serie en el que se postula que el huésped es un eucariota de pleno
derecho, que contiene núcleos (pero amitochondriados). En contraste, la hipótesis del "eliminador
de oxígeno" propone que la eliminación del oxígeno tóxico por la alfaproteobacteria del huésped
anaeróbico ha impulsado la simbiosis inicial [5]. Las circunstancias bajo las cuales ocurrieron los
eventos fundacionales siguen siendo muy debatidas.
La reconstrucción del complemento genético del ancestro mitocondrial puede arrojar luz sobre el
origen de las mitocondrias. Nos ayudará a comprender mejor el momento de su evolución
reductiva característica. Más importante aún, la reconstrucción de su metabolismo ayudará a
dilucidar la fuerza impulsora de la endosimbiosis al probar las hipótesis alternativas. Por ejemplo,
si la condición endosimbiótica inicial era aeróbica o anaeróbica es un punto clave aún debatido
entre diferentes hipótesis [4], [5]. La hipótesis del hidrógeno apoya la sintrofia anaeróbica,
mientras que la hipótesis del eliminador de oxígeno apoya el mutualismo aeróbico. Un estudio
reciente predijo la presencia de flagelos y una citocromo cbb3 oxidasa en el ancestro mitocondrial
y sugirió que el ancestro mitocondrial era móvil y capaz de fosforilación oxidativa en condiciones
microóxicas [9]. Sin embargo, esta predicción se basó en gran medida en el análisis de un genoma
bacteriano y necesita ser evaluada más a fondo.
Aunque es clave para comprender el origen de las mitocondrias, la reconstrucción del ancestro
mitocondrial enfrenta una multitud de problemas. En primer lugar, ha habido una reducción
extrema del genoma y un dramático recambio metabólico durante la transformación de las
mitocondrias de una bacteria a un orgánulo. Por ejemplo, la mitocondria de Reclinomonas
americana, la mitocondria menos derivada reconocida hasta ahora, codifica solo 67 proteínas en
su genoma [10]. La gran mayoría de los genes del ancestro de las mitocondrias se han perdido o
transferido al núcleo [3], lo que resulta en los genomas altamente reducidos de las mitocondrias
modernas que solo codifican proteínas que funcionan en la traducción y la producción de ATP. Para
reconstruir el ancestro mitocondrial, estos genes perdidos necesitan ser recuperados.
Estudios previos han reconstruido el último ancestro común (LCA) de todas las mitocondrias [15],
[16]. Aunque perspicaces, los resultados de estos estudios tienen serias limitaciones cuando se
trata de comprender el origen de las mitocondrias. La figura 1 ilustra nuestro punto. Suponiendo
que la evolución de las mitocondrias no es reversible, el punto A representa el ACV de las
mitocondrias y su clado hermano alfaproteobacteriano (para simplificar, en lo sucesivo
denominado premitocondrias), mientras que el punto B representa el ACV de todas las
mitocondrias (protomitocondrias). Las mitocondrias surgieron en algún lugar a lo largo del tallo
entre los puntos A y B, es decir, después de separarse de las alfaproteobacterias, pero antes de la
divergencia de los linajes eucariotas (punto C). Todos los estudios previos esencialmente
reconstruyeron proto-mitocondrias simplemente agrupando genes mitocondriales (incluidos los
genes que se han transferido al núcleo). Teniendo en cuenta la dramática transformación después
del origen de las mitocondrias y las pérdidas masivas de genes asociadas con esta transformación,
la reconstrucción de las protomitocondrias revelaría poco de cómo se veía en el origen de las
mitocondrias y, por lo tanto, proporcionaría información limitada sobre el evento inicial
de endosimbiosis.
Para entender lo que estaba sucediendo en el origen de las mitocondrias, idealmente deberíamos
reconstruir el estado ancestral en el punto de tiempo C. Sin embargo, es difícil delinear el punto C
en el árbol, porque el evento de origen no se asoció con ninguna diversificación de linaje. Si el
punto B es un punto final para estudiar el origen de las mitocondrias, entonces el punto A
representa un buen punto de partida. Para obtener una mejor comprensión del origen de las
mitocondrias, sería imperativo que reconstruyéramos las premitocondrias en el punto A.
Resultados y discusión
Los 394 genes nucleares derivados de las mitocondrias están presumiblemente todos presentes en
las proto-mitocondrias. Para reconstruir el metabolismo de las protomitocondrias, asignamos 394
familias a grupos de grupos ortólogos (COG) [18] y las mapeamos en las vías de la Enciclopedia de
Genes y Genomas de Kioto (KEGG) [19] (Figura 2, Tabla S1). Las vías que incluyen el metabolismo
del piruvato, el ciclo de TCA, el transporte de electrones y la biogénesis ribosómica, así como la
biosíntesis de ácidos grasos, la beta-oxidación, la degradación de aminoácidos de cadena
ramificada (leucina, valina, isoleucina) y la biosíntesis de ubiquinona, biotina y una unidad de
carbono, se recuperaron casi por completo, todos los cuales son funcionales en las mitocondrias
modernas. Por el contrario, las categorías funcionales como la replicación del ADN y la
transcripción estaban ausentes en gran medida en nuestro metabolismo reconstruido, y los
metabolismos heterótrofos de carbohidratos como la glucólisis y la vía de la pentosa fosfato
estaban completamente ausentes. Por lo tanto, nuestra reconstrucción representa proto-
mitocondrias aerodinámicas muy similares a las mitocondrias modernas, mientras que el estudio
de Gabaldon et al. sugiere un ancestro con funciones más diversas (Figura 3) [16].
En comparación con el estudio de Gabaldon et al., nuestro análisis es más sensible. Esto es
evidente por el hecho de que a pesar de reconstruir protomitocondrias mucho más delgadas
(nuestras familias de genes 394 vs. 842 de Gabaldon), pudimos llenar muchos de los vacíos en las
vías mitocondriales bien caracterizadas que quedaron abiertas en la reconstrucción de Gabaldon.
Por ejemplo, en el metabolismo del piruvato y el ciclo de TCA, identificamos una subunidad E3 de
piruvato deshidrogenasa (lpdA / pdhD, COG1249), una succinil-CoA sintetasa (sucD, COG0074) y
una succinato deshidrogenasa (sdh2, COG0479), que son esenciales para las vías, pero que
faltaban en la reconstrucción de Gabaldon. De manera similar para la síntesis de ATP, agregamos
una subunidad de ATP sintasa tipo F0F1 (atpC, COG0355), 3 deshidrogenasas de NADH (nuoB,
COG0377; nuoM, COG1008; nuoL, COG1009) y cuatro componentes del citocromo c (fbcC,
COG2857; cyb561, COG3038; COG3474; cycM, COG5274), completando una cadena de transporte
de electrones funcional. Para el ensamblaje del grupo hierro-azufre, agregamos iscU (COG0822) e
iscA (COG0820), dos proteínas de andamio críticas sobre las cuales se ensambla y transfiere el
grupo. En cuanto a la maquinaria de traducción, se identificaron 19 proteínas ribosómicas
adicionales, junto con 8 factores de traducción (IF-2, COG0532; EF-P, COG0231 y 6 GTPasa
(COG0012, COG0206, COG0050, COG2262, COG0218, COG1159)) y 3 aminoacil-ARNt sintetasas
(COG0124, COG0162, COG0180). Además, agregamos una enzima COQ3 (COG2227) involucrada en
la biosíntesis de ubiquinona, esencialmente recuperando una vía de biosíntesis de ubiquinona de
novo completamente funcional. En el metabolismo de la biotina, agregamos una biotina-proteína
ligasa (birA, COG4285), la enzima clave que conecta el metabolismo de la biotina con la biosíntesis
de ácidos grasos.
Nuestra reconstrucción también tiene una mayor especificidad. De las 156 familias de genes que
identificamos que están presentes en el genoma nuclear humano, 104 (66,7%) familias han sido
identificadas en el proteoma mitocondrial humano, en comparación con 121 de 355 (34,1%)
familias en Gabaldon et al. 2007. También se observaron resultados similares en levaduras y
Arabidopsis (Tabla 1). Además, el 56,1% (221 de 394) de las familias identificadas en nuestro
estudio contienen al menos un gen con una señal dirigida a las mitocondrias N-terminales, en
comparación con el 30,7% (258 de 842) en Gabaldon et al. 2007. Dado que los genes nucleares
derivados de las mitocondrias a menudo se reclutan de nuevo en las mitocondrias, el mayor
porcentaje de familias de genes nucleares localizados en las mitocondrias en nuestra
reconstrucción indica una mayor especificidad de nuestros resultados
Las razones del aumento de la sensibilidad y la especificidad de los resultados podrían ser al menos
dobles. Primero, nuestro análisis filogenómico utilizó un conjunto de datos genómicos mucho más
grande que representa un rango sustancialmente más amplio de muestreo de taxones (1,613
genomas en nuestro estudio en comparación con 144 en el estudio de Gabaldon de 2007, Tabla 1).
En particular, se incluyeron muchos más genomas para el orden Rickettsiales que ha mostrado una
estrecha relación con las mitocondrias (67 en nuestro estudio en comparación con 2 en el estudio
de Gabaldon de 2007, Tabla 1). La diversidad filogenética de los genomas eucariotas también
aumentó considerablemente en nuestro muestreo, incluidos 6 nuevos filos que no habían sido
muestreados en estudios previos (Figura S1) [15], [16]. Tener un muestreo de taxones más amplio
mejoró el poder del análisis filogenético, lo que nos permitió rastrear de manera más confiable la
historia evolutiva de las familias de genes. En segundo lugar, en el estudio de Gabaldon, los genes
nucleares que se agruparon con betaproteobacterias y gamma también se identificaron como
genes nucleares derivados de las mitocondrias. La razón es aumentar la tasa de recuperación de
los genes mitocondriales de R. americana, ya que se encontró que la mayoría de las proteínas
ribosómicas se agrupaban con beta- y gammaproteobacterias en sus análisis filogenéticos [16]. Sin
embargo, con el aumento del muestreo de alfaproteobacterias, solo identificamos dos proteínas
ribosómicas de R. americana con tales patrones espurios. Por lo tanto, creemos que el criterio
utilizado en el estudio de Gabaldon es innecesariamente relajado y podría aumentar la tasa de
falsos positivos, lo que lleva a una sobreestimación del número de genes nucleares derivados de
las mitocondrias. Por ejemplo, los genes involucrados en la vía de la pentosa fosfato se agruparon
con gammaproteobacterias o una mezcla de gamma y alfaproteobacterias y se identificaron como
derivados de mitocondrias en el estudio de Gabaldon [16].
Nuestros resultados también arrojan luz sobre la contribución de las mitocondrias a otros
metabolismos eucariotas. Por ejemplo, identificamos varios genes (purD, COG0151; purM,
COG0150; perro callejero COG1051; pyrD, COG0167) implicado en la biosíntesis de nucleótidos de
novo como derivado de mitocondrias. Tanto purD como purM pertenecen a la familia de la
glicinamida ribonucleótido transformilasa y catalizan diferentes pasos en la biosíntesis de novo
purina. Las mitocondrias también contribuyen a la biosíntesis citosólica de purina al proporcionar
formiato como unidad de un carbono. Consistentemente, toda la vía de biosíntesis del formiato se
identificó como derivada de mitocondrias en nuestros resultados. Por otro lado, pyrD es una
proteína localizada en mitocondrias crítica para la biosíntesis de pirimidina [26]. purD y purM han
sido previamente identificados como de origen mitocondrial [13] pero faltaban en los resultados
de Gabaldon et al. 2007. También identificamos varios genes (glmS, COG0449; wecB, COG1940;
neuB, COG2089; murA, COG0766) implicado en la biosíntesis de azúcar UDP. El azúcar UDP
proporciona modificaciones esenciales a varias proteínas diana, como las proteínas de poro
nuclear y los componentes del citoesqueleto [27]. Por lo tanto, es tentador especular que estos
genes derivados de las mitocondrias podrían participar en el control de las actividades de estos
complejos específicos de eucarriotas.
Para obtener información sobre las circunstancias que rodearon el evento inicial de endosimbiosis,
es imperativo reconstruir el metabolismo de las premitocondrias. Para aumentar el poder de la
reconstrucción ancestral, secuenciamos 5 nuevos linajes de Rickettsiales (endosimbionte de
acanthamoeba UWC8, Candidatus Caedibacter acanthamoebae, Candidatus Paracaedibacter
acanthamoebae, Candidatus Paracaedibacter symbiosus, bacteria NHP) [28], [29]. Estas especies
de Rickettsiales recién secuenciadas, junto con otras 44 alfaproteobacterias y 6 representantes
eucariotas, se utilizaron para reconstruir un árbol bayesiano basado en la alineación de secuencias
de proteínas concatenadas de 55 genes marcadores mitocondriales y nucleares (Figura 4, en
adelante denominado árbol de especies). Las mitocondrias se colocaron dentro del orden
Rickettsiales, como un clado hermano de las familias Rickettsiaceae, Anaplasmataceae y
Candidatus Midichloriaceae, todas subtendidas por la familia Holosporaceae. Observamos que los
5 Rickettsiales recién secuenciados están estrechamente relacionados con las mitocondrias. En
particular, las 4 especies de Holosporaceae, junto con Candidatus Odyssella thessalonicensis
previamente secuenciadas forman un grupo externo al LCA de las mitocondrias y las otras
Rickettsiales, y por lo tanto son extremadamente informativas para reconstruir el estado ancestral
de las premitocondrias
Usando el árbol en la Figura 4 y un método de mapeo de caracteres bayesianos, predijimos que el
complemento genético de las premitocondrias contenía 887 COG (Tabla S1). Basándonos en las
relaciones lineales aproximadas entre el número de familias de genes, el número de genes y el
tamaño del genoma (Figura S2), estimamos que el genoma premitocondrial era de 1.5-1.6 Mb, con
1100-1300 genes. Esto es típico de una bacteria intracelular obligada y sugiere que la reducción del
genoma estaba en marcha antes de que las mitocondrias se separaran de las alfaproteobacterias,
es decir, el origen de las mitocondrias. La figura 5 muestra el metabolismo reconstruido de las
premitocondrias. En comparación con las protomitocondrias altamente especializadas, las
premitocondrias eran capaces de metabolismos mucho más diversificados. Además de las
principales vías involucradas en la traducción (13,6%), la pared celular, LPS y biogénesis de
membrana (8,3%), la producción de energía (7,2%) y la replicación, recombinación y reparación del
ADN (7,1%) (Figura 3), se predijo que poseían múltiples vías metabólicas clave, incluida la
glucólisis, el ciclo de TCA, la vía del fosfato de pentosa y la vía de biosíntesis de ácidos grasos.
Además, las premitocondrias poseían un gran número de genes implicados en la síntesis de
diversos cofactores, como la riboflavina, el folato, la biotina y la ubiquinona. Por otro lado, al igual
que la mayoría de los Rickettsiales, las premitocondrias poseían un número limitado de genes para
sintetizar ciertos aminoácidos (glutamina, leucina, valina e isoleucina) a partir de intermediarios
metabólicos, pero eran deficientes en la biosíntesis de aminoácidos de novo. Por lo tanto, las
premitocondrias tenían que obtener aminoácidos esenciales del huésped. En consecuencia, se
predijeron al menos 5 transportadores de aminoácidos en las premitocondrias.
Se predijo que las premitocondrias carecían de la mayoría de los genes involucrados en la vía de
biosíntesis de nucleótidos de novo, a excepción de algunos genes como purD y pyrD que también
estaban presentes en las protomitocondrias. Entre Rickettsiales, la vía de biosíntesis de nucleótidos
de novo está presente en la familia Anaplasmataceae pero ausente en todos los demás linajes. Por
lo tanto, una interpretación es que la vía de biosíntesis de nucleótidos de novo se obtuvo en
Anaplasmataceae, como lo sugiere el método de reconstrucción bayesiana. Debido a sus estilos de
vida aislados y la falta de presiones de selección para diversificar debido al ambiente intracelular
relativamente constante, se cree que las bacterias intracelulares obligadas como Anaplasmataceae
tienen oportunidades limitadas para la adquisición de genes [30]. Por lo tanto, creemos que
adquirir toda la vía de biosíntesis de nucleótidos de novo, incluidos 12 genes de biosíntesis de
purina y 6 pirimidina, es extremadamente improbable en Anaplasmataceae. En cambio, creemos
que es más probable que la vía de biosíntesis de nucleótidos estuviera presente en el ancestro de
Rickettsiales y mitocondrias y posteriormente se perdiera varias veces tanto en Rickettsiales
(excepto Anaplasmataceae) como en las mitocondrias.
Un estudio reciente ha sugerido que el ancestro mitocondrial poseía un flagelo [9]. Sin embargo,
esta predicción se basó en la presencia de 26 genes flagelares en una sola especie de Rickettsiales,
Candidatus Midichloria mitochondrii. Curiosamente, la mayoría de estos 26 genes flagelares se
encontraron en 4 de los 5 endosimbiontes de Rickettsiales que secuenciamos y también en el
endosimbionte recientemente secuenciado Candidatus Odyssella thessalonicensis (Figura 4). El
árbol filogenético de los genes flagelares concatenados es congruente con el árbol de especies de
Rickettsiales, lo que indica que los genes flagelares se han heredado verticalmente en las especies
de Rickettsiales. Consistentemente, forman grupos de genes sinténicos (Figura 6). Por lo tanto, no
es sorprendente que se predijera que las premitocondrias poseían 25 COG que codifican los
componentes flagelares centrales, incluido el cuerpo basal, el motor, el gancho, la varilla, el
filamento y el aparato de exportación [31]. La microscopía electrónica de la bacteria NHP ha
mostrado flagelos en el extremo basal de su célula [32]. Un estudio reciente también observó
flagelos en dos endosimbiontes de Paramecium pertenecientes al género Lyticum de la familia
Midichloriaceae [33]. En conjunto, estos resultados apoyan firmemente la presencia de flagelos en
las premitocondrias.
La premitocondria era capaz de respirar en condiciones de bajo nivel de oxígeno
Un punto clave aún debatido entre diferentes hipótesis es si la condición endosimbiótica inicial era
aeróbica o anaeróbica [4], [5]. Curiosamente, se ha sugerido que las premitocondrias podrían
respirar en condiciones de bajo oxígeno porque poseían una citocromo oxidasa tipo cbb3 que
funciona principalmente bajo la condición microóxica [9]. Al igual que los genes flagelares, esta
predicción se basó en gran medida en la presencia de citocromo oxidasa de tipo cbb3 en
Candidatus Midichloria mitochondrii solo. De los 5 endosimbiontes de Rickettsiales que
secuenciamos, las cbb3 oxidasas se encontraron solo en el endosimbionte de acanthamoeba
UWC8, el clado hermano de Candidatus Midichloria mitochondrii. Aunque nuestra reconstrucción
predijo la presencia de cbb3 oxidasa en el LCA de mitocondrias y Rickettsiales (COG2010,
COG2993, COG3278, COG0348, COG2217), las probabilidades posteriores fueron solo 0.56. Por lo
tanto, no podemos excluir la interpretación alternativa de que las cbb3 oxidasas estaban ausentes
en las premitocondrias y solo se obtuvieron en el linaje de Candidatus Midichloriaceae.
Curiosamente, sin embargo, también predijimos la presencia de una quinol oxidasa tipo bd del
citocromo bd (COG1271, COG1294) en las premitocondrias. Las oxidasas de tipo bd están
ampliamente distribuidas en Holosporaceae y Ca. Familias de Midichloriaceae (Figura 4), lo que
sugiere fuertemente que estaban presentes en premitocondrias (probabilidad posterior 0.89) y se
han perdido en mitocondrias y otros linajes Rickettsiales. Al igual que las oxidasas de tipo cbb3, las
oxidasas de tipo bd son funcionales bajo un nivel limitado de oxígeno. Por lo tanto, nuestro estudio
proporciona un apoyo fuerte y adicional a la hipótesis de que las premitocondrias eran capaces de
fosforilación oxidativa en condiciones de bajo oxígeno.
Materiales y métodos
Para cada gen de 30 genomas nucleares eucariotas, se realizó una búsqueda inicial de BLASTP
contra 2.742 genomas bacterianos, arqueales y mitocondriales completos. Se retuvo un gen
eucariota para un análisis filogenético adicional si sus cinco resultados principales contenían una
secuencia alfaproteobacteriana o mitocondrial (límite del valor e 1e-4). Todos los genes eucariotas
que pasaron la búsqueda inicial de BLAST se agruparon en familias utilizando el algoritmo de
clúster de Markov [51]. Las familias que estaban presentes en al menos dos linajes eucariotas
fueron seleccionadas para el análisis filogenético. Para cada familia de proteínas retenidas, sus
homólogos de todos los genomas bacterianos completos se recuperaron mediante la búsqueda
BLASTP (límite del valor e 1e-15). Las secuencias de proteínas se alinearon usando MAFFT [52] y se
recortaron usando ZORRO [53]. Los árboles filogenéticos se construyeron utilizando FastTree 2
[54]. Cuando fue posible, cada árbol individual fue enraizado usando tres métodos de
enraizamiento diferentes, enraizando con Archaea o Deinococcus como el enraizamiento del grupo
externo o punto medio. Cada uno de los árboles enraizados fue escaneado en busca de una
bipartición donde los genes eucariotas se agruparon con homólogos alfaproteobacterianos o
mitocondriales. Una partición se mantuvo como una familia de genes si contenía al menos dos
eucariotas y dos especies de alfaproteobacterias. Los parálogos, si existían en una familia, se
separaban y cada uno se trataba como una nueva familia de genes nucleares derivados de las
mitocondrias.
Los genes nucleares derivados de las mitocondrias se clasificaron en grupos de grupos ortólogos
(COG) mediante la búsqueda oculta del modelo de Markov utilizando HMMer3 [55]. Para
reconstruir las vías metabólicas, los genes se mapearon en la base de datos de la Enciclopedia de
Genes y Genomas de Kioto (KEGG) utilizando KEGG Automatic Annotation Server (KAAS) [56] con
"bi-directional best hit (BBH)" como método de asignación.
Se seleccionó un conjunto de 26 genes codificados por mitocondrias (cob, cox2, cox3, nad1, nad2,
nad3, nad4, nad4L, nad5, nad6, nad9, rpl2, rpl5, rpl6, rpl16, rps1, rps2, rps3, rps4, rps7, rps8,
rps11, rps12, rps13, rps14, rps19) y 29 genes nucleares derivados de mitocondrias (cox11, sdhB,
sucD, petA, erpA, hesB, ybjS, nuoC, nuoD, nuoF, nuoG, nuoI, rpl3, grpE, groEL, dnaK, clpB, clpP,
hslV, engA, gidA, trmE, AFG1, apaG, bioC, hemN, ksgA, mraW, hipotético) como genes marcadores
para la reconstrucción del árbol de especies. La lista de genes codificados por mitocondrias se
tomó de [13]. Tres genes (atp6, atp9, atpA) fueron excluidos de la lista original debido a su posible
participación en la transferencia lateral de genes [60]. Otros tres genes (cox1, yejR, yejU) fueron
excluidos debido al posible problema de paralogía. Los genes nucleares fueron seleccionados
porque eran genes de copia única y estaban distribuidos en al menos dos filos eucariotas. Se
identificaron, alinearon, recortaron y concatenaron secuencias de proteínas de 55 genes
marcadores mitocondriales y nucleares de genomas seleccionados utilizando AMPHORA2 [61]. A
partir de la alineación de la secuencia de proteínas concatenadas, se reconstruyó un árbol
bayesiano utilizando PhyloBayes [62] con las opciones -CAT -GTR como se recomienda en el
manual. Se ejecutaron dos cadenas MCMC independientes y las cadenas se consideraron
convergentes cuando el maxdiff cayó por debajo de 0.3, como se sugiere en el manual. Los árboles
fueron muestreados cada 10 ciclos y al principio una quinta parte de los árboles de cada cadena
fueron descartados como quemados. El árbol fue enraizado usando 8 beta- y gamma-
proteobacterias como grupo externo (Nitrosomonas sp. Is79A3, Ralstonia solanacearum GMI1000,
Dechloromonas aromatica RCB, Chromobacterium violaceum ATCC 12472, Francisella tularensis
subsp. tularensis FSC198, Legionella pneumophila str. Lens, Escherichia coli str. K-12 substr.
MG1655 y Pseudomonas aeruginosa PA7). Las especies del grupo externo fueron tomadas de un
estudio previo [14]. Excluimos Buchnera porque tenía una rama larga y podría causar el artefacto
LBA.