Está en la página 1de 17

Articulo Karina Pastor.

Abstracto

La reconstrucción del ancestro mitocondrial tiene un gran impacto en nuestra comprensión del
origen de las mitocondrias. Estudios previos se han centrado en gran medida en la reconstrucción
del último ancestro común de todas las mitocondrias contemporáneas (protomitocondrias), pero
no en las premitocondrias más informativas (el último ancestro común de las mitocondrias y su
clado hermano alfaproteobacteriano). Utilizando un enfoque filogenómico y aprovechando el
aumento del muestreo taxonómico de genomas alfaproteobacterianos y eucariotas, reconstruimos
los metabolismos tanto de las protomitocondrias como de las premitocondrias. Nuestra
reconstrucción representa una proto-mitocondria más aerodinámica que las predichas por
estudios anteriores, y reveló varios conocimientos novedosos sobre los metabolismos eucariotas
derivados de las mitocondrias, incluido el metabolismo de los lípidos. Lo más sorprendente es que
se predijo que la premitocondria poseía un tipo de plastidio / parásito de translocasa ATP / ADP
que importa ATP del huésped, que postula la premitocondria como un parásito de energía que
contrasta directamente con el papel actual de las mitocondrias como productor de energía de la
célula. Además, se predijo que la premitocondria codificaba un gran número de genes flagelares y
varias citocromo oxidasas que funcionaban bajo un bajo nivel de oxígeno, apoyando firmemente el
hallazgo anterior de que el ancestro mitocondrial era probablemente móvil y capaz de fosforilación
oxidativa en condiciones microóxicas.

Introducción

Las mitocondrias son orgánulos eucariotas de origen bacteriano. Conocida como la teoría
endosimbiótica, ahora es ampliamente aceptada que las mitocondrias se originaron una vez a
partir de una alfaproteobacteria probablemente hace dos mil millones de años [1]. Sin embargo,
no está claro qué constituyó la endosimbiosis inicial entre la alfaproteobacteria y su huésped [2],
[3], [4]. Específicamente, ¿cuál fue el papel desempeñado por el ancestro mitocondrial que inició
la endosimbiosis? ¿Las mitocondrias se originaron bajo condición óxica, microóxica o anóxica? ¿Las
mitocondrias surgieron al mismo tiempo o después de la aparición del núcleo? ¿Cuál fue la fuerza
impulsora detrás de la simbiosis inicial [4], [5]? Se han propuesto varias hipótesis para explicar las
circunstancias de los eventos endosimbióticos fundadores [4], [6], [7], [8]. La "hipótesis del
hidrógeno" propone la sintrofia metabólica entre una H2-productora de alfaproteobacteria y una
H2-arquea dependiente como fuerza impulsora detrás de la endosimbiosis [4]. Esta hipótesis
permite la posibilidad de un origen simultáneo de mitocondria y núcleo, con la misma
alfaproteobacteria también contribuyendo al surgimiento del núcleo al fusionar su genoma con el
genoma del huésped [3]. Por lo tanto, la "hipótesis del hidrógeno" desafía directamente el modelo
tradicional de endosimbiosis en serie en el que se postula que el huésped es un eucariota de pleno
derecho, que contiene núcleos (pero amitochondriados). En contraste, la hipótesis del "eliminador
de oxígeno" propone que la eliminación del oxígeno tóxico por la alfaproteobacteria del huésped
anaeróbico ha impulsado la simbiosis inicial [5]. Las circunstancias bajo las cuales ocurrieron los
eventos fundacionales siguen siendo muy debatidas.
La reconstrucción del complemento genético del ancestro mitocondrial puede arrojar luz sobre el
origen de las mitocondrias. Nos ayudará a comprender mejor el momento de su evolución
reductiva característica. Más importante aún, la reconstrucción de su metabolismo ayudará a
dilucidar la fuerza impulsora de la endosimbiosis al probar las hipótesis alternativas. Por ejemplo,
si la condición endosimbiótica inicial era aeróbica o anaeróbica es un punto clave aún debatido
entre diferentes hipótesis [4], [5]. La hipótesis del hidrógeno apoya la sintrofia anaeróbica,
mientras que la hipótesis del eliminador de oxígeno apoya el mutualismo aeróbico. Un estudio
reciente predijo la presencia de flagelos y una citocromo cbb3 oxidasa en el ancestro mitocondrial
y sugirió que el ancestro mitocondrial era móvil y capaz de fosforilación oxidativa en condiciones
microóxicas [9]. Sin embargo, esta predicción se basó en gran medida en el análisis de un genoma
bacteriano y necesita ser evaluada más a fondo.

Aunque es clave para comprender el origen de las mitocondrias, la reconstrucción del ancestro
mitocondrial enfrenta una multitud de problemas. En primer lugar, ha habido una reducción
extrema del genoma y un dramático recambio metabólico durante la transformación de las
mitocondrias de una bacteria a un orgánulo. Por ejemplo, la mitocondria de Reclinomonas
americana, la mitocondria menos derivada reconocida hasta ahora, codifica solo 67 proteínas en
su genoma [10]. La gran mayoría de los genes del ancestro de las mitocondrias se han perdido o
transferido al núcleo [3], lo que resulta en los genomas altamente reducidos de las mitocondrias
modernas que solo codifican proteínas que funcionan en la traducción y la producción de ATP. Para
reconstruir el ancestro mitocondrial, estos genes perdidos necesitan ser recuperados.

En segundo lugar, ha faltado un marco filogenético robusto requerido para la reconstrucción


ancestral. Aunque las mitocondrias se han colocado firmemente dentro de las alfaproteobacterias,
su posición filogenética exacta es incierta. La débil señal filogenética y los graves errores
sistemáticos, como la atracción de ramas largas y el sesgo de composición de secuencias, han
obstaculizado el esfuerzo por identificar el origen de las mitocondrias. Sin embargo, estudios
filogenómicos recientes con un mayor muestreo genómico han comenzado a formar un consenso
al colocar las mitocondrias en o cerca del orden Rickettsiales [2], [11], [12], [13], [14].

Estudios previos han reconstruido el último ancestro común (LCA) de todas las mitocondrias [15],
[16]. Aunque perspicaces, los resultados de estos estudios tienen serias limitaciones cuando se
trata de comprender el origen de las mitocondrias. La figura 1 ilustra nuestro punto. Suponiendo
que la evolución de las mitocondrias no es reversible, el punto A representa el ACV de las
mitocondrias y su clado hermano alfaproteobacteriano (para simplificar, en lo sucesivo
denominado premitocondrias), mientras que el punto B representa el ACV de todas las
mitocondrias (protomitocondrias). Las mitocondrias surgieron en algún lugar a lo largo del tallo
entre los puntos A y B, es decir, después de separarse de las alfaproteobacterias, pero antes de la
divergencia de los linajes eucariotas (punto C). Todos los estudios previos esencialmente
reconstruyeron proto-mitocondrias simplemente agrupando genes mitocondriales (incluidos los
genes que se han transferido al núcleo). Teniendo en cuenta la dramática transformación después
del origen de las mitocondrias y las pérdidas masivas de genes asociadas con esta transformación,
la reconstrucción de las protomitocondrias revelaría poco de cómo se veía en el origen de las
mitocondrias y, por lo tanto, proporcionaría información limitada sobre el evento inicial
de endosimbiosis.

Para entender lo que estaba sucediendo en el origen de las mitocondrias, idealmente deberíamos
reconstruir el estado ancestral en el punto de tiempo C. Sin embargo, es difícil delinear el punto C
en el árbol, porque el evento de origen no se asoció con ninguna diversificación de linaje. Si el
punto B es un punto final para estudiar el origen de las mitocondrias, entonces el punto A
representa un buen punto de partida. Para obtener una mejor comprensión del origen de las
mitocondrias, sería imperativo que reconstruyéramos las premitocondrias en el punto A.

Resultados y discusión

Identificación de genes nucleares derivados de mitocondrias

La recuperación de genes mitocondriales que se perdieron en el núcleo (en adelante, genes


nucleares derivados de mitocondrias) es un requisito previo para la reconstrucción del ancestro
mitocondrial. Los estudios anteriores se basaron en una disponibilidad bastante limitada de
genomas bacterianos y eucariotas en el momento de sus estudios [15], [16]. Aprovechando una
representación sustancialmente mayor de los genomas eucariotas y alfaproteobacterianos,
realizamos un análisis filogenómico para identificar sistemáticamente los genes nucleares
derivados de las mitocondrias. Los genes eucariotas con un impacto superior en la explosión de
mitocondrias/alfaproteobacterias se agruparon primero en familias de genes. Se reconstruyó un
árbol filogenético para cada familia y los genes nucleares que se agruparon con alfaproteobacterias
en los árboles se identificaron como derivados de las mitocondrias. Comenzando con 427.186
genes de 30 genomas eucariotas que representan una amplia gama de diversidad filogenética,
identificamos 4.459 genes pertenecientes a 394 familias como genes nucleares derivados de
mitocondrias. Para eliminar las recientes transferencias de genes específicos del linaje entre
alfaproteobacterias y eucariotas (por ejemplo, entre Trichoplax adhaerens y su endosimbionte
rickettsial [17]), se requirió que las familias de genes estuvieran presentes en al menos dos linajes
alfaproteobacterianos y dos eucariotas.

Estimamos la especificidad y sensibilidad de nuestro método siguiendo el procedimiento de [16].


Para la tasa de falsos positivos, utilizamos el filo de Deinococcus/Thermus, que no tiene una
relación cercana con los linajes eucariotas, como punto de referencia. De todas las 427.186
secuencias eucariotas que examinamos, solo 278 secuencias se agruparon con
Deinococcus/Thermus en los árboles genéticos (tasa de falsos positivos del 0,07%), lo que indica
que nuestro procedimiento tiene una especificidad muy alta. Para estimar la tasa de falsos
negativos, utilizamos Reclinomonas americana, el genoma mitocondrial hasta ahora menos
derivado como control positivo. Teniendo en cuenta que algunos de los genes mitocondriales de R.
americana han divergido demasiado para identificar de manera confiable sus homólogos,
utilizamos un subconjunto de 50 genes mitocondriales de R. americana que estaban presentes en
al menos otros 2 genomas mitocondriales. 46 de los 50 genes fueron recuperados por nuestro
procedimiento (tasa de falsos negativos del 8%), lo que indica que nuestro procedimiento también
es muy sensible.

Reconstrucción del metabolismo de las protomitocondrias

Los 394 genes nucleares derivados de las mitocondrias están presumiblemente todos presentes en
las proto-mitocondrias. Para reconstruir el metabolismo de las protomitocondrias, asignamos 394
familias a grupos de grupos ortólogos (COG) [18] y las mapeamos en las vías de la Enciclopedia de
Genes y Genomas de Kioto (KEGG) [19] (Figura 2, Tabla S1). Las vías que incluyen el metabolismo
del piruvato, el ciclo de TCA, el transporte de electrones y la biogénesis ribosómica, así como la
biosíntesis de ácidos grasos, la beta-oxidación, la degradación de aminoácidos de cadena
ramificada (leucina, valina, isoleucina) y la biosíntesis de ubiquinona, biotina y una unidad de
carbono, se recuperaron casi por completo, todos los cuales son funcionales en las mitocondrias
modernas. Por el contrario, las categorías funcionales como la replicación del ADN y la
transcripción estaban ausentes en gran medida en nuestro metabolismo reconstruido, y los
metabolismos heterótrofos de carbohidratos como la glucólisis y la vía de la pentosa fosfato
estaban completamente ausentes. Por lo tanto, nuestra reconstrucción representa proto-
mitocondrias aerodinámicas muy similares a las mitocondrias modernas, mientras que el estudio
de Gabaldon et al. sugiere un ancestro con funciones más diversas (Figura 3) [16].
En comparación con el estudio de Gabaldon et al., nuestro análisis es más sensible. Esto es
evidente por el hecho de que a pesar de reconstruir protomitocondrias mucho más delgadas
(nuestras familias de genes 394 vs. 842 de Gabaldon), pudimos llenar muchos de los vacíos en las
vías mitocondriales bien caracterizadas que quedaron abiertas en la reconstrucción de Gabaldon.
Por ejemplo, en el metabolismo del piruvato y el ciclo de TCA, identificamos una subunidad E3 de
piruvato deshidrogenasa (lpdA / pdhD, COG1249), una succinil-CoA sintetasa (sucD, COG0074) y
una succinato deshidrogenasa (sdh2, COG0479), que son esenciales para las vías, pero que
faltaban en la reconstrucción de Gabaldon. De manera similar para la síntesis de ATP, agregamos
una subunidad de ATP sintasa tipo F0F1 (atpC, COG0355), 3 deshidrogenasas de NADH (nuoB,
COG0377; nuoM, COG1008; nuoL, COG1009) y cuatro componentes del citocromo c (fbcC,
COG2857; cyb561, COG3038; COG3474; cycM, COG5274), completando una cadena de transporte
de electrones funcional. Para el ensamblaje del grupo hierro-azufre, agregamos iscU (COG0822) e
iscA (COG0820), dos proteínas de andamio críticas sobre las cuales se ensambla y transfiere el
grupo. En cuanto a la maquinaria de traducción, se identificaron 19 proteínas ribosómicas
adicionales, junto con 8 factores de traducción (IF-2, COG0532; EF-P, COG0231 y 6 GTPasa
(COG0012, COG0206, COG0050, COG2262, COG0218, COG1159)) y 3 aminoacil-ARNt sintetasas
(COG0124, COG0162, COG0180). Además, agregamos una enzima COQ3 (COG2227) involucrada en
la biosíntesis de ubiquinona, esencialmente recuperando una vía de biosíntesis de ubiquinona de
novo completamente funcional. En el metabolismo de la biotina, agregamos una biotina-proteína
ligasa (birA, COG4285), la enzima clave que conecta el metabolismo de la biotina con la biosíntesis
de ácidos grasos.

Nuestra reconstrucción también tiene una mayor especificidad. De las 156 familias de genes que
identificamos que están presentes en el genoma nuclear humano, 104 (66,7%) familias han sido
identificadas en el proteoma mitocondrial humano, en comparación con 121 de 355 (34,1%)
familias en Gabaldon et al. 2007. También se observaron resultados similares en levaduras y
Arabidopsis (Tabla 1). Además, el 56,1% (221 de 394) de las familias identificadas en nuestro
estudio contienen al menos un gen con una señal dirigida a las mitocondrias N-terminales, en
comparación con el 30,7% (258 de 842) en Gabaldon et al. 2007. Dado que los genes nucleares
derivados de las mitocondrias a menudo se reclutan de nuevo en las mitocondrias, el mayor
porcentaje de familias de genes nucleares localizados en las mitocondrias en nuestra
reconstrucción indica una mayor especificidad de nuestros resultados
Las razones del aumento de la sensibilidad y la especificidad de los resultados podrían ser al menos
dobles. Primero, nuestro análisis filogenómico utilizó un conjunto de datos genómicos mucho más
grande que representa un rango sustancialmente más amplio de muestreo de taxones (1,613
genomas en nuestro estudio en comparación con 144 en el estudio de Gabaldon de 2007, Tabla 1).
En particular, se incluyeron muchos más genomas para el orden Rickettsiales que ha mostrado una
estrecha relación con las mitocondrias (67 en nuestro estudio en comparación con 2 en el estudio
de Gabaldon de 2007, Tabla 1). La diversidad filogenética de los genomas eucariotas también
aumentó considerablemente en nuestro muestreo, incluidos 6 nuevos filos que no habían sido
muestreados en estudios previos (Figura S1) [15], [16]. Tener un muestreo de taxones más amplio
mejoró el poder del análisis filogenético, lo que nos permitió rastrear de manera más confiable la
historia evolutiva de las familias de genes. En segundo lugar, en el estudio de Gabaldon, los genes
nucleares que se agruparon con betaproteobacterias y gamma también se identificaron como
genes nucleares derivados de las mitocondrias. La razón es aumentar la tasa de recuperación de
los genes mitocondriales de R. americana, ya que se encontró que la mayoría de las proteínas
ribosómicas se agrupaban con beta- y gammaproteobacterias en sus análisis filogenéticos [16]. Sin
embargo, con el aumento del muestreo de alfaproteobacterias, solo identificamos dos proteínas
ribosómicas de R. americana con tales patrones espurios. Por lo tanto, creemos que el criterio
utilizado en el estudio de Gabaldon es innecesariamente relajado y podría aumentar la tasa de
falsos positivos, lo que lleva a una sobreestimación del número de genes nucleares derivados de
las mitocondrias. Por ejemplo, los genes involucrados en la vía de la pentosa fosfato se agruparon
con gammaproteobacterias o una mezcla de gamma y alfaproteobacterias y se identificaron como
derivados de mitocondrias en el estudio de Gabaldon [16].

Nuevos conocimientos sobre los metabolismos eucariotas derivados de las mitocondrias

Nuestra reconstrucción proporciona varios conocimientos novedosos sobre los metabolismos


eucariotas derivados de las mitocondrias. De particular interés son una serie de genes implicados
en el metabolismo lipídico eucariota (Tabla 2). Por ejemplo, identificamos 3 enzimas involucradas
en la biosíntesis de esteroides, incluyendo una escualeno / fitoeno sintasa (COG1562), una
esteroles-C5-desaturasa (COG3000) y una 1-desoxi-D-xilulosa-5-fosfato sintasa (COG1154) como
derivadas de mitocondrias, lo que sugiere que el ancestro mitocondrial ha contribuido a la
biosíntesis de esteroides eucariotas. El origen mitocondrial de estas enzimas está respaldado por
estudios funcionales. Se sabe que las mitocondrias desempeñan un papel esencial en la biosíntesis
de esteroides al proporcionar sitios para el inicio del proceso [20]. A cambio, los esteroides
también son críticos para mantener la morfología mitocondrial [21]. De hecho, los estudios en C.
neoformans y T. brucei indicaron que los mutantes de la escualeno sintasa y la esterol desaturasa
eran defectuosos en la integridad de la membrana mitocondrial [22], [23].
Además, identificamos una ceramida glicosiltransferasa (COG1215) implicada en la biosíntesis de
glicoesfingolípidos, llevando a cabo reacciones de glicosilación de ceramidas. Curiosamente, esta
enzima se encuentra en la "membrana asociada a las mitocondrias", un subdominio específico del
RE que sirve de puente entre el RE y las mitocondrias [24]. Tanto los glicoesfingolípidos como las
ceramidas están presentes ubicuamente como componentes esenciales de la membrana en casi
todas las células eucariotas y mitocondrias, pero rara vez se identifican en las bacterias. En
consecuencia, se pensaba que los sustratos y los productos glicolípidos de las glicosiltransferasas
bacterianas y eucariotas eran muy diferentes [25]. Por lo tanto, el origen bacteriano de este gen
indica la adquisición de una nueva función por parte de los eucariotas para sintetizar sus propias
endomembranas y para la diafonía y el tráfico de lípidos entre las mitocondrias y el RE.

Nuestros resultados también arrojan luz sobre la contribución de las mitocondrias a otros
metabolismos eucariotas. Por ejemplo, identificamos varios genes (purD, COG0151; purM,
COG0150; perro callejero COG1051; pyrD, COG0167) implicado en la biosíntesis de nucleótidos de
novo como derivado de mitocondrias. Tanto purD como purM pertenecen a la familia de la
glicinamida ribonucleótido transformilasa y catalizan diferentes pasos en la biosíntesis de novo
purina. Las mitocondrias también contribuyen a la biosíntesis citosólica de purina al proporcionar
formiato como unidad de un carbono. Consistentemente, toda la vía de biosíntesis del formiato se
identificó como derivada de mitocondrias en nuestros resultados. Por otro lado, pyrD es una
proteína localizada en mitocondrias crítica para la biosíntesis de pirimidina [26]. purD y purM han
sido previamente identificados como de origen mitocondrial [13] pero faltaban en los resultados
de Gabaldon et al. 2007. También identificamos varios genes (glmS, COG0449; wecB, COG1940;
neuB, COG2089; murA, COG0766) implicado en la biosíntesis de azúcar UDP. El azúcar UDP
proporciona modificaciones esenciales a varias proteínas diana, como las proteínas de poro
nuclear y los componentes del citoesqueleto [27]. Por lo tanto, es tentador especular que estos
genes derivados de las mitocondrias podrían participar en el control de las actividades de estos
complejos específicos de eucarriotas.

Reconstrucción del metabolismo de las premitocondrias

Para obtener información sobre las circunstancias que rodearon el evento inicial de endosimbiosis,
es imperativo reconstruir el metabolismo de las premitocondrias. Para aumentar el poder de la
reconstrucción ancestral, secuenciamos 5 nuevos linajes de Rickettsiales (endosimbionte de
acanthamoeba UWC8, Candidatus Caedibacter acanthamoebae, Candidatus Paracaedibacter
acanthamoebae, Candidatus Paracaedibacter symbiosus, bacteria NHP) [28], [29]. Estas especies
de Rickettsiales recién secuenciadas, junto con otras 44 alfaproteobacterias y 6 representantes
eucariotas, se utilizaron para reconstruir un árbol bayesiano basado en la alineación de secuencias
de proteínas concatenadas de 55 genes marcadores mitocondriales y nucleares (Figura 4, en
adelante denominado árbol de especies). Las mitocondrias se colocaron dentro del orden
Rickettsiales, como un clado hermano de las familias Rickettsiaceae, Anaplasmataceae y
Candidatus Midichloriaceae, todas subtendidas por la familia Holosporaceae. Observamos que los
5 Rickettsiales recién secuenciados están estrechamente relacionados con las mitocondrias. En
particular, las 4 especies de Holosporaceae, junto con Candidatus Odyssella thessalonicensis
previamente secuenciadas forman un grupo externo al LCA de las mitocondrias y las otras
Rickettsiales, y por lo tanto son extremadamente informativas para reconstruir el estado ancestral
de las premitocondrias
Usando el árbol en la Figura 4 y un método de mapeo de caracteres bayesianos, predijimos que el
complemento genético de las premitocondrias contenía 887 COG (Tabla S1). Basándonos en las
relaciones lineales aproximadas entre el número de familias de genes, el número de genes y el
tamaño del genoma (Figura S2), estimamos que el genoma premitocondrial era de 1.5-1.6 Mb, con
1100-1300 genes. Esto es típico de una bacteria intracelular obligada y sugiere que la reducción del
genoma estaba en marcha antes de que las mitocondrias se separaran de las alfaproteobacterias,
es decir, el origen de las mitocondrias. La figura 5 muestra el metabolismo reconstruido de las
premitocondrias. En comparación con las protomitocondrias altamente especializadas, las
premitocondrias eran capaces de metabolismos mucho más diversificados. Además de las
principales vías involucradas en la traducción (13,6%), la pared celular, LPS y biogénesis de
membrana (8,3%), la producción de energía (7,2%) y la replicación, recombinación y reparación del
ADN (7,1%) (Figura 3), se predijo que poseían múltiples vías metabólicas clave, incluida la
glucólisis, el ciclo de TCA, la vía del fosfato de pentosa y la vía de biosíntesis de ácidos grasos.
Además, las premitocondrias poseían un gran número de genes implicados en la síntesis de
diversos cofactores, como la riboflavina, el folato, la biotina y la ubiquinona. Por otro lado, al igual
que la mayoría de los Rickettsiales, las premitocondrias poseían un número limitado de genes para
sintetizar ciertos aminoácidos (glutamina, leucina, valina e isoleucina) a partir de intermediarios
metabólicos, pero eran deficientes en la biosíntesis de aminoácidos de novo. Por lo tanto, las
premitocondrias tenían que obtener aminoácidos esenciales del huésped. En consecuencia, se
predijeron al menos 5 transportadores de aminoácidos en las premitocondrias.

Se predijo que las premitocondrias carecían de la mayoría de los genes involucrados en la vía de
biosíntesis de nucleótidos de novo, a excepción de algunos genes como purD y pyrD que también
estaban presentes en las protomitocondrias. Entre Rickettsiales, la vía de biosíntesis de nucleótidos
de novo está presente en la familia Anaplasmataceae pero ausente en todos los demás linajes. Por
lo tanto, una interpretación es que la vía de biosíntesis de nucleótidos de novo se obtuvo en
Anaplasmataceae, como lo sugiere el método de reconstrucción bayesiana. Debido a sus estilos de
vida aislados y la falta de presiones de selección para diversificar debido al ambiente intracelular
relativamente constante, se cree que las bacterias intracelulares obligadas como Anaplasmataceae
tienen oportunidades limitadas para la adquisición de genes [30]. Por lo tanto, creemos que
adquirir toda la vía de biosíntesis de nucleótidos de novo, incluidos 12 genes de biosíntesis de
purina y 6 pirimidina, es extremadamente improbable en Anaplasmataceae. En cambio, creemos
que es más probable que la vía de biosíntesis de nucleótidos estuviera presente en el ancestro de
Rickettsiales y mitocondrias y posteriormente se perdiera varias veces tanto en Rickettsiales
(excepto Anaplasmataceae) como en las mitocondrias.

Pre-mitocondrion poseía flagelos

Un estudio reciente ha sugerido que el ancestro mitocondrial poseía un flagelo [9]. Sin embargo,
esta predicción se basó en la presencia de 26 genes flagelares en una sola especie de Rickettsiales,
Candidatus Midichloria mitochondrii. Curiosamente, la mayoría de estos 26 genes flagelares se
encontraron en 4 de los 5 endosimbiontes de Rickettsiales que secuenciamos y también en el
endosimbionte recientemente secuenciado Candidatus Odyssella thessalonicensis (Figura 4). El
árbol filogenético de los genes flagelares concatenados es congruente con el árbol de especies de
Rickettsiales, lo que indica que los genes flagelares se han heredado verticalmente en las especies
de Rickettsiales. Consistentemente, forman grupos de genes sinténicos (Figura 6). Por lo tanto, no
es sorprendente que se predijera que las premitocondrias poseían 25 COG que codifican los
componentes flagelares centrales, incluido el cuerpo basal, el motor, el gancho, la varilla, el
filamento y el aparato de exportación [31]. La microscopía electrónica de la bacteria NHP ha
mostrado flagelos en el extremo basal de su célula [32]. Un estudio reciente también observó
flagelos en dos endosimbiontes de Paramecium pertenecientes al género Lyticum de la familia
Midichloriaceae [33]. En conjunto, estos resultados apoyan firmemente la presencia de flagelos en
las premitocondrias.
La premitocondria era capaz de respirar en condiciones de bajo nivel de oxígeno

Un punto clave aún debatido entre diferentes hipótesis es si la condición endosimbiótica inicial era
aeróbica o anaeróbica [4], [5]. Curiosamente, se ha sugerido que las premitocondrias podrían
respirar en condiciones de bajo oxígeno porque poseían una citocromo oxidasa tipo cbb3 que
funciona principalmente bajo la condición microóxica [9]. Al igual que los genes flagelares, esta
predicción se basó en gran medida en la presencia de citocromo oxidasa de tipo cbb3 en
Candidatus Midichloria mitochondrii solo. De los 5 endosimbiontes de Rickettsiales que
secuenciamos, las cbb3 oxidasas se encontraron solo en el endosimbionte de acanthamoeba
UWC8, el clado hermano de Candidatus Midichloria mitochondrii. Aunque nuestra reconstrucción
predijo la presencia de cbb3 oxidasa en el LCA de mitocondrias y Rickettsiales (COG2010,
COG2993, COG3278, COG0348, COG2217), las probabilidades posteriores fueron solo 0.56. Por lo
tanto, no podemos excluir la interpretación alternativa de que las cbb3 oxidasas estaban ausentes
en las premitocondrias y solo se obtuvieron en el linaje de Candidatus Midichloriaceae.
Curiosamente, sin embargo, también predijimos la presencia de una quinol oxidasa tipo bd del
citocromo bd (COG1271, COG1294) en las premitocondrias. Las oxidasas de tipo bd están
ampliamente distribuidas en Holosporaceae y Ca. Familias de Midichloriaceae (Figura 4), lo que
sugiere fuertemente que estaban presentes en premitocondrias (probabilidad posterior 0.89) y se
han perdido en mitocondrias y otros linajes Rickettsiales. Al igual que las oxidasas de tipo cbb3, las
oxidasas de tipo bd son funcionales bajo un nivel limitado de oxígeno. Por lo tanto, nuestro estudio
proporciona un apoyo fuerte y adicional a la hipótesis de que las premitocondrias eran capaces de
fosforilación oxidativa en condiciones de bajo oxígeno.

La pre-mitocondria era un parásito energético

Curiosamente, se predijo que las premitocondrias codificarían el tipo de plastidio/parásito de la


translocasa ATP/ADP (COG3202; probabilidad posterior 0.93), una proteína distintiva de muchas
bacterias intracelulares obligadas que se utiliza para importar ATP del huésped, aunque los
homólogos remotos de este gen pertenecientes a los transportadores de la superfamilia
facilitadora principal (MFS) también están presentes en las bacterias de vida libre [por ejemplo,
34]. La translocasa ATP/ADP funciona comúnmente como un antiportador ATP/ADP que
intercambia ADP bacteriano por ATP de la célula huésped [35]. Además, se ha demostrado que
algunas bacterias intracelulares, incluyendo Chlamydia y Rickettsia, codifican isoformas adicionales
de esta proteína para la captación de nucleótidos para compensar su incapacidad para sintetizar
nucleótidos de novo [36], [37]. Consistentemente, esta familia de genes está ausente en la familia
Anaplasmataceae de Rickettsiales, miembros de los cuales poseen una vía completa de biosíntesis
de nucleótidos de novo [13], [38], [39]. Estudios previos han sugerido que hubo antiguas
transferencias laterales de genes de este gen entre los ancestros de Chlamydiales, Rickettsiales y
plastidios [35], [40] seguidos de una herencia en gran parte vertical [41]. En consistencia, nuestro
análisis filogenético muestra que el árbol genético es en gran medida congruente con el árbol de
especies del orden Rickettsiales (Figura S3), lo que sugiere que este gen ha sido heredado
verticalmente en Rickettsiales y, por lo tanto, probablemente estaba presente en su último
ancestro común y, por inferencia, en las premitocondrias. Si la vía de biosíntesis de nucleótidos
también estaba presente en las premitocondrias como hemos predicho, entonces este gen
probablemente funcionó como un intercambiador de ATP / ADP en lugar de un transportador de
nucleótidos en las premitocondrias.

Sorprendentemente, la translocasa ATP/ADP plastidio/parásito no está relacionada evolutivamente


y es funcionalmente distinta de la translocasa ATP/ADP en las mitocondrias modernas, que exhibe
una polaridad opuesta al exportar ATP al citosol del huésped [42], [43], [44]. Por lo tanto, nuestra
reconstrucción postula la premitocondria como un "eliminador de energía" y sugiere un
parasitismo energético entre el endosimbionte y su huésped en el origen de las mitocondrias,
como lo propusieron por primera vez Andersson et al. [5], [45]. Esto está en marcado contraste con
el papel actual de las mitocondrias como productoras de energía de la célula y contradice la teoría
endosimbiótica tradicional de que la simbiosis fue impulsada por el simbionte que suministra al
huésped ATP [46], [47]. La sustitución de la translocasa ATP/ADP plastidio/parásito por la
translocasa ATP/ADP mitocondrial ocurrió posteriormente, lo que resultó en un flujo inverso de
ATP entre la mitocondria y su huésped. Esta notable transformación en el metabolismo energético
podría marcar la transición de las mitocondrias de un endosimbionte parásito a un orgánulo
mutualista [48].

Un estudio sistemático reciente de la simbiosis bacteriana ha demostrado que los mutualismos


pueden originarse directamente de bacterias ambientales de vida libre o de parásitos
intracelulares [49]. Una diferencia clave entre estas dos rutas evolutivas es que para iniciar la
simbiosis, las bacterias de vida libre necesitan ofrecer beneficios inmediatos al huésped, mientras
que las bacterias parásitas intracelulares no lo hacen [50]. Nuestros resultados sugieren que las
mitocondrias probablemente se originaron a partir de un parásito intracelular obligado y no de una
bacteria de vida libre. Esto tiene implicaciones importantes para nuestra comprensión del origen
de las mitocondrias. Implica que al comienzo de la endosimbiosis, el simbionte bacteriano no
proporcionó ningún beneficio al huésped. Por lo tanto, argumentamos que los beneficios
propuestos por varias hipótesis (por ejemplo, la hipótesis del eliminador de oxígeno y la hipótesis
del hidrógeno) son irrelevantes para explicar el establecimiento de la simbiosis inicial. En cambio,
podría ser más apropiado aplicarlos para explicar la transición de las mitocondrias de un parásito a
un orgánulo mutualista en una etapa posterior.

Materiales y métodos

Identificación de genes nucleares derivados de mitocondrias

La distribución filogenética de todos los genomas eucariotas secuenciados se recuperó de la base


de datos GenomeOnline (GOLD, http://genomesonline.org/). Se seleccionaron 30 genomas
eucariotas que representan una amplia gama de diversidad eucariota (10 phyla) para identificar los
genes nucleares derivados de mitocondrias (Allomyce macrogynus, Arabidopsis thaliana,
Batrachochytrium dedrobatidis, Caenorhabditis elegans, Chlamydomonas reinhardtii, Cryptococcus
neoformans, Dictyostelium discoideum, Drosophila melanogaster, Encephalitozoon intestinalis,
Entamoeba histolytica, Enterocytozoon bieneusi, Giardia lamblia, Homo sapiens, Leishmania major,
Micromonas pusilla, Monosiga brevicollis, Naegleria gruberi, Nectria haematococca, Nematostella
vectensis, Nosema ceranae, Phytophthora infestans, Plasmodium falciparum, Saccharomyce
cerevisiae, Schistosoma mansoni, Spizellomyces punctatus, Strongylocentrotus purpuratus,
Tetrahymena thermophila, Thalassiosira pseudonana, Trichoplax adhaerens, Trypanosoma brucei).

Para cada gen de 30 genomas nucleares eucariotas, se realizó una búsqueda inicial de BLASTP
contra 2.742 genomas bacterianos, arqueales y mitocondriales completos. Se retuvo un gen
eucariota para un análisis filogenético adicional si sus cinco resultados principales contenían una
secuencia alfaproteobacteriana o mitocondrial (límite del valor e 1e-4). Todos los genes eucariotas
que pasaron la búsqueda inicial de BLAST se agruparon en familias utilizando el algoritmo de
clúster de Markov [51]. Las familias que estaban presentes en al menos dos linajes eucariotas
fueron seleccionadas para el análisis filogenético. Para cada familia de proteínas retenidas, sus
homólogos de todos los genomas bacterianos completos se recuperaron mediante la búsqueda
BLASTP (límite del valor e 1e-15). Las secuencias de proteínas se alinearon usando MAFFT [52] y se
recortaron usando ZORRO [53]. Los árboles filogenéticos se construyeron utilizando FastTree 2
[54]. Cuando fue posible, cada árbol individual fue enraizado usando tres métodos de
enraizamiento diferentes, enraizando con Archaea o Deinococcus como el enraizamiento del grupo
externo o punto medio. Cada uno de los árboles enraizados fue escaneado en busca de una
bipartición donde los genes eucariotas se agruparon con homólogos alfaproteobacterianos o
mitocondriales. Una partición se mantuvo como una familia de genes si contenía al menos dos
eucariotas y dos especies de alfaproteobacterias. Los parálogos, si existían en una familia, se
separaban y cada uno se trataba como una nueva familia de genes nucleares derivados de las
mitocondrias.

Anotación funcional de genes nucleares derivados de mitocondrias

Los genes nucleares derivados de las mitocondrias se clasificaron en grupos de grupos ortólogos
(COG) mediante la búsqueda oculta del modelo de Markov utilizando HMMer3 [55]. Para
reconstruir las vías metabólicas, los genes se mapearon en la base de datos de la Enciclopedia de
Genes y Genomas de Kioto (KEGG) utilizando KEGG Automatic Annotation Server (KAAS) [56] con
"bi-directional best hit (BBH)" como método de asignación.

Secuenciación, ensamblaje y anotación del genoma

4 endosimbiontes de acanthamoebae (endosymbiont de acanthamoeba UWC8, Candidatus


Caedibacter acanthamoebae, Candidatus Paracaedibacter acanthamoebae, Candidatus
Paracaedibacter symbiosus) y un patógeno de la bacteria NHP del camarón fueron secuenciados
por una combinación de secuenciación SMRT de 454, Illumina y Pacific Biosciences. Los genomas
se ensamblaron usando Newbler 2.5.3, CLCGenomicWorkbench 6.0.1 o Celera assembler 8.2 y se
cerraron manualmente resolviendo repeticiones usando información de extremo pareado y
comparando ensamblajes usando Mauve [57]. La PCR y la secuenciación de Sanger se utilizaron
para cerrar las brechas entre los contigs cuando fue necesario. Los genomas se han depositado en
DDBJ/EMBL/GenBank de la siguiente manera: endosimbionte de acanthamoeba UWC8
(CP004403), Candidatus Caedibacter acanthamoebae (CP008936-CP008940), Candidatus
Paracaedibacter acanthamoebae (CP008941-CP008942), Candidatus Paracaedibacter symbiosus
(JQAK00000000) y la bacteria NHP (JQAJ00000000). Los genes codificadores de proteínas se
predijeron utilizando el paquete de software GLIMMER [58].

Árbol de especies de alfaproteobacterias y mitocondrias

Seleccionamos un conjunto de 49 representantes alfaproteobacterianos utilizando un algoritmo


codicioso basado en árboles para maximizar su diversidad filogenética [59]. Un conjunto de 6
linajes eucariotas (Cryptococcus neoformans, Arabidopsis thaliana, Nematostella vectensis,
Spizellomyces punctatus, Monosiga brevicollis, Phytophthora infestans) fueron seleccionados como
representantes eucariotas. Phyla Alveolata, Amoebozoa, Euglenozoa y Diplomonadida no se
incluyeron porque tenían ramas extremadamente largas y, por lo tanto, eran propensas a la
atracción de ramas largas (LBA).

Se seleccionó un conjunto de 26 genes codificados por mitocondrias (cob, cox2, cox3, nad1, nad2,
nad3, nad4, nad4L, nad5, nad6, nad9, rpl2, rpl5, rpl6, rpl16, rps1, rps2, rps3, rps4, rps7, rps8,
rps11, rps12, rps13, rps14, rps19) y 29 genes nucleares derivados de mitocondrias (cox11, sdhB,
sucD, petA, erpA, hesB, ybjS, nuoC, nuoD, nuoF, nuoG, nuoI, rpl3, grpE, groEL, dnaK, clpB, clpP,
hslV, engA, gidA, trmE, AFG1, apaG, bioC, hemN, ksgA, mraW, hipotético) como genes marcadores
para la reconstrucción del árbol de especies. La lista de genes codificados por mitocondrias se
tomó de [13]. Tres genes (atp6, atp9, atpA) fueron excluidos de la lista original debido a su posible
participación en la transferencia lateral de genes [60]. Otros tres genes (cox1, yejR, yejU) fueron
excluidos debido al posible problema de paralogía. Los genes nucleares fueron seleccionados
porque eran genes de copia única y estaban distribuidos en al menos dos filos eucariotas. Se
identificaron, alinearon, recortaron y concatenaron secuencias de proteínas de 55 genes
marcadores mitocondriales y nucleares de genomas seleccionados utilizando AMPHORA2 [61]. A
partir de la alineación de la secuencia de proteínas concatenadas, se reconstruyó un árbol
bayesiano utilizando PhyloBayes [62] con las opciones -CAT -GTR como se recomienda en el
manual. Se ejecutaron dos cadenas MCMC independientes y las cadenas se consideraron
convergentes cuando el maxdiff cayó por debajo de 0.3, como se sugiere en el manual. Los árboles
fueron muestreados cada 10 ciclos y al principio una quinta parte de los árboles de cada cadena
fueron descartados como quemados. El árbol fue enraizado usando 8 beta- y gamma-
proteobacterias como grupo externo (Nitrosomonas sp. Is79A3, Ralstonia solanacearum GMI1000,
Dechloromonas aromatica RCB, Chromobacterium violaceum ATCC 12472, Francisella tularensis
subsp. tularensis FSC198, Legionella pneumophila str. Lens, Escherichia coli str. K-12 substr.
MG1655 y Pseudomonas aeruginosa PA7). Las especies del grupo externo fueron tomadas de un
estudio previo [14]. Excluimos Buchnera porque tenía una rama larga y podría causar el artefacto
LBA.

Pre-mitochondria ancestral state reconstruction


Usando el árbol de especies, las premitocondrias se reconstruyeron con un algoritmo de inferencia
de mapeo de caracteres bayesiano implementado en BayesTraits V2 [63]. Se ha demostrado que el
método bayesiano es superior tanto al método de parsimonia como al método de máxima
verosimilitud para tener en cuenta las incertidumbres tanto en los parámetros del modelo como
en la filogenia [63], [64]. Los genes mitocondriales se compilaron combinando los genes nucleares
derivados de las mitocondrias con los genes codificados por las mitocondrias. Los genes
mitocondriales y 148.485 genes de 49 genomas alfaproteobacterianos se asignaron por primera
vez a 4.873 COG mediante la búsqueda oculta del modelo de Markov utilizando HMMer3 [55]. Los
genes que no podían asignarse a un COG se agruparon en familias utilizando el algoritmo de
clúster de Markov [51], creando 3.210 "COG expandidos". La presencia/ausencia de cada COG en
cada especie fue tratada como un rasgo binario y fue utilizada para la reconstrucción del estado
ancestral. La distribución gamma se adoptó como la distribución previa con su parámetro estimado
a partir de un análisis inicial de máxima verosimilitud. La opción "hiperprior" se utilizó para reducir
la incertidumbre en la elección de priores en el MCMC. Se realizó un total de 1.050.000
iteraciones, con los primeros 50.000 ciclos descartados como burn-in. El valor promedio de cada
estado binario en los 1.000.000 de ciclos restantes se tomó como la probabilidad de la presencia
de cada COG en el estado ancestral reconstruido.

También podría gustarte