Está en la página 1de 26

Son los virus una fuente de nuevos pliegues de protenas de los organismos?

- Virosphere espacio estructura y evolucin Abstracto Una parte crucial importancia de la biosfera - la virosphere - es demasiado a menudo pasado por alto. Inclusin de la virosphere en el panorama mundial de la protena espacio estructura revela que el 63 superfamilias de dominios proteicos en los virus no tienen ningn pariente estructurales y evolutivos en los organismos celulares modernos. Ms de la mitad de estos tienen funciones que no son especficos del virus y por lo tanto podran ser una fuente de nuevos pliegues y funciones para la vida celular. El nmero de virus en el planeta supera a la de las clulas en un orden de magnitud y el virus evolucione hasta seis rdenes de magnitud ms rpido.Como resultado, las especies celulares estn sujetos a un constitutiva "flujo a travs" de nuevo material gentico viral. Debido a esto ya la evolucin limitaciones relajadas en los virus, la transferencia de los dominios entre el host-a-virus podra ser un mecanismo para la evolucin de protenas acelerado. El virosphere podra ser un motor para la gnesis de estructuras de protenas, e incluso puede haber sido lo que antes del ltimo ancestro comn universal de la vida celular. Introduccin La investigacin de las ltimas dos dcadas se ha ampliado nuestra comprensin de los virus que revelan una increble diversidad y abundancia. Por ejemplo, existe el descubrimiento de los virus gigantes como los Mimivirus, aisladas de la ameba, que tienen un genoma ms grande que algunas bacterias 1 . Tamao fsico Mimivirus 'es comparable a algunas bacterias pequeas 1 . Mimiviruses no estn solos - hay los parientes cercanos gigantes de Marseillevirus 2 y mamavirus 3 , tanto ameba infectante. Los descubrimientos mencionados anteriormente desafo a la claridad de las fronteras entre los virus y organismos celulares (muchos de los aspectos actualmente revisado en ref. 4 ). Otro ejemplo de nuestra comprensin cada vez mayor se encuentra en la existencia generalizada de "agentes de transferencia de genes" (GTA)-partculas que median la transferencia de ADN genmico entre las clulas - y su importancia en la poblacin bacteriana. Este difumina an ms las fronteras de los virus, en este caso con elementos mviles 5 . Tambin en los ambientes marinos, la abundancia y la diversidad de los virus ha sido encontrado para ser extremadamente alta (revisado en refs. 6-8 ).En diferentes ambientes de agua la proporcin de partculas virales de los procariotas vara entre 5 (en lagos) y 100 (en aguas ocenicas profundas) ( 9 y las referencias en l), con 10 6 10 9 partculas virales por mililitro de agua de mar 8 . En promedio, los procariotas representan 90% de la biomasa del ocano y virus 94% de cido nucleico que contiene partculas 9 . Hay ms de 5000 genotipos virales o especies en 100 L de agua de mar 7 . La secuencia de la diversidad y la singularidad de los datos metagenmica virales son notables - por lo general alrededor del 60% (o ms) de ADN lee no codificaban protenas que fueron significativamente similares a los genes conocidos (revisado en ref. 10 ). Tanto la diversidad y abundancia de los virus y el descubrimiento de los virus que transportan las protenas de los complejos de fotosntesis PSII y PSI han llevado a la aceptacin de los virus como una parte importante e integral de la biosfera 7 , 9 , 11-14 . Estos nuevos descubrimientos han conducido a un debate sobre la intensificacin de la colocacin de los virus (y los genes virales) en relacin con el rbol de la vida (TOL) y lo que los virus son y

lo que no son ( 15 y correspondencia 16-21 , as como 22 , 23 ). Adems de ser una parte importante de la biosfera en su propio derecho, el virosphere es tambin una fuente de una gran cantidad de nuevos conocimientos en el campo general de la biologa molecular, como se ilustra en un estudio reciente realizado por Enquist 24 . Dado que el nmero estimado de partculas virales excede el nmero de clulas por un orden de magnitud, dada la naturaleza infecciosa de los virus, organismos estn sujetos a un "flujo a travs" continua de material gentico viral 9 . Lo ms probable es todo ser humano ha tocado personalmente una abundancia notable y la diversidad de los virus. Cada persona ha sido, o est, infectado con el virus en formas ms o menos patolgicas o no patolgicas. Debido a la intensiva 'de flujo a travs' de los genes, se ha producido aun la endogenizacin de (no revertir-la transcripcin) protenas del virus de ARN no retrovirales por los eucariotas, lo que se describe para los seres humanos y de levadura 25 , 26 , y, recientemente, para muchos vertebrados 27-29 . Dado que no existen intermedios de ADN en su ciclo de replicacin este observ la integracin de genes de virus de ARN parece ser un evento muy poco probable, mientras que la integracin de los genes de los virus de ADN parece ms probable y por lo tanto se espera que sea ms comn. Es importante destacar que los virus tienen tasas de evolucin mucho ms rpido que sus anfitriones y la similitud de secuencias pueden desaparecer muy rpidamente (Fig. 1 y 30-32 ). Dependiendo del virus en particular, la evolucin de los genes de codificacin virales es de uno a cinco rdenes de magnitud ms rpido que su anfitrin, ya sea la medicin de mutacin per posicin por ciclo de replicacin o sustitucin por sitio por ao (Fig. 1 , tambin se ilustra en 30-32 ) . Los virus han sido reconocidos como la transferencia horizontal de genes (HGT) vesculas en las comunidades bacterianas, sin embargo, su carcter evolutivo rpido no suele ser tenida en cuenta en la estimacin de su funcin evolutiva. Las diferencias en las tasas de evolucin de los virus y sus anfitriones de cinco rdenes de magnitud (una situacin bastante tpica de los virus ssRNA) se pueden ilustrar la siguiente: el espacio de secuencia que el gen nuclear promedio de vertebrados ha sido capaz de probar desde el momento de la Cambrian explosin hasta hoy, podra haber sido muestreada por un gen viral durante la historia escrita de la humanidad.

Figura 1. Los rangos de las tasas de sustitucin para las secuencias de virus con diferentes arquitecturas de genmica de codificacin. Las tasas de sustitucin se dan como sustituciones por sitio por ao en una escala logartmica. Los datos correspondientes a los virus de Fields Virology 33 con actualizaciones de 34-39 . El crculo rojo indica el valor medio de la codificacin de secuencias nucleares de mamferos 40 . Es bien sabido que la estructura de la protena es mucho ms conservadas de la secuencia ( 41 , cuantificado en la ref. 42 ). Por lo tanto, la interferencia entre los dominios de protenas celulares y virales debe ser estudiado a nivel estructural para detectar estas relaciones evolutivas distantes. La evolucin de los dominios estructurales de la protena ha sido examinado en varios estudios excelentes, sin embargo, los virus son simplemente

excluidos de estos anlisis 43-45 , con la excepcin de 46 . La exclusin de los virus es un descuido importante, ya que son una parte importante de la biosfera y pueden contribuir a la evolucin de los dominios de la protena. El alcance de la transferencia de dominio o cambio de dominio entre el virosphere y clulas es un factor importante en la comprensin de cmo los virus han dado forma a la evolucin de los organismos celulares. Para ayudar a integrar a los virus en el panorama global de la evolucin de protenas (y evolucin de las especies), se caracteriz la interferencia (o superposicin) de celular y virosphere estructura espacial basada en la ascendencia comn el uso del recurso SUPERFAMILIA (Cuadro 1) para los dominios de estructura conocida en los genomas ( www.supfam.org , 47 , 48 ). La inclusin de los virus en la imagen lleva a conclusiones interesantes y muchas preguntas abiertas, como se describe ms adelante en este ensayo. Recuadro 1 GTA - agente de transferencia de genes. Un elemento similar a un virus que contiene piezas al azar del cromosoma del husped. Ellos son codificadas por el genoma del husped. HGT - transferencia horizontal de genes LUCA - ltimo ancestro comn universal SCOP - clasificacin estructural de las protenas. Clasificacin jerrquica de los dominios estructurales de protenas. Jerarquas de padres a hijos: clase veces (, , etc); pliegue, superfamilia, familia.(Http://scop.mrc-lmb.cam.ac.uk/scop/index.html). Superfamilia - nivel jerrquico de la SCOP agrupacin junto con esos dominios estructurales que tienen evidencia estructural, funcional y de secuencia para un ancestro evolutivo comn. El nivel ms alto de la SCOP con una confianza de relacin evolutiva. SUPERFAMILIA - un recurso que utiliza una biblioteca de HMMs para asignar dominios de la estructura conocida de las secuencias de protenas basadas en la clasificacin SCOP. El recurso ofrece asignaciones a todos los genomas secuenciados completamente, virus, plsmidos, etc ( www.supfam.org). VspSF - superfamilia virosphere especfica. Superfamilia encontrado en virosphere y no asignado a (no se encuentra en) cualquiera de los genomas celulares. UniProt - El Universal Resource Protein es un recurso integral para la secuencia de la protena y la anotacin de datos. Tambin llamado 'Investigar Protein'. El UniProt da acceso a todas las secuencias de protenas que estn disponibles al pblico. Esta es una base de datos redundante. ( www.uniprot.org ). UniProt viral - subconjunto viral de UniProt (redundante). NCBI genomas virales - un conjunto curada y no redundante de los genomas virales (www.ncbi.nlm.nih.gov / genomas / virus / viruses.html ). ICTV - Comit Internacional de Taxonoma de Virus ( http://www.ictvonline.org/ ). PfamA y PfamB - una base de datos de las familias y los dominios de secuencias de protenas. Entradas PfamA son de alta calidad, las familias comisariada manualmente. Las entradas generadas automticamente se llaman PfamB. (Http://pfam.sanger.ac.uk/). SRS - sistema integrado para la recuperacin de datos de biologa molecular y las aplicaciones para el anlisis de datos de mltiples bases de datos (http://srs.ebi.ac.uk/). HMM - Hidden Markov Model. En este modelo estadstico contexto que representa mltiples secuencias de alineacin.

HHsearch - perfil perfil software de comparacin que puede anotar dos HMMs contra otros. AP - Protein Data Bank - un portal de informacin de Estructura de Macromolculas Biolgicas (www.pdb.org ). CASP8 - octava Comunidad Amplia Experimento sobre la evaluacin crtica de las tcnicas de prediccin de estructura de protenas ( http://predictioncenter.org/ ).

Existen dominios de la protena en los virus que no tienen ningn antepasado comn en los organismos celulares En esta seccin podemos, a travs de la estructura de protenas, para identificar los dominios en el virosphere que son evolutivamente distintas de todo lo visto en la vida celular. Esto demuestra que los virus tienen la capacidad de generar nueva protena se pliega de novo. La base de datos contiene la asignacin SUPERFAMILIA genmica de los dominios de protenas SCOP a nivel SCOP SF de todos los genomas secuenciados completamente (Recuadro 1). El SCOP es una clasificacin jerrquica de dominios y agrupa a los dominios que tienen evidencia estructural, funcional y de secuencia para un antepasado evolutivo comn a nivel de protenas estructurales SF 49 .Aunque las protenas se separan fcilmente ms all del punto en el que hay alguna similitud de secuencia detectable, el empaquetamiento compacto de las cadenas laterales en el ncleo de la estructura enterrada 3D conserva la misma forma reconocible.Para comparar las protenas a travs de toda la gama de distancias evolutivas, es necesario tener en cuenta los dominios de SF, las unidades fundamentales de la ascendencia. A lo largo de este documento, se utilizan los trminos pliegan, SF y la familia tal como se definen en la SCOP. En SUPERFAMILIA liberar 1.73 (basado en la SCOP 1,73) existen 1.304 genomas celulares: 67 arqueas, bacterias 903; 334 eukaryota contiene asignaciones para 1736 FE con una significativa E -valor. Para hacerse una idea inicial se analiz la presencia de diferentes fondos sociales en los tres superkingdoms de la vida (arqueas, bacterias y eukaryota) frente a los de la virosphere. Debemos tener en cuenta que, segn el conocimiento actual de los virus no tienen un comn viral ltima universal ancestro comn (LUCA) como organismos celulares hacen y desde ese punto de vista la virosphere no es necesariamente un nivel de clasificacin filogenticamente equivalente (o grupo taxonmico) en comparacin a los tres superkingdoms. En el virosphere encontramos 560 FE. Los tres superkingdoms FE acciones con el virosphere y 30-39% de los fondos sociales en diferentes superkingdoms se comparten con los virus (Fig. 2A ) una . Aunque la mayora de los PP en el virosphere tambin se encuentran en los organismos celulares, 63 fondos sociales no estn asignados a ningn genomas celulares y por lo tanto son especficos virosphere SF (VspSF) (cuadro justificante de informacin 1) b . Por lo tanto, de acuerdo con la definicin de un dominio de la SCOP SF no hay evidencia de que se originan a partir de organismos celulares contemporneos. La relacin de VspSFs con el nmero de FE se encuentran en el virosphere es comparable a la relacin de FE especficos superreino en bacterias, pero menor que en los eucariotas (Fig. 2A ). Sin embargo, el anlisis se superpone entre superkingdoms con ms detalle, aparece una imagen ms compleja, como se muestra en el diagrama de Venn (fig. 2B ). Slo el 9% de los fondos sociales que son especficos de

Archaea (dentro de la vida celular) tambin se encuentran en los virus, en comparacin con el 42% de los fondos sociales que se encuentran en los tres superkingdoms (Fig. 2B y soporte de vdeo de la Informacin). Vemos que los fondos sociales, que son especficos para una o dos superkingdoms celulares son mucho menos bien representadas en los virus que SFs que son comunes a todos los superkingdoms.

. Figura 2 . Distribucin de fondos sociales que se encuentran en el virosphere A: nmero de fondos sociales que comparten los tres superkingdoms y la virosphere (representado por 'NCBI genomas virales' - un conjunto curada y no redundante de los genomas virales) y la fraccin de fondos sociales especficos superreino. B: FE compartidos por diferentes superkingdoms y el nmero de FE se encuentran en el virosphere y conjuntos respectivos. El nmero en negrita fuera de los crculos indica el nmero de virosphere FE especficos. 1736 FE de SCOP 1,73 fueron encontrados en los genomas completos a partir de marzo de 2010, en total 1.304 (874) genomas: 67 (59) arqueas; 903 (573) bacterias; 334 (242); eukaryota los nmeros entre parntesis indican el nmero de especies diferentes , haciendo caso omiso de las cepas redundantes. En resumen, de los 560 fondos sociales observados en los virus, un nmero significativo (63) no se observ en ningn organismo celular, estableciendo la existencia de virosphere FE especficos.

La especificidad virosphere observado de dominios de la protena no es un artefacto de los datos de nuestro anlisis En esta seccin, se analiza histricamente el efecto de aumentar la cobertura de los datos, lo que demuestra que nuestra observacin no ser anulada en el futuro por nuestro conocimiento de la estructura de protenas y la secuencia del genoma de llegar a la exhaustividad. Tambin ponen de manifiesto que los errores de asignacin no son crticos. Tomamos los FE encontrado actualmente en el virosphere y probado su especificidad virosphere como el nmero de genomas secuenciados se increment. A partir de una pronta liberacin de SUPERFAMILIA cuando haba genomas de 57 especies, encontramos 134 FE del conjunto usado de los PP (en SUPERFAMILIA 1,75) se encuentran en el virosphere que no se encontraron en estos genomas celulares en ese momento (Fig. 3A ) . Un aumento de casi diez veces en el nmero de genomas hasta 2007 redujo el nmero de VspSF doble, pero la mayor parte de esta disminucin fue durante el ao siguiente a nuestro punto de partida. Durante los ltimos aos (2007-2010) el nmero de genomas duplicado, pero slo dio lugar a una disminucin de ~ 10% en VspSFs. El aumento de la

secuenciacin de los genomas y el nmero de VspSFs no parece conducir a la desaparicin completa de un tema especfico sobre el virosphere en el futuro. Adems, estos datos fueron producidos en los actuales FE virosphere en comparacin con los datos genmicos celulares histricos, en realidad, la caracterizacin estructural de nuevas protenas virosphere tambin aumentar, dando lugar a nuevos VspSFs con el tiempo.

. Figura 3 . El nmero de VspSFs no est sobrestimado o causado por el sesgo de la base de datos A: El cambio en el nmero de VspSFs lo largo del tiempo. La "especificidad virosphere 'de los fondos sociales que se encuentran en el virosphere ya que habra sido predicho en diferentes puntos de tiempo (o en contra de nmero de especies en SUPERFAMILIA).Se calcularon a partir de datos histricos del nmero de VspSFs en cualquier ao determinado en base a las secuencias de los que se dispona en ese momento. Versin SUPERFAMILIA 1,73 se utiliza en este manuscrito, excepto en esta figura: las entradas del AP para la SCOP 1,73 fueron descargados en 26 de septiembre 2007 (http://scop.mrc-lmb.cam.ac.uk/scop/index.html). Para extender la curva con los datos ms up-to-fecha en que fue necesario el uso de datos de la superfamilia recientemente actualizada 1.75. La diferencia con respecto a 2001-2002 se debe al nmero muy limitado de los genomas eucariotas disponibles antes de 2002. El gran aumento en el nmero de especies diferentes en SUPERFAMILIA tiene un impacto menor en la reduccin del nmero de VspSFs. Solucin de nuevas estructuras revela nuevos VspSFs y nuevas secuencias celulares revelan algunos FE no ser virosphere especfica, sin embargo, ahora ms cerca de la saturacin del espacio de secuencia celular de espacio estructura viral. B: El requisito estricto para la especificidad virosphere de un SF es que es visto en cero los organismos celulares (cero en x -eje, 63 fondos sociales en y ejes). Este grfico muestra lo que ocurre con el nmero de los PP ( y -axis) si se relaja esta restriccin, permitiendo que un solo (1 en el x -axis) secuencia celular para tener la SF, o ms (continuando en el x -axis). Los criterios pueden ser aplicados por genoma o por dominio, por ejemplo, si un genoma tiene dos dominios del SF dado, que cuenta como una ventaja para el amarillo / morado y ms dos para el azul / cian. Las curvas (azul / amarillo) son acumulativos y las barras (prpura / cian) muestran el nmero exacto de los PP con el nmero de miembros en el espacio mvil. C: secuencias virales estn notablemente asignado en SUPERFAMILIA. Para cada genoma en la base de datos SUPERFAMILIA la '% de la cobertura total de la secuencia' se representa frente al '% de las protenas con asignacin' y coloreado de acuerdo con superreino. Lo mismo se hizo para los genomas virales NCBI, Uniprot y un subconjunto viral Uniprot. Tambin se examin la sensibilidad del nmero de VspSFs es la posibilidad de ser encontrado solamente en uno, dos o unos pocos genomas celulares, el posible resultado de una falsa misin, secuencia mal montaje o eventos de integracin muy recientes. Los

resultados mostrados en la. Fig. 3B muestran que los nmeros no se ven muy afectados por errores de asignacin de menor importancia. Desde el 63 VspSF, 45 SF pertenecen a monofolds (es decir, que contienen uno por SF veces) y por lo tanto tambin se virosphere pliegues especficos. Por consiguiente, la mayora no son susceptibles a errores de clasificacin o la clasificacin sobre-conservador en el nivel de SF en la SCOP. La clasificacin es muy poco probable que sea mal, incluso en los restantes 18 pliegues en los que es tericamente posible. Hemos demostrado por lo tanto que la especificidad virosphere no es un artefacto de la base de datos y sus limitaciones. Especificidad Virosphere es robusto en la extensin de los genomas incompletos y otros mtodos Nuestro anlisis anterior se basa en los genomas secuenciados completamente, por lo que aqu nos registramos para parecer VspSFs en los genomas incompletos y tambin se comprobaron para ver si otros mtodos podran detectarlos cuando la nuestra no tena. Se confirmaron Nuestros resultados iniciales. Nos encontramos con dos pruebas en las 63 VspSFs: una comparacin de UniProt15.15 50 y a la base de datos de familias de protenas PFAM (24,0 A y B) 51 . Nuestro anlisis anterior se basa en los genomas secuenciados completamente. UniProt, sin embargo, tambin contiene secuencias de organismos que no han sido secuenciados completamente, as como de las partes mviles de los genomas (como plsmidos, etc), y por lo tanto proporciona una prueba adicional de especificidad virosphere. Slo 2 de los 63 VspSF HMMs hizo un golpe significativo contra las secuencias de UniProt de un organismo celular. Hemos probado estos xitos con mtodos alternativos - I-TASSER y LOMETS ('Zhang-server') 52 (uno de los mejores servidores de prediccin de estructura de acuerdo con CASP853 ) - la aplicacin, adems de la puntuacin de HMM, muchos parmetros diferentes (ver ilustrativo ejemplo enhttp://zhanglab.ccmb.med.umich.edu/LOMETS/ ). Sin embargo, no hay evidencia de soporte, ya sea de los dos accesos se pudo encontrar por cualquiera de los servidores de prediccin de estructura (datos no presentados). Para tratar de validar las 63 VspSFs utilizando un mtodo independiente ms sensible, se utiliz una herramienta de comparacin de perfil-perfil HHsearch 54 (HMM frente HMM), lo que comporta significativamente mejor que los HMMs contra secuencias (utilizados por SUPERFAMILIA en el anlisis del genoma de origen). Utilizamos los HMMs de las VspSFs de SUPERFAMILIA realizar la bsqueda 31912 modelos PFAM (A y B). En la mayora de los casos las familias PFAM con un partido importante a un VspSF a su vez, no se ha informado PFAM tener miembros detectados en los organismos celulares. Esto nos deja cinco fondos sociales tienen importantes xitos contra cinco Pfam familias. El I-TASSER y anlisis LOMETS y un examen de la secuencia de anotaciones no se verifican ninguna de ellas. En resumen, la falta de importantes xitos entre los modelos SUPERFAMILIA VspSF y Uniprot o los Pfam familias que contienen secuencias celulares es el fuerte apoyo que los 63 VspSFs que encontramos son propensos a ser genuino.

Los virus han tenido proporcionalmente menos de sus estructuras determinado experimentalmente que los organismos celulares Para detectar un dominio SF debe haber un representante que ha tenido su estructura determinada experimentalmente (por lo general por cristalografa de rayos X o RMN). A continuacin les mostramos que el espacio estructura virosphere est mal caracterizado, por lo que siguen siendo ms VspSFs an no se ha encontrado. La cobertura de los genomas de las asignaciones de SUPERFAMILIA puede demostrar de varias maneras. Aqu, nosotros usamos dos de ellos para ilustrar que las protenas virales son mucho menos estructuralmente caracterizan a las protenas celulares. En la fig. 3C Cel porcentaje de genes (o protenas) con al menos una asignacin de SF se traza contra el "porcentaje de cobertura total de la secuencia '(% de aminocidos asignados a SFS). De todos los genomas de las protenas virales tienen el valor ms bajo en '% de los genes asignados' y tambin tienen uno de los valores ms bajos en '% de la cobertura total de la secuencia ". Los valores para las secuencias de Uniprot estn cerca de la media de todos los genomas, sin embargo, para las secuencias virales en Uniprot los respectivos valores caen significativamente (ms de 10%). El anlisis de la distribucin de los dominios PfamA caracterizan estructuralmente compartidos por diferentes superkingdoms tambin muestra una falta de caracterizacin estructural de virosphere dominios especficos. 26% de las familias PfamA contiene un enlace a las estructuras conocidas en Protein Data Bank (PDB) 55 . De esas familias que se encuentran en los genomas de ~ 30% de los de las bacterias, eucariotas y virus tiene un enlace a una estructura de AP (Fig. 4A ) d . En cuanto a la superposicin, fig. 4B muestra que las familias PfamA presentes en los tres superkingdoms son estructuralmente el ms caracterizado, con ms de la mitad tiene un enlace a una estructura de AP. Las entradas PfamA-reino especfica son menos caracterizados de entradas compartidas por diferentes reinos (por ejemplo, 47% de las familias en las arqueas en comparacin con 31% para las familias especficas Archaea) y las entradas PfamA-virosphere especfica son los menos bien caracterizado que tiene una cada drstica de la triple 30% en general y 11% para virosphere familias especficas. El bastante alto nmero de dominios archaea estructuralmente caracterizados, 31,4%, podra ser el resultado de las iniciativas de genmica estructural ya que muchos de estos son los dominios de funcin desconocida (DUFS) y la fraccin de familias especficas Archaea con un enlace a la AP fue mucho menor para la versin anterior (PfamA 23), 13,7%. Adems, un total de 212 genomas virales (e incluso dos familias virales) no tienen ninguna asignacin significativa en SUPERFAMILIA (Tabla 1 ) e .

. Figura 4 entradas Virosphere especficos PfamA estn subrepresentadas en el AP. A: Nmero de familias PfamA en superkingdoms y porcentaje de familias PfamA que tengan un vnculo con el AP o el porcentaje de familias que comparten con el

virosphere. B: Nmero de familias PfamA en las respectivas series y porcentaje de familias PfamA con un enlace a la AP. A - arqueas; B - bacterias, E - eukaryota; V - virus. Las consultas se llevaron a cabo a travs de interfaz SRS (srs.ebi.ac.uk), en marzo de 2010 usando PfamA 24.0. Si la familia PfamA tiene un enlace a la AP que se cont como una familia estructuralmente caracterizado, sin tener en cuenta "la alineacin de longitud '.

VspSFs se encuentran en todas las principales categoras funcionales de los virus y la mayora de las clases de plegado La inspeccin de la distribucin de VspSFs todo virus y todas las clases de plegado estructurales muestra que ellos estn muy extendidas, y no restringida por clase viral o estructural. La gama de huspedes de diferentes virus vara mucho dependiendo de la clase (es decir, la naturaleza y la CADENA) de su genoma 56. Por el contrario, los principales grupos de huspedes celulares estn infectadas por diferentes clases de virus, por ejemplo, no hay ningn virus ADN de doble cadena con una gran cantidad de plantas y slo unos pocos virus ARN infectan huspedes bacterianos (ilustrado en www.expasy.org / viralzone ). Las tasas de evolucin son tambin diferentes en funcin de la clase (Fig. 1 ). Por lo tanto, de acuerdo con estas diferencias muy profundas y principales, clases funcionales de los virus

tienen que ser manejados por separado. Se analiz la distribucin de VspSFs entre las principales clases funcionales de los virus. Como se muestra en la Tabla 1 , las VspSFs se encuentra en todas las principales clases funcionales de los virus. Por lo tanto, los VspSFs no se limitan a tipos especficos de material gentico. Ni uno solo de los VspSFs se encuentra en ms de una clase funcional de los virus, sin embargo, 5 VspSFs se encuentran en ms de una familia viral (Apoyo a la Informacin Tabla 1). La gama de huspedes de los virus VspSFs codificacin es tambin muy amplio - procariotas as como diferentes taxones eucariotas (levaduras, metazoarios, plantas) estn presentes (Apoyo a la Informacin Tabla 1). Los VspSFs se encuentran en todas las clases estructurales SCOP (, , etc), excepto la clase / veces (Apoyo a la Informacin Tabla 1). El virosphere no es excepcional aqu como esta clase pliegue es tambin muy raro en otros superreino especfica SF (Abroi y Gough, resultados no publicados). La distribucin de clase pliegue de FE se encuentran en el virosphere es esencialmente la misma que en la SCOP o en genomas celulares. La presencia de VspSFs est muy extendida y general.

Slo la mitad de VspSFs tienen funciones relacionadas con virus de la capa / de la cpside Sorprendentemente, mirando a las funciones de VspSFs nos encontramos con que ms de la mitad de los dominios de protenas que son especficas de los virus no tienen funciones especficas de los virus. El supuesto por defecto es que, por supuesto, tiene que haber VspSFs porque son necesarios para la funcin de la cpside / cubierta viral que en general no se encuentra en los organismos celulares (si excluimos a los retrovirales 57 ). Sin embargo, slo hasta la mitad de VspSFs son protenas de la cpside / capa. Estbamos conservadora en la clasificacin de las protenas de la cpsida como no, nosotros tambin estamos contando las protenas relacionadas con actividades especficas para los virus, tales como el apego y la entrada, la encapsulacin, etc como "cpside / capa" en este contexto (Tabla 1 ). La otra mitad de VspSFs se relaciona con actividades que no son exclusivamente especficas de los virus. La mayora de ellos estn relacionados con el metabolismo del cido nucleico (ADN / ARN vinculante, la transcripcin, la replicacin, etc), con slo 5 de los 32 VspSFs no estar relacionados con el metabolismo de los cidos nucleicos (Apoyo a la Informacin Tabla 1). Por lo tanto, aproximadamente la mitad de VspSFs tiene funciones relacionadas con la clula, y especficamente para el metabolismo del cido nucleico.

-Virus-host (V2H) y host-a-virus (H2V) las transferencias de dominios de la protena En esta seccin y las tres siguientes, comenzamos a especular que el virosphere podra ser una fuente de nuevos fondos sociales para los organismos celulares (va transferencia V2H), como tambin la hiptesis de virus y plsmidos 58 . Para que esto sea posible debe haber HGT entre los virus y los ejrcitos. Aqu, por transferencia V2H, queremos decir que el nuevo dominio es fija y se ha extendido en la poblacin (seleccionado por) en lugar de slo la integracin de material gentico viral en el cromosoma husped. Transferencias V2H no han sido ampliamente descrito hasta la fecha por varias razones: solo se transfiere muy recientes de V2H, donde est muy alto, se puede detectar fcilmente la secuencia de ADN similitud; las secuencias virales,

como podran ser filtrados a partir de secuencias genmicas como supuesta contaminacin; los genes virales o dominios de protenas virales generalmente se excluyeron del anlisis filogentico de los dominios o genes; virus tienen mucho ms rpido evolutiva tasas, por lo que la similitud de secuencia entre dominios homlogos en virus y su husped pueden desaparecer muy rpidamente. Sin embargo, todava hay varios ejemplos que ilustran la posibilidad V2H de dsRNA, ssDNA y ambas clases de virus ssRNA 2528 , 59 , 60 . El alcance de la transferencia sin embargo es difcil de estimar por las razones descritas anteriormente. La amplia superposicin entre la virosphere y el espacio estructura celular (~ 500 SF de 1736) da lugar a la cuestin de la direccin de la transferencia de dominio, y de hecho de la historia antigua de los virus y organismos celulares. La abundancia de FE en los virosphere vs genomas celulares sugiere la posibilidad de que las transferencias de V2H se pueden encontrar en esta base de datos. Los buenos candidatos para ello son los fondos sociales que se encuentran en muchos genomas virales y slo una pequea fraccin de los genomas celulares (Apoyo de vdeo de la Informacin). Se est trabajando para analizar y encontrar pruebas de ello. Se cree (aunque no probada a gran escala) que tambin hay mucho de la transferencia "de host-a-virus (H2V) ' 15 . Es posible que existe un intercambio continuo en ambas direcciones. Cuando se habla de la transferencia de dominio de V2H, hay que tener en cuenta algunas virologa. La gama de huspedes y el tropismo de tejido para los virus se define como una especie o tejidos en los que la infeccin productiva se lleva a cabo, es decir, cuando se producen nuevas partculas virales infecciosas. Sin embargo, los virus pueden transferir material gentico en una forma no productiva en un nmero mucho mayor de especies o tejidos. Como un ejemplo de esto, el uso generalizado de vectores virales para la orientacin de genes basado en adenovirus, lentivirus, baculovirus, virus vaccinia, etc, debe tenerse en cuenta.

La historia evolutiva de los dominios de protenas virales puede ser dilucidada Aqu, vamos a discutir las formas en que podemos dilucidar la filogenia, la diversidad y la distribucin ambiental de los virus. Como se explica en la introduccin, la informacin estructural es crucial para entender las transferencias V2H y H2V. Esto tambin puede ser utilizado de la misma manera para examinar la historia evolutiva de los dominios de protenas virales dentro de la virosphere, es decir, entre diferentes genomas virales (propuestas de manera similar para estructuras de las protenas de la cpside / cubierta viral por Krupovic et al. 61 ). La presencia de FE de dominio y sus combinaciones en protenas tiene suficiente contenido de informacin para, en el caso de algunos genomas virales medianas y grandes, determinar la existencia de ciertas ramas de la (gran parte sin resolver) filogenia de los virus, como se demuestra en los organismos celulares 62 . El examen de los parientes estructurales de los dominios de protenas virales no slo en los cromosomas de los genomas celulares y virales, sino tambin en las partes mviles de los genomas (como plsmidos) es importante cuando se considera la transferencia de las protenas virales. La representacin de VspSFs y nico (a los virus) combinaciones de dominios de muestreo ambiental en conjuntos de secuencias (meta-genomas) se pueden utilizar para describir la diversidad viral y ubicuidad en estas

muestras, y pueden sugerir en qu medida hemos explorado el virosphere a travs de secuenciacin hasta ahora. Las respuestas a todas estas preguntas se pueden extraer de las asignaciones en la base de datos SUPERFAMILIA.

Cul es el origen de virosphere superfamilias especficos? Por encima se estableci la existencia de VspSFs. En esta seccin se examinan los posibles orgenes de las mismas, que son cruciales para la cuestin de la interaccin gentica entre el virosphere y la vida celular. Si VspSFs no tienen homlogos estructurales celulares luego tienen ninguna ascendencia celular visible, as que de dnde viene? Hay mltiples orgenes potenciales de VspSFs: pueden ser SFs ancestrales virales (por ejemplo, algunas protenas de la cpside viral); protenas celulares ancestrales prestado por los virus, pero ms tarde perdi por las clulas, o la respectiva taxn extinguido, o que podra ser un de novo viral SF evolucion por virus. El origen de VspSFs nos puede dar pistas importantes sobre la interaccin evolutiva entre el virosphere y el mundo de protenas celulares, con implicaciones para los no VspSFs, y posiblemente algunas pistas sobre la evolucin pre-LUCA. Se ha planteado la hiptesis de que algn tipo de protenas de la cpside viral, como el doble rollo de gelatina de adenovirus PRD1 y STIV, son muy antigua de acuerdo con su abundancia en diferentes tipos de virus con respecto a la gama de sus hospedadores 63 .Tambin otros tipos de cpsides virales se encuentran en los virus que infectan a los ordenadores de diferentes dominios 64 . Por lo tanto, la hiptesis de que algunos linajes virales y cpsides virales preceden al LUCA tienen algn fuerte apoyo (discutido en la ref. 56 ) y podra ser clasificado como antiguos FE virales. Desde VspSFs pueden ser originario de protenas celulares ancestrales, pero posteriormente se han perdido a travs de la prdida de genes o la extincin, la virosphere puede ser capaz de funcionar como un amortiguador o depsito de fondos sociales que las clulas han perdido. De esta manera, podran proporcionar un acceso directo en el tiempo desde ancestral celular a las protenas celulares contemporneos. Tambin se propuso el bucle de transferencia del host a la virus-to-host 62 para explicar la historia evolutiva de las protenas MCM en arqueas. El virosphere podra ser mucho ms que slo una tienda, ya que tambin puede funcionar como un taller de evolucionar los dominios (ver ms abajo). Podra el virosphere ser una fuente de novo superfamilias? A continuacin se propone la hiptesis de que, debido a las grandes diferencias entre la evolucin viral y evolucin celular desde el LUCA, los virus podran ser responsables de algunos de los raros novo Creations de FE de celulares. La probabilidad de desarrollar una nueva SF de novo es extremadamente baja, pero esta probabilidad es mucho mayor en los virus que en las clulas. Ya se ha mencionado - El aspecto ms importante - las tasas de evolucin muy rpida de virus. Los virus, como parsitos, no tienen que ver con el destino de la clula despus de la nueva generacin de virus se ha producido (especialmente los virus lticos). Los virus pueden expresar (incluso a un alto nivel) genes que son energticamente desfavorecidas por las clulas (moderadamente mis-plegadas protenas, o protenas empaquetadas de manera suelta)

o protenas que son txicas para las clulas.Estos seran seleccionados en contra en la evolucin celular (evitando el mal plegamiento es tambin una de las fuerzas motrices de la evolucin de dominio protena celular 65 , 66 ). La evolucin posterior de estos dominios puede llevar a dominios estables y / o txicos.Por esta razn, en la va de la evolucin de dominio, los virus pueden superar algunas de las barreras que las clulas no pueden. Las largas ramas de los rboles filogenticos (evolucin rpida) y la acumulacin de insercin / delecin y dominio de intercambio tambin se observ en el caso de elemento mvil (incluyendo virus) codificada protenas MCM 61 . Por lo tanto, existe la posibilidad hipottica que esto da los virus la capacidad de desarrollar nuevos FE de protenas y familias, actuando como un motor evolutiva y almacenar. Es posible que los virus son realmente beneficiosos para la vida celular en el largo plazo y que son el medio a travs del cual la vida an puede hacer uso de los antiguos mecanismos de pre-LUCA en la que la mayora de los fondos sociales existentes se forj originalmente? Por regiones uncharacterised del virosphere son cruciales para la comprensin de la estructura del espacio En esta seccin, se consideran las regiones del virosphere que an han de tener una estructura proteica representativo determinado experimentalmente. Estas regiones son excelentes objetivos para la genmica estructural, ya que nos ayudaran a comprender la medida en que la naturaleza ha explorado la estructura del espacio, y (si los virus son una fuente de nuevos pliegues de protenas) aclarar la naturaleza de novo propia evolucin de protenas. Hemos demostrado anteriormente que la caracterizacin estructural de las secuencias virales ha sido relativamente descuidado hasta ahora (Fig. 4 ) y en el futuro puede conducir al descubrimiento de muchos nuevos FE. Por lo tanto, sera un buen objetivo para las iniciativas de genmica estructural. Un buen ejemplo es la estructura de la protena a partir del plsmido archaeal PT26-2, en donde los tres dominios parecen ser nuevos pliegues 58 (clasificacin de la SCOP y CATH est an por confirmar la declaracin hecha por los autores). Datos metagenmica virales y estudios de virus archaeal muestran que muchos genes en el virosphere an no se encuentran en bases de datos (revisado en ref. 10 y 67 ). Los virus actualmente secuenciados (genomas virales en la base de datos) estn fuertemente sesgados a razones mdicas y los virus de importancia econmica. Los genomas de acogida que se han secuenciado tambin han sido objeto de ms o menos el mismo tipo de sesgo de seleccin. Cuanto ms comensales ( comensalismo es una clase de relacin entre dos organismos en que un organismo se beneficia, pero el otro no se ve afectada) o virus simbiticas slo han comenzado a ser secuenciados y caracterizados. El espacio estructura virosphere puede contener pliegues de protenas an no observados estructuralmente estables pero evolutivos, tambin llamados la "materia oscura" de la estructura de la protena espacio 68 . Hay una dualidad-discreta continua de la protena espacio estructura (recientemente revisado por Grishin y compaeros de trabajo 69 ), que se basa en el conocimiento de que el espacio es en gran parte discreta en el sentido evolutivo, pero continua geomtricamente. Los virus ayudan a superar esta dualidad en al menos dos formas. En primer lugar, el espacio de la estructura viral puede ampliar el espacio estructura poblado (por ejemplo, los VspSFs se encuentran principalmente en la periferia de la 'galaxia de pliegues' 70 , http://toolkit.tuebingen.mpg.de/hhcluster) y

tambin generar 'tneles "en los" valles "entre los pliegues. En segundo lugar, si los pliegues son islas de estabilidad en un mar de una abrumadora mayora de conformaciones inestables, usando la analoga de Lupas y Koretke 71 , los virus, los parsitos rpida evolucin ayudan a nadar (evolucionando) los dominios de una isla a otra (todava despoblada isla). Dado que los virus evolucionan mucho ms rpido que los organismos celulares, su caracterizacin estructural puede darnos evidencia crucial para ayudar a cuantificar el grado en que la naturaleza ha explorado el espacio estructura, una de las cuestiones pendientes importantes en la biologa molecular. En la actualidad el espacio de la estructura viral caracterizada est poblada muy escasamente y es muy sesgada. Con suerte, una visin ms completa del espacio estructura viral ayudar a comprender la evolucin de los virus, as como las protenas celulares, y cmo se afectan entre s. Conclusiones A nuestro entender este es el primer completa caracterizacin de la superposicin de la virosphere y el espacio estructura celular.Hemos demostrado de forma concluyente que hay un nmero significativo de virosphere FE especficos que no tienen ninguna relacin evolutiva en los organismos celulares. Hemos demostrado que estos VspSFs son genuinos y que hay muy probablemente muchos ms an por descubrir; que estn presentes en todas las principales clases de virus. Estos FE slo estn presentes en los virus, que debido a su tasa de extremo de la evolucin y la falta de restriccin, podra ser una fuente de protena de nuevos pliegues no slo para ellos sino para los organismos celulares a travs de la transferencia horizontal. Por otra parte, slo la mitad de los VspSFs tienen funciones cpside / cubierta viral con la mitad restante con funciones relevantes para la vida celular (metabolismo de los cidos nucleicos en su mayora). Una caracterizacin ms completa del espacio estructura viral debe ser una prioridad para la determinacin experimental de entender de novo veces evolucin, evolucin muy temprano y el virus de acoger la transferencia gentica. La mayora de los estudios de evolucin molecular deliberadamente se centran exclusivamente en la vida celular, sin embargo, la inclusin de los virus y su contenido de protenas de dominio es crucial para nuestra comprensin de la gnesis de la naturaleza. The Great mil millones de aos La guerra entre ribosomas y Organismos de la cpside que codifican (Clulas y virus) como la principal fuente de Evolutivos Novelties Abstracto Nuestras concepciones sobre el origen, la naturaleza y el papel de los virus se han sacudido recientemente por varias lneas independientes de investigacin. Hay muchas razones para creer ahora que los virus son ms antiguas que las clulas modernas y siempre han sido ms abundantes y diversas que sus dianas celulares. Los virus pueden ser definidos como organismos que codifica la cpside-que transforman su clula "husped" en una fbrica viral. Si los organismos que codifica la cpside-(virus) y los organismos que codifica ribosomas (clulas) son los principales tipos de entidades en nuestro planeta vivo, parece lgico concluir que el conflicto ha sido un importante motor de la evolucin biolgica (en el marco de la seleccin natural ). En particular, muchas novedades

seleccionados primero en el mundo del virus podran haber sido transferido a las clulas como consecuencia del flujo continuo de genes virales en los genomas celulares. Se discuten recientes observaciones e hiptesis que sugieren que los virus han jugado un papel importante en diferentes etapas de la evolucin biolgica, tales como el ARN a ADN de transicin, el origen del ncleo eucariota, o, alternativamente, el origen de caractersticas nicas en macrobios multicelulares. Introduccin La existencia del cerebro, uno de los ms asombrosos productos de la evolucin, permite que algunos seres humanos a tomar decisiones morales de conciencia. Ellos pueden decidir, por ejemplo, para proteger a los ms dbiles y de los pobres, y de considerar la vida humana como de valores idnticos. Por desgracia, esto es vlido para una minora, y la mayora de los seres humanos todava obedecen a la regla de la seleccin natural, trabajando duro para conseguir el poder, la riqueza y bellas mujeres (u hombres) para el xito de sus genes. Debido a que el porcentaje de personas con valores morales y las opiniones positivas sobre la humanidad es probablemente mayor entre los cientficos que en toda la poblacin (no tenemos referencia de esa suposicin), tienden a ser molesto por algunas de las implicaciones de la seleccin natural. Tener miedo de posibles malas interpretaciones de darwinismo social, algunos bilogos an tienden a limitar el impacto de la seleccin natural (sobre todo su componente de lucha de la vida) en la evolucin de la propia biosfera. Como consecuencia, pueden pasar por alto algunos mecanismos importantes para la innovacin. Es bien sabido, sin embargo, que la guerra es una gran fuente de progreso material, como se ejemplifica en todos los nuevos dispositivos que se han creado durante la Segunda Guerra Mundial (por ejemplo, la invencin del radar, el uso de la energa nuclear), aunque probablemente fue la el evento ms horrible en la historia de la humanidad. Vamos a argumentar aqu que la tendencia de los cientficos a ser rechazado por las imgenes de la guerra, a explicar por qu han subestimado hasta ahora, el papel desempeado por la guerra entre los virus y las clulas durante la evolucin de la vida en nuestro planeta. Didier Raoult y uno de nosotros se han propuesto recientemente para dividir el mundo viviente en dos tipos distintos de organismos, los organismos que codifica ribosomas (organismos celulares) y los organismos que codifica la cpside-(organismos virales) a fin de hacer justicia a los virus y otorgarles una adecuada colocar en la biosfera. 1 Si estamos de acuerdo con este punto de vista, se hace inmediatamente obvio que la guerra entre los dos componentes principales de la vida moderna, una guerra que comenz hace miles de millones de aos (y todava se est librando), tambin habra sido el principal factor determinante para la invencin de novedades durante la evolucin de la vida en nuestro planeta. Por supuesto, una objecin clsica a este punto de vista es que las relaciones entre las clulas y los virus no siempre son destructivos; ribosoma-y organismos que codifica la cpside-a veces pueden cooperar para el beneficio de uno al otro. La armona es, por supuesto, el deseo de la mayora de nosotros y es de hecho el nuevo lema del partido comunista chino. Sin embargo, la cooperacin entre los virus y las clulas es a menudo temporal y / o es slo una alianza de guerra contra un tercero. Por lo tanto, muchas bacterias han esclavizado algunos socios virales en su lucha contra los eucariotas depredadores.2

En la guerra humana tambin, diferentes grupos pueden colaborar durante un tiempo contra un tercero, y la esclavitud es un resultado comn. Simbiosis entre organismos celulares y virales generalmente se alternan con episodios dramticos de sacrificio en el que se devastaron la mayora de los objetivos celulares. 3 Las propias holobionts resultantes se convirtieron en un nuevo combate en la guerra-juego de la vida. Todo el patrn sigue siendo el de una lucha por sobrevivir y dominar al destruir al enemigo o al desviar parte de sus recursos para sus propios fines. Las armas son robadas y otros nuevos se crean de forma continua en una carrera reina roja (que debe mover hacia adelante o te quedars atrs). Para darse cuenta de eso no te transforman en un potencial pequeo Hitler o Genghis Khan (una vez ms, la posibilidad de que nuestro cerebro-para bien o para peorsigue siendo sorprendentemente abierta), pero ayuda a entender la biosfera como es, tan maravilloso y tan terrible. Durante mucho tiempo, los virus eran vistos como (molesto) subproductos de la evolucin, fragmentos de material gentico que se escap de su husped procaritica o clulas eucariotas y se rebel en contra de ellos (para una breve pero pertinente relato histrico, ver ref. 3 ). Los virus fueron aunque los nios como perdidos (y degenerados) que tienen que ser controlado y erradicado posiblemente (como en el caso de la viruela). Los virus eran slo es interesante como modelo para los bilogos moleculares y una razn de vivir para los virlogos. No eran tan interesante (a excepcin de aquellos que los conoca muy bien), pero hemos tenido que estudiarlos para luchar contra ellos (esta guerrahumano en particular contra los virus-que estaba en aquel caso legtimo para todo el mundo, de la derecha o hacia la izquierda orientada). Esta situacin ha cambiado drsticamente en los ltimos aos cuando se hizo evidente que los virus modernos no son fragmentos de material gentico que se escaparon de las clulas madre, pero los descendientes de una antigua virosphere que probablemente incluso precedi al origen de las clulas modernas (que no debe confundirse con la origen de las clulas per se). Veremos ms adelante que la guerra entre las clulas y los virus era muy probable que ya asola a la hora de LUCA (el ltimo Ancestro Universal de celular), y probablemente incluso antes, durante el perodo de que uno de nosotros se llama "la segunda edad del mundo de ARN "(despus de la invencin de las protenas modernas, un componente obligatorio de los virus como los conocemos). 4 Este perodo (antes de la invencin de la DNA) fue sin duda dominado por el conflicto entre las clulas de ARN y virus de ARN (como nuestro mundo moderno est dominado por que entre las clulas de ADN y virus de ARN / ADN). De hecho, la guerra entre los parsitos y sus hospedadores probablemente comenz incluso antes, durante la primera edad del mundo del ARN (antes de la invencin de los ribosomas) y puede haber jugado un papel fundamental en la conformacin de la evolucin de los primeros sistemas vivientes. La lucha de vida destructivo y creativo entre los virus y las clulas (ya veces el darwinismo tambin) es por lo general completamente ignorado por los cientficos interesados en el origen de la vida, que a menudo adoptan una "visin lamarckiana" de la evolucin biolgica, en la que los organismos evolucionaron a partir de estructuras simples hacia los complejos sin ninguna razones obvias (eventualmente sigue buscando la frmula matemtica mgica o concepto ciberntico). Sin embargo, la lucha continua entre las clulas primitivas y sus parsitos debera haber tenido un impacto importante (aun siendo

el factor principal?) En la invencin de mecanismos tales como los ribosomas para producir protenas modernas o el spliceosome para producir genes modernos. Sin embargo, no vamos a discutir estas posibilidades an no exploradas aqu, pero centrarse en la hiptesis recientes que sugieren que la guerra entre el ribosoma y organismos que codifica la cpside-ha estado en el origen de los genomas de ADN moderno y ha dado forma a la aparicin de los tres dominios de la vida. Los virus son Antigua Esta conclusin se basa en varias observaciones. En primer lugar, se ha demostrado que algunos virus que infectan a diferentes miembros de los tres dominios celulares de la vidaarqueas, bacterias, protenas de replicacin de ADN / ARN homlogo Eukarya-codificar, ms estrechamente relacionados entre virus de diferentes dominios que a cualquiera de sus homlogos celulares ( para un anlisis inicial, consulte. Ref. 5 , para revisiones recientes, vanse las referencias. 6, 7 ). Esto sugiere que estas enzimas primero se origin en un antiguo mundo viral que es anterior a la divergencia de los tres dominios de la vida. La misma conclusin fue corroborada por el descubrimiento independiente de las caractersticas homlogas en los viriones de virus que infectan a los miembros de diferentes dominios de la vida. En particular, dos tipos de protena se pliega ahora han sido definidos que, en ambos casos, estn presentes en cpsidas de virus aparentemente no relacionados que infectan ya sea arqueas, bacterias, o eucariotas (para una revisin, vanse las referencias. 8, 9 ). En el caso de la estructura de la protena conocida como el "pliegue doble jelly roll", no slo las protenas de la cpside del virus de la cuota de tres dominios celulares este redil comn, pero la topologa y la organizacin de estas protenas en sus celosas de la superficie de la cpside se encontr que sean similares, con exclusin de la posibilidad de la convergencia. 9 Los datos preliminares sobre la evolucin de una de estas protenas apoya ya clara la idea de que estas homologas no son el resultado de las transferencias de virus entre los dominios, sino que han coevolucionado con cpsides virales anfitriones despus de la formacin del tres dominios. 10 En efecto, la homologa entre las protenas de la cpside con el doble Jelly Roll veces a partir de virus que infectan a diferentes mbitos de la vida slo puede ser detectado por el anlisis estructural, mientras que la homologa entre las protenas de la cpside de los virus que infectan a los miembros de los diferentes phyla del mismo dominio puede ser detectado por la similitud de secuencia. Estos datos sugieren fuertemente que los virus modernos se originaron a partir de antiguos virus que infectaron a los miembros de la comunidad en la que la LUCA estaba viviendo. Para explicar tanto la presencia de homologa entre algunos virus que infectan a diferentes dominios y de las familias virales especficos para cada dominio (vase ms adelante el caso de los virus archaeal), se ha sugerido que las tres poblaciones ancestrales de los organismos celulares tienen al azar (y de mala gana!) seleccionado, en el origen de los tres dominios modernos, tres porciones diferentes del virosphere ancestral de viajar con ellos en su viaje desde la antigedad hasta los tiempos modernos. 11 Para estar en lnea con esta propuesta, y para deshacerse de la antigua nomenclatura (virus vs bacterifagos) que surgieron de la dicotoma engaosa "procariota frente eucariota", 12 se aconseja utilizar los trminos archeoviruses, bacterioviruses, y eukaryaviruses a los virus que infectan a nombre de los miembros de estos dominios diferentes.

Los virus superan en nmero a las clulas: Ayer y Hoy Durante ms de una dcada, se desprende de los estudios ecolgicos y ms recientemente a partir de estudios de metagenmica que los virus representan la mayor parte de la biosfera moderna (para una revisin, ver ref. 13 ). Ellos superan en nmero a los organismos celulares por un log de magnitud en diversos entornos, y cada organismo celular solo pueden ser infectados por varias especies virales distintas. No hay ninguna razn para que la misma situacin podra no han sido ya prevaleca antes de LUCA, en el mundo del ARN (tan pronto como virus en realidad tienen su origen). Si es verdad, esto significa que el nmero de genes virales ha sido siempre mayor que el nmero de genes celulares en el genosphere. Incluso si usamos el supuesto conservador de que la transferencia lateral de genes entre las clulas y los virus se produce (y siempre ha ocurrido) a la misma velocidad en ambas direcciones, esto significara que, en definitiva, ms genes deberan haber sido transferidos en el curso de la evolucin de los virus a las clulas que a partir de clulas a virus. De hecho, es probable que la tasa de transferencia lateral de genes de los virus a las clulas siempre ha sido superior a la de las clulas a los virus, como se indica por el muy bajo nmero de homlogos celulares encontrados en los genomas virales en comparacin con el muy elevado nmero de viral los genes integrados en los genomas celulares. Es lgico pensar que de hecho las clulas son ms tolerantes que los virus a la integracin de nuevos genes, porque el tamao del virin generalmente impone una estricta limitacin fsica a los tamaos del genoma viral. Entonces podemos concluir con certeza que mucho ms genes fueron transferidos de los virus a las clulas que en la direccin opuesta, en el curso de la evolucin, tanto antes como despus de LUCA (hasta ahora de hecho). Tal conclusin est claramente en contraste con la opinin tradicional de que presenta los virus como "carteristas" que evolucionan principalmente mediante la contratacin de genes celulares. 14 Una consecuencia extrema de esta concepcin "carterista" es negar la existencia de los genes virales reales. En este marco, los virus no ser entidades vivientes, todos los genes virales deben ser en ltima instancia, de origen celular, es decir, deben tener su origen en un antepasado de LUCA o en uno de sus descendientes. Por ejemplo, en un reciente anlisis del genoma de los Mimivirus gigantes, se concluye que "Mimivirus adquiri la mayor parte de estos genes por transferencia horizontal de genes." 15 Sin embargo, los autores no consideraron en sus genes de anlisis sin homlogos celulares a pesar de que comprenden alrededor del 80% del contenido de genes! Genes virales sin homlogos celulares probablemente se origin en muy antiguos linajes virales antes de LUCA, mientras que otras han surgido de forma continua por la duplicacin o la recombinacin y durante la evolucin de los linajes virales modernas, estos procesos de creacin de una enorme cantidad de diversidad gentica. La diversidad y la singularidad de las protenas virales se ejemplifica por el hecho de que, como en el caso de Mimivirus, la mayora de los genes codificados por virus no tienen homlogos en genomas celulares (elementos virales al menos fuera de integrarse en estos genomas) o tener slo homlogos alejadas ( ver por ejemplo, Ref.. 11 , para el caso de los virus que infectan arqueas). Si el nmero de genes que fueron transferidos desde viral para linajes celulares en el curso de la evolucin de hecho siempre superaban en nmero el flujo inverso. Se puede concluir que las clulas son los carteristas reales sobre una base a

largo plazo. En estas condiciones, no sera razonable para negar que esta avalancha continua de estos tan diversos y nicos genes virales en los genomas celulares durante los ltimos tres o cuatro mil millones de aos debera haber tenido consecuencias importantes en la formacin de los propios dominios celulares. Los virus son mucho ms diversas que se pensaba La diversidad del mundo viral es asombrosa, y no empiecen a apreciar correctamente su significado. Se ha sabido durante mucho tiempo que los virus son ms diversos que los organismos celulares en trminos de caractersticas genmicas, porque sus genomas se pueden hacer de cualquiera de ARN, o ADN, monocatenario o bicatenario, lineal o circular, en varias combinaciones. Sin embargo, fue tambin ampliamente cree que su morfologa (en trminos de virin) era bastante montona, con principalmente tres familias de la cabeza y los viriones de cola para bacterioviruses (caudavirales orden), y viriones esfricos (ms o menos regulares) para los virus que infectan a los eucariotas. Las pocas excepciones fueron varillas lineales (para los viriones de algunos virus de plantas), o filamentos flexibles en el caso de la bacteriovirus M13 y un par de formas complejas de eukaryaviruses. En los ltimos aos, este punto de vista tradicional de la diversidad viral se ha profundizado dramticamente por el descubrimiento de los virus con morfologa nica en el archaeal dominio ( . Fig. 1 , para su revisin, ver ref. 16 ). Los viriones de algunos virus archaeal exhiben morfologas virales clsicos, siendo ya sea esfrica o lineal (en forma de varilla o filamentos flexibles), pero con combinaciones nicas de la morfologa y el genoma de tipo, tales como partculas lineales que contienen ADN de doble cadena (vsmonocatenario ADN para bacterioviruses lineales o ARN para eukaryaviruses lineales). Algunos de ellos exhiben apndices sorprendentes, como bornes de captar pili celular. An ms, los viriones de otros virus morfologas arqueas presentan que no fueron observados previamente, como en forma de limn (para elFuselloviridae ) o en forma de botella (para el Ampulloviridae ) ( . Fig. 1 ). En particular, el virus archaeal ATV ( Acidianus virus de la cola) codifica una cpside que sufre el primer caso conocido de desarrollo virin extracelular. 17 Los viriones producidos por las clulas infectadas son partculas en forma de limn que se pueden almacenar durante meses en agua a la habitacin temperatura, sin modificacin de su morfologa. Sin embargo, tan pronto como no se incuban a alta temperatura (por encima de 70 C), estos viriones se someten a una reorganizacin estructural drstica con la formacin de dos colas largas en los extremos opuestos del cuerpo central. 18La diversidad de morfotipos en virus archaeal es paralela a una diversidad en su estructura genmica y contenido. 11 Los virus de una misma familia por lo general slo comparten genes con los virus de la misma familia, con muy pocas excepciones. Teniendo en cuenta que siete familias virales ya han sido descritos por slo los virus que infectan arqueas que estudian de una orden (Sulfolobales), lo que ya es bastante claro que la diversidad real de los virus de arqueas podra ser enorme y sigue siendo en su mayor parte inexplorado.

Figura 1. micrografas electrnicas de viriones del virus de doble cadena de ADN de arqueas: (A) lipothrixvirus SIFV; (B) fusellovirus SSV1; (C) globulovirus PSV; (D) rudivirus SIRV1; (E) halovirus Oh1; (F) bicaudavirus ATV; (G) guttavirus SNFV; (H) ampullavirus ABV; (I) lipothrixvirus AFV1. Todos tincin negativa con acetato de uranilo. (A, B, D, E y G) cortesa de W. Zillig;. (C) de la Ref. 18 modificada con permiso de Elsevier, (F) de la referencia. 18modificado con autorizacin de la Naturaleza, (H) de la referencia. 55modificada con permiso de la Sociedad Americana de Microbiologa, (J) de la referencia. 56 modificado con autorizacin de Elsevier. El descubrimiento de los virus gigantes: The Factory Virion El descubrimiento de eukaryaviruses gigantes ( Mimivirus y mamaviruses) que infectan ameba, tambin ha sacudido las concepciones anteriores sobre la diversidad y la naturaleza de los virus. 19-21 Estos virus pertenecen a un grupo de eukaryaviruses, el NCLDV (por virus grandes de ADN ncleo-citoplasma) que incluyen los virus complejos, tales como poxvirus, con genomas en la gama de 200-300 kb sobres y de mltiples capas. Sin embargo, Mimivirus rompe el registro con un genoma de 1.200 kb (cuatro veces ms grande que el genoma de un micoplasma), la codificacin de ms de 900 protenas. Se tinciones de Gram positivo y se confunde originalmente con una bacteria (el tamao del virin, que incorpora ms de 100 protenas, es similar al tamao de un micoplasma). 22 La fbrica viral intracelular de Mimivirus es especialmente espectacular, con el tamao y la forma que son similares a los del ncleo del husped infectado protista. 23 Aunque la fbrica viral de Mimivirus es excepcional en trminos de tamao, la formacin de un complejo de fbrica intracelular no es nica para virus gigantes, pero es un tema comn entre eukaryaviruses. 24 25 Estas fbricas virales suelen estar rodeados de membranas que son reclutados desde el retculo endoplsmico. Jean-Michel Claverie seal correctamente que la fbrica vrica se corresponde con el organismo viral real, mientras que el virin (tradicionalmente confundirse con el virus) se corresponde con el mecanismo utilizado por las fbricas vricas para propagarse de una clula a la otra. 21 En ese sentido, la fbrica viral probablemente se debe llamar en su lugar la "fbrica del virin" (por un trabajo previo que se centra en la etapa intracelular del ciclo del virus en lugar de centrarse en el virin, ver ref. 26 ). En el caso de las bacterias y arqueas, nos gustara argumentar que el virus se transforma toda la clula infectada en una fbrica del virin. Despus de la destruccin o inactivacin del genoma celular, cuando el genoma viral es el nico que se expresa, la "clula" infectada es no ms una bacteria o una arquea, pero un virus con una apariencia celular. Un buen ejemplo de esta conversin es proporcionada por ciano-bacterioviruses (cyanophages) que codifican su propia protena centro de reaccin fotosinttica para reemplazar el celular en descomposicin, con el fin de obtener la energa adecuada requerida para su fbrica de viriones (Ref. 27 y las referencias en l) . As pues, la antigua celda de cianobacterias se convierte en un virus fotosinttica.

De todos estos ejemplos, est claro que los virus pueden ellos mismos ser considerados como organismos celulares, debido a que siempre estn viviendo en el interior de una clula. Ellos son, por supuesto, un caso particular de los organismos celulares que no codifican sus propios ribosomas y las membranas celulares, pero piden prestado los de las clulas en las que viven. Un toque final de esta reevaluacin de la situacin que viven los virus fue el descubrimiento de que el Mimivirus pueden enfermarse despus de haber ser infectado por otro virus, el virfago llamado Sputnik. 20 Los virus y el origen de la moderna Genomas La diversidad de los genomas virales y los mecanismos de replicacin es especialmente sorprendente, mientras que todos los organismos celulares tienen genomas lineales o circulares de doble cadena de ADN y se replican por un modo simtrico de la replicacin (las dos hebras se replican al mismo tiempo), los virus exhiben a la vez una diversidad de estructuras de genoma y de mecanismos de replicacin. Cuando-de doble cadena, que pueden replicar las dos hebras de ADN o bien una despus de la otra (la replicacin asimtrica), o al mismo tiempo (simultneamente o uno que se retrase). Para iniciar la replicacin de ADN, que pueden utilizar un cebador de ARN, como los organismos celulares hacen, sino que tambin puede utilizar una molcula de protena como cebador, un ARNt o el extremo 3'-OH del ADN producido por mellar. En trminos de protenas implicadas en la replicacin del genoma, virus codifican enzimas que son notablemente diferentes de sus homlogos celulares. Algunos de ellos tienen claramente no homlogos en el mundo celular (para revisiones ver Refs. 4, 6, 7 ). Por ejemplo, este es el caso para la ARN polimerasa codificada por el monomrica bacteriovirus T7, la ADN helicasa de superfamilly III, o las protenas REP que inician la replicacin de crculo rodante. Otros tienen homlogos celulares, pero son muy distinto de ellos. Este es el caso de las topoisomerasas de ADN virales o ADN polimerasas, que forman grupos especficos en los rboles filogenticos, bien separados de sus homlogos celulares. 28,29 Los anlisis filogenticos indican que este patrn filogentico extrao no puede ser explicada por la tasa ms rpida de secuencias virales evolucin pero implica estos patrones virales surgieron en linajes celulares modernos, pero en un antiguo virosphere. 6,7 Por estas enzimas, que de este modo es posible definir versiones virales, especficos para familias virales generales, que nos recuerdan de las tres versiones de dominio especfico de celular universal, protenas. Todas estas observaciones no incluyen claramente explicaciones triviales lo que sugiere que la diversidad de los genomas virales, los mecanismos de replicacin del genoma, y protenas de replicacin son la consecuencia de la tasa de evolucin rpida de las protenas virales. La explicacin ms probable de esta diversidad es que todos estos mecanismos y protenas se originaron en una muy antigua virosphere de virus de ADN que ya exista en el momento de LUCA y posiblemente incluso la precedi (de acuerdo con las conclusiones extradas a partir del anlisis estructural de las protenas de la cpside). Uno de nosotros ha sugerido que el propio ADN y los mecanismos asociados originaron (como una forma modificada de RNA) en esta antigua virosphere, en el marco de la guerra entrey ribosomas organismos que codifica la cpside. 30 En efecto, existe una ventaja selectiva clara de un virus para modificar la qumica de su genoma con el fin de protegerlo contra los mecanismos de defensa celular. Curiosamente, la hiptesis viral para el origen del ADN

est en lnea con el principio de continuidad, ya que la creacin de nuevas secuencias de ADN de las secuencias de ARN a travs de retro-transposicin (un proceso en s mismo un sello distintivo del mundo viral) ha estado sucediendo de forma continua, y todava est pasando en el linaje eukaryal, posiblemente desde que el mundo de ARN. 31 Si el ADN se origin primero en un antiguo virosphere, muchos replicacin del ADN, la recombinacin, y protenas de reparacin pueden a continuacin, han originado en el mundo viral, antes de ser transferido de los virus a las clulas en el curso de la evolucin. 32 As, se ha sugerido que la replicacin del ADN moderna mecanismos originaron all tambin. 30,33,34 Al menos dos transferencias se han postulado para explicar por qu las protenas de replicacin de ADN archaea / eukaryal y bacterianas no son homlogos. Una de estas transferencias podran ya han ocurrido antes LUCA, que requieren el reemplazo no ortlogos del mecanismo de replicacin del ADN ancestral por una nueva en arqueas / eucariotas o en las bacterias, o justo despus de LUCA, con la implicacin de un LUCA con un ARN genoma. 30,33 Considerando la mayor fidelidad de replicacin de ADN contra el ARN, el ARN viral inducida a la transicin de ADN podra haber tenido un papel fundamental en la formacin de los dominios celulares por ralentizar el ritmo de la evolucin de genes.Tres transiciones independientes (uno en el origen de cada dominio) podran explicar la existencia de tres versiones de las protenas celulares universales, tales como protenas ribosomales. 35 Por otra parte, dos transiciones, uno en el origen de bacterias, otra en un linaje comn de arqueas y eucariotas, podra explicar la clara divisin observada entre las bacterias y las arqueas versiones / eukaryal de protenas universales. Aunque estas ideas no pueden ser "experimental" a prueba, por lo menos la posibilidad de que las protenas de la replicacin del ADN viral reemplazados los celulares en el curso de la evolucin que se ha demostrado en el caso de las mitocondrias. De hecho, los anlisis filogenticos han demostrado sin ninguna duda de que la ARN polimerasa, ADN polimerasa, y el ADN helicasa que transcribir y replicar el ADN en las mitocondrias modernas son de origen viral. 28 Las enzimas virales, que fueron codificados originalmente por un virus integrado en el genoma de la bacteria en el origen de las mitocondrias, han desplazado ms tarde en la ARN polimerasa bacteriana, la ADN polimerasa, y helicasa de ADN que originalmente transcribe y replica el genoma mitocondrial. Estas tres protenas virales ahora estn codificadas por el genoma nuclear y dirigidas a las mitocondrias. Los virus y el origen del ncleo celular Un papel importante ha sido sugerido para el virus en el origen del ncleo eucariota. 36,37 En efecto, existen sorprendentes similitudes en el montaje del ncleo eucariota y las fbricas de viriones intracitoplasmtica de muchos eukaryoviruses de ADN y ARN. En ambos casos, las membranas de retculo endoplasmtico son reclutados para formar la nuclear o las envolturas virales y hay un estrecho acoplamiento entre la formacin de la membrana nuclear o viral y la replicacin del ADN. La similitud es tal que las fbricas de viriones de virus de la viruela han sido apodados "mininuclei" por los virlogos, 38 y la fbrica de viriones de los Mimivirus (no ms de un Mini, pero un maxinucleus) se ha confundido inicialmente por sus descubridores con el ncleo de la ameba infectada (Raoult, comunicacin personal).

Los autores de la hiptesis original de eukaryogenesis han sugerido que el ncleo se origin a partir de un virus de ADN grande (parecido a un poxvirus) que infect una antigua archaea, con el fin de tener en cuenta las amplias similitudes entre la biologa molecular de archaea y eukaryal. Sin embargo, es poco probable por varias razones tal escenario, (i) NCLDV parece ser especfica de los organismos eucariotas, que no sabemos en la actualidad cualquier archaeovirus gigante que se asemeja a los poxvirus, (ii) todas las arqueas carecen conocido el sistema de membranas intracelulares que parece ser crtico en la formacin de un ncleo, (iii) los lpidos eucariotas son sorprendentemente diferentes de las arqueas, mientras que deben ser similares si el host de la ancestral viral proto-ncleo era una arquea, y (iv) arqueas son monofiltico , 39 lo que indica que los eucariotas no se derivan de las arqueas, pero que las arqueas y eucariotas comparten un ancestro comn en su lugar. El ltimo punto es especialmente importante, ya que implica que las caractersticas eucariotas, tales como el ncleo, son bien caractersticas primitivas que se perdieron en arqueas o caractersticas que surgieron en el vstago del linaje eucariota derivan. 40 Si la hiptesis eukaryogenesis viral es correcta, la anfitrin de la ancestral viral proto-ncleo, por tanto, no era una arquea pero o bien una clula proto-eucariota o una clula anterior a la divergencia entre arqueas y eucariotas, posiblemente siendo un miembro del mundo de ARN. 35 Como una alternativa a la hiptesis de eukaryogenesis en el que el ncleo directamente derivado de un virus de ADN grande, se propone aqu, como una nueva hiptesis, de que una clula eucariota proto-reclut un mecanismo viral para la formacin de la membrana con el fin de construir la membrana nuclear. De un tiempo a esta membrana podra haber protegido el genoma celular del ataque de virus, antes de que algunos virus aprendieron a entrar en el ncleo. Una cuestin importante en la biologa celular es la razn por un ncleo evolucion en el primer lugar. La fbrica virin ofrece claramente la proteccin antivirus contra los sistemas de defensa del husped. El genoma del virus permanece atrapado en la fbrica virin durante el ciclo viral. En nuestra hiptesis, postulamos que por "inventar" el ncleo algunas clulas infectadas podra haber aprendido a utilizar esta estrategia viral para sus propios fines. Esta hiptesis proporciona una ventaja selectiva directa e inmediata para el organismo en el que el primer ncleo surgi (como en el caso de la hiptesis viral para la "invencin" de ADN). Curiosamente, en esta hiptesis, la clula puede haber tomado de el virus al mismo tiempo tanto la membrana nuclear y el mecanismo de transporte (a travs de los poros nucleares) que permite la transferencia de informacin y materiales entre el proto-ncleo y el proto-citoplasma. De hecho, el ARNm de muchos eukaryaviruses que se replican en el citoplasma de la clula husped se transcribe dentro de la fbrica del virin y tiene que ser transferida al citoplasma del husped a travs de los poros nucleares similares. Tales poros se han visualizado recientemente por tomografa de electrones en el caso del virus de vaccinia. 41 El desacoplamiento de la transcripcin y la traduccin de este modo se puede ver como otra "caracterstica viral" de las clulas eucariotas! Es notable que no slo los virus de ADN, virus de ARN, pero tambin pueden reclutar membranas del retculo endoplasmtico para hacer fbricas vricas-ncleo como. 25 El aparato de la replicacin viral est rodeado por una o dos capas de membrana en estos ARN mininuclei con un oprculo para la comunicacin con el citoplasma. 25 Esto abre la

posibilidad de que los organismos celulares del mundo del ARN podra haber incluido ambos tipos de organismos, con y sin ncleos. La aparicin de un ncleo tambin ha ocurrido en algunas bacterias de los Planctomycetales orden que poseen una membrana citoplasmtica intracelular (ICM). 42 El ICM es reclutado para rodear completamente el nucleoide en el caso de la especie Gemmata obscuriglobus . Existencia de esta bacteria synkaryotic (con ncleo) da testimonio de que la formacin del ncleo eucariota no ha sido un evento nico, ya que se supone a menudo (aunque este ncleo en particular es de hecho especialmente complejo). Los virus y el origen del Mecanismo eucariota ARNm que capsula ARN mensajero viral tiene que ser distinguido de ARN celular, tanto por el virus que desea degradar el ARN mensajero celular y / o la traduccin favor de su propio mensajero, as como por la clula atacado que, por el contrario, tiene que evitar que el traduccin de ARN mensajero viral. La mejor manera de distinguir dos ARN mensajeros de diferentes orgenes es etiquetar una de ellas con una etiqueta especfica. Precisamente, otra de las caractersticas especficas comunes a Eukarya y algunos eukaryoviruses es el mecanismo de limitacin que modifica el extremo 5 'del ARN mensajero para producir metilguanosina. 43 Para nosotros, lo ms probable es que los sistemas de nivelacin de mRNA en clulas eucariotas se originaron durante el conflicto entre clulas y virus. Esta hiptesis ya fue propuesta por Shuman quien sugiri que "es concebible que exoribonucleases el 5 'presentes en Eukarya y la sntesis de la tapa evolucionado en tndem en los primeros eucariotas para proporcionar una inmunidad primitiva a los virus de ARN." 43 enzimas de tapado ms virales son homlogas a su homlogos celulares, y se supone por lo general (en el marco del paradigma carterista virus) que han sido reclutados de las clulas. Sin embargo, en nuestra opinin, si las clulas son el verdadero carterista, uno no debe excluir la posibilidad de que la transferencia se produjo en la otra direccin. El papel de los virus en la Formacin de celulares de dominio fenotipos El sistema de cobertura es slo una entre una serie de caractersticas curiosas y complejas de biologa molecular eucariota. Uno puede preguntarse si esta complejidad no es, en su mayor parte, un subproducto de la guerra miles de millones de aos entre las clulas y los virus. El hecho de que las clulas eucariotas, aparentemente se originaron a partir de un antepasado que era un depredador de alimentacin a travs de la fagocitosis, y han evolucionado hacia tamaos grandes, por la depredacin a travs de la fagocitosis, los hace un blanco atractivo para los virus que producen viriones que podra fusionarse con la membrana celular y juegan con sus intracelular sistemas de transporte de membrana. Por el contrario, la relativa simplicidad de los mecanismos moleculares y estructura celular en bacterias y arqueas podra reflejar el hecho de que estos organismos han tenido ms xito en su lucha contra al menos algunas formas de virus (por ejemplo, los virus de ARN son escasos en las bacterias y para lo desconocido momento en arqueas).Debido a que el primer paso en la entrada de un virin (o su cido nucleico) dentro de cualquier organismo celular implica un contacto ntimo entre la superficie externa del virin y la envoltura externa de clulas, el desarrollo de los mecanismos de defensa eficaces contra los virus podran haber desempeado un papel crucial en la formacin de una pared celular rgida y gruesa en la superficie de las clulas bacterianas. La evolucin de una pared celular compleja en bacterias posiblemente podra explicar la relativamente baja

diversidad de bacterioviruses en comparacin con archaeoviruses y eukaryoviruses. El predominio de los virus de cabeza y cola (Caudavirales) entre bacterioviruses 44 podra reflejar el xito evolutivo de la familia viral que invent el poderoso mecanismo de cola de entrada para romper la barrera de la pared celular. En ese caso, la mayor diversidad de virus archaeal podra reflejar la falta de pared celular rgida y gruesa en la mayora de arqueas. En este marco, sera muy interesante para determinar la naturaleza de los virus que infectan bacterias inusuales, como Planctomycetes, cuyas paredes celulares no contienen peptidoglicanos y tienen sistemas de membranas intracelulares. Por ltimo, teniendo en cuenta la importancia de los sobres en la definicin del "yo", uno puede preguntarse si la interaccin entre virus y clulas podra haber jugado un papel importante en la "especiacin dominio" (divergencia entre dominios), y ms tarde en la especiacin dentro de los dominios , porque los mecanismos inventados para prevenir la infeccin viral pueden tener tambin, como un subproducto, impedido los amplios intercambios genticos entre dominios o entre las divisiones de dominio una vez que se establecieron. La lucha con los virus, probablemente, tambin influy en los tipos de genomas se encuentran en arqueas y bacterias en un lado y en eucariotas, por otro. Archaea y bacterias contienen una gran cantidad de plsmidos que probablemente se originaron de los virus. De hecho, los genomas archaeal y bacterianas parecen megaplasmids y pueden tener su origen en megaplasmids ancestrales. 35 En general, los virus son probablemente en el origen de la "mobilome" de arqueas y bacterias, es decir, la fraccin de los genomas constituido por elementos mviles , no slo provirus, sino tambin transposones, secuencias de insercin, integrones, y las islas de patogenicidad. 45 El vnculo evolutivo obvia entre plsmidos y virus sugiere que los mecanismos tales como la conjugacin, la restriccinmodificacin, toxina-antitoxina sistemas, todo se originaron en el marco de la guerra entre las clulas y los virus. 46 El reciente descubrimiento en arqueas y bacterias de un sistema de defensa contra los virus conservadas y plsmidos, las secuencias de CRISPR y protenas Cas asociados, de nuevo nos recuerda que las clulas tienen que hacer un esfuerzo considerable para sobrevivir al ataque de los virus. 46 , 47 Los cromosomas eucariticos son notablemente diferentes de las arqueas y bacterias, y puede que no sea una coincidencia que el mobilome de los eucariotas (esencialmente basado en retro-elementos) tambin es dramticamente distinto del mobilome de arqueas y bacterias. 48 Esta sugerencia encaja muy bien con la idea de que en un principio algunos virus o elementos derivados fueron crticos en la determinacin de la estructura de los cromosomas celulares. En resumen, es muy posible que los diversos giros histricos en la lucha entre los virus y las clulas han desempeado un papel importante en el origen de los dominios modernos y en sus diferentes estilos de vida. Por el contrario, la evolucin de los organismos celulares tambin ha moldeado la evolucin de la virosphere seleccionando los virus que en cada etapa fueron capaces de eludir con xito las defensas planteadas por sus potenciales vctimas. Los virus y la evolucin explosiva de macrobios El papel fundamental que desempean los virus en la evolucin de la vida no se ha limitado al mbito de los microbios (99% de la biosfera), pero probablemente ha sido fundamental para el surgimiento y evolucin de macrobios (como organismos visibles a simple vista podran llevar el nombre). 49 En los ltimos aos, el papel de los virus en la

evolucin ha sido especialmente bien documentado en los animales multicelulares. 3 Un rasgo caracterstico de los genomas de animales es la presencia de una alta proporcin de los retrovirus integrados y diversos elementos repetitivos de origen retroviral. Por ejemplo, alrededor de 42% del genoma humano contiene secuencias cuyos orgenes todava se puede remontar a retroposition. 50 virus endgeno y retro-elementos derivados pueden manipular genomas cambiando el patrn de expresin gnica (a travs de la integracin y / o recombinacin) y mediante la creacin nuevos genes (en particular a travs de la formacin de nuevos sitios de promocin de splicing alternativo 31 ) (Ver tambin las referencias. 3, 51 en el poder creador de virus). Ejemplos fascinantes de este poder creativo ya han sido identificados (vase el anlisis de Villareal del papel de los virus en el origen del sistema inmunolgico, la embriognesis, o placentacin 51-53 y las referencias en l). Teniendo en cuenta el grado de ocupacin viral de sus genomas, metazoos probablemente pueden considerarse como simbiontes virales (holobionts), productos de la antigua y extensa "simbiognesis retroviral." 51 La principal diferencia entre los chimpancs y nosotros es claramente el nmero, variedad y, ms importante, el loci de integracin de los elementos de origen viral en nuestros genomas. El origen de la humanidad, sin duda puede ver algn da como un resultado particular de la creatividad viral. Conclusin El origen de las especies (evolucin de la vida en su totalidad) es el producto de la variacin y la. Seleccin 54 Durante mucho tiempo despus de la formulacin inicial de esta prueba por Charles Darwin, la naturaleza de las variaciones sigue siendo poco clara. Tras el descubrimiento de mutaciones y el agrietamiento del cdigo gentico, se crea generalmente que las mutaciones (originalmente previstas principalmente como mutaciones individuales) fueron las principales fuentes de variacin. Ms recientemente, se hizo evidente que los procesos ms complejos estn en el trabajo. Brosius escribi recientemente, centrndose en los retrovirus y las clulas eucariotas, que "la interaccin de los ejrcitos con retrovirus, retrotransposones y retroelements es uno de los eternos conflictos que impulsan la evolucin de la vida." 31 Quisiramos punto este argumento en este caso a toda la biosfera postulando que, una vez que los virus aparecieron en el escenario de la vida, la principal causa de variacin se convirti en la interaccin entre los genomas virales y celulares, y la causa principal de la seleccin se convirti en la guerra entre la cpside y organismos que codifica ribosomas. Tenemos as, finalmente, a la conclusin de que la guerra miles de millones de aos entre las clulas y los virus ha sido (y sigue siendo) el principal motor de la evolucin de la vida.

También podría gustarte