Documentos de Académico
Documentos de Profesional
Documentos de Cultura
HOGAR | ENVIAR
| PREGUNTAS MÁS FRECUENTES
| BLOG | ALERTAS / RSS | SOBRE
| CANALES
Búsqueda
Búsqueda Avanzada
bioRxiv publica muchos documentos relacionados con COVID19. Un recordatorio: no han sido revisados formalmente
por pares y no deben guiar el comportamiento relacionado con la salud ni informarse en la prensa como concluyentes.
Nuevos resultados Este artículo ha sido retirado. Haga clic aquí para más detalles
Prashant Pradhan , Ashutosh Kumar Pandey , Akhilesh Mishra , Parul Gupta , Praveen Kumar Tripathi ,
Manoj Balakrishnan Menon , James Gomes , Perumal Vivekanandan , Bishwajit Kundu
doi: https://doi.org/10.1101/2020.01.30.927871
Este artículo es una preimpresión y no ha sido certificado por una revisión por pares [ ¿qué significa esto? ].
Previsualizar PDF
Resumen
Actualmente estamos presenciando una gran epidemia causada por el nuevo coronavirus de
2019 (2019-nCoV). La evolución de 2019-nCoV sigue siendo esquiva. Encontramos 4
inserciones en la glicoproteína espiga (S) que son exclusivas del 2019-nCoV y no están
presentes en otros coronavirus. Es importante destacar que los residuos de aminoácidos en
los 4 insertos tienen identidad o similitud con los de la gp120 del VIH-1 o la Gag del VIH-1.
Curiosamente, a pesar de que las inserciones son discontinuas en la secuencia de aminoácidos
primaria, el modelado 3D del 2019-nCoV sugiere que convergen para constituir el sitio de
unión del receptor. Es poco probable que el hallazgo de 4 insertos únicos en el 2019-nCoV,
todos los cuales tienen identidad/similitud con los residuos de aminoácidos en proteínas
estructurales clave del VIH-1, sea de naturaleza fortuita.
https://www.biorxiv.org/content/10.1101/2020.01.30.927871v1.full 1/15
27/10/22, 18:11 Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag | bioRxiv
Introducción
Los coronavirus (CoV) son virus de ARN monocatenario de sentido positivo que infectan a
animales y humanos. Estos se clasifican en 4 géneros según su especificidad de huésped:
Alphacoronavirus, Betacoronavirus, Deltacoronavirus y Gammacoronavirus ( Snijder et al.,
2006 ). Hay siete tipos conocidos de CoV que incluyen 229E y NL63 (Género
Alphacoronavirus), OC43, HKU1, MERS y SARS (Género Betacoronavirus). Si bien 229E, NL63,
OC43 y HKU1 comúnmente infectan a los humanos, el brote de SARS y MERS en 2002 y 2012
respectivamente ocurrió cuando el virus se cruzó de animales a humanos y causó una
mortalidad significativa ( J. Chan et al., nd ; JFW Chan et al. al., 2015). En diciembre de 2019,
se informó otro brote de coronavirus en Wuhan, China, que también se transmitió de animales
a humanos. La Organización Mundial de la Salud (OMS) ha denominado temporalmente a este
nuevo virus como nuevo coronavirus 2019 (2019-nCoV) ( JF-W. Chan et al., 2020 ; Zhu et al.,
2020 ). Si bien existen varias hipótesis sobre el origen de 2019-nCoV, la fuente de este brote
en curso sigue siendo esquiva.
La glicoproteína espiga (S) del cornonavirus se divide en dos subunidades (S1 y S2). La
subunidad S1 ayuda en la unión del receptor y la subunidad S2 facilita la fusión de membranas
( Bosch et al., 2003 ; Li, 2016 ). Las glicoproteínas espigas de los coronovirus son
determinantes importantes del tropismo tisular y la gama de huéspedes. Además, las
glicoproteínas de punta son objetivos críticos para el desarrollo de vacunas ( Du et al., 2013 ).
Por esta razón, las proteínas de punta representan las más estudiadas entre los coronavirus.
Por lo tanto, buscamos investigar la glicoproteína espiga del 2019-nCoV para comprender su
evolución, secuencia de características novedosas y características estructurales utilizando
herramientas computacionales.
Metodología
https://www.biorxiv.org/content/10.1101/2020.01.30.927871v1.full 2/15
27/10/22, 18:11 Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag | bioRxiv
Recuperamos todas las secuencias de coronavirus disponibles (n=55) de la base de datos del
genoma viral del NCBI ( https://www.ncbi.nlm.nih.gov/ ) y usamos el GISAID ( Elbe &
Buckland-Merrett, 2017 )[ https: //www.gisaid.org/ ] para recuperar todas las secuencias
completas disponibles (n=28) de 2019-nCoV al 27 de enero de 2020. La alineación de
secuencias múltiples de todos los genomas de coronavirus se realizó mediante el software
MUSCLE ( Edgar, 2004 ) basado en el método de unión de vecinos. De los 55 genomas de
coronavirus, se usaron 32 genomas representativos de todas las categorías para el desarrollo
del árbol filogenético utilizando el software MEGAX ( Kumar et al., 2018).). Se encontró que el
pariente más cercano era el SARS CoV. La región de glicoproteína de SARS CoV y 2019-nCoV se
alinearon y visualizaron utilizando el software Multalin ( Corpet, 1988 ). La secuencia de
aminoácidos y nucleótidos identificada se alineó con la base de datos del genoma viral
completo usando BLASTp y BLASTn. Se presentó la conservación de los motivos de nucleótidos
y aminoácidos en 28 variantes clínicas del genoma 2019-nCoV mediante la realización de
múltiples alineaciones de secuencias con el software MEGAX. La estructura tridimensional de la
glicoproteína 2019-nCoV se generó utilizando el servidor en línea SWISS-MODEL ( Biasini et al.,
2014 ) y la estructura se marcó y visualizó utilizando PyMol ( DeLano, 2002 ).
Resultados
Extraña similitud de nuevos insertos en la proteína de punta 2019-nCoV con HIV-1 gp120 y Gag
https://www.biorxiv.org/content/10.1101/2020.01.30.927871v1.full 3/15
27/10/22, 18:11 Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag | bioRxiv
Figura S1
Alineación de secuencias múltiples de glicoproteínas de la familia coronaviridae , que representan los cuatro insertos.
https://www.biorxiv.org/content/10.1101/2020.01.30.927871v1.full 4/15
27/10/22, 18:11 Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag | bioRxiv
Figura 1:
https://www.biorxiv.org/content/10.1101/2020.01.30.927871v1.full 5/15
27/10/22, 18:11 Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag | bioRxiv
Figura 2:
Figura 3.
Luego analizamos todas las secuencias de longitud completa disponibles (n = 28) de 2019-
nCoV en GISAID ( Elbe & Buckland-Merrett, 2017 ) al 27 de enero de 2020 para detectar la
presencia de estos insertos. Como la mayoría de estas secuencias no están anotadas,
comparamos las secuencias de nucleótidos de la glicoproteína espiga de todas las secuencias
2019-nCoV disponibles usando BLASTp. Curiosamente, las 4 inserciones se conservaron
https://www.biorxiv.org/content/10.1101/2020.01.30.927871v1.full 6/15
27/10/22, 18:11 Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag | bioRxiv
Figura S2:
Los cuatro insertos están presentes en los 28 genomas del virus Wuhan 2019-nCoV alineados obtenidos de GISAID. La brecha en Bat-
SARS Like CoV en la última fila muestra que los insertos 1 y 4 son muy exclusivos de Wuhan 2019-nCoV.
Figura S3
Árbol filogenético del genoma de 28 aislamientos clínicos de 2019-nCoV, incluido uno de murciélago como huésped.
Luego traducimos el genoma alineado y descubrimos que estos insertos están presentes en
todos los virus Wuhan 2019-nCoV, excepto el virus 2019-nCoV de Bat como huésped [ Fig. S4
]. Intrigados por las 4 inserciones altamente conservadas exclusivas de 2019-nCoV, queríamos
comprender su origen. Para este propósito, usamos la alineación local 2019-nCoV con cada
https://www.biorxiv.org/content/10.1101/2020.01.30.927871v1.full 7/15
27/10/22, 18:11 Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag | bioRxiv
inserto como consulta contra todos los genomas de virus y consideramos aciertos con una
cobertura de secuencia del 100%. Sorprendentemente, cada uno de los cuatro insertos se
alineó con segmentos cortos de las proteínas del Virus de inmunodeficiencia humana-1 (VIH-
1). Las posiciones de aminoácidos de las inserciones en 2019-nCoV y los residuos
correspondientes en HIV-1 gp120 y HIV-1 Gag se muestran en la Tabla 1. Los primeros 3
insertos (inserto 1, 2 y 3) se alinearon con segmentos cortos de residuos de aminoácidos en
HIV-1 gp120. El inserto 4 se alineó con HIV-1 Gag. El inserto 1 (6 residuos de aminoácidos) y el
inserto 2 (6 residuos de aminoácidos) en la glicoproteína espiga de 2019-nCoV son 100 %
idénticos a los residuos asignados a HIV-1 gp120. El inserto 3 (12 residuos de aminoácidos) en
2019-nCoV se asigna a HIV-1 gp120 con lagunas [consulte la Tabla 1 ]. El inserto 4 (8
residuos de aminoácidos) mapea a HIV-1 Gag con espacios.
Figura complementaria 4.
Alineación del genoma de la familia Coronaviridae. Las secuencias negras resaltadas son las inserciones representadas aquí.
Tabla 1:
Secuencias alineadas de la proteína 2019-nCoV y gp120 del VIH-1 con sus posiciones en la secuencia primaria de la proteína. Todos los
insertos tienen una alta densidad de residuos cargados positivamente. Los fragmentos eliminados en el inserto 3 y 4 aumentan la
relación entre carga positiva y área superficial. *consulte Suplemento Tabla 1 para números de acceso
https://www.biorxiv.org/content/10.1101/2020.01.30.927871v1.full 8/15
27/10/22, 18:11 Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag | bioRxiv
La proteína Gag del VIH-1 permite la interacción del virus con la superficie del huésped
cargada negativamente ( Murakami, 2008 ) y una alta carga positiva en la proteína Gag es una
característica clave para la interacción huésped-virus. Al analizar los valores de pI para cada
una de las 4 inserciones en 2019-nCoV y los tramos correspondientes de residuos de
aminoácidos de las proteínas del VIH-1, encontramos que a) los valores de pI eran muy
similares para cada par analizado b) la mayoría de estos valores de pI fueron 10±2 [Consulte
la Tabla 1 ]. Cabe destacar que, a pesar de las lagunas en los insertos 3 y 4, los valores de pI
fueron comparables. Esta uniformidad en los valores de pI para los 4 insertos merece una
mayor investigación.
Como ninguno de estos 4 insertos está presente en ningún otro coronavirus, la región
genómica que codifica estos insertos representa candidatos ideales para diseñar cebadores
que puedan distinguir 2019-nCoV de otros coronavirus.
Los nuevos insertos son parte del sitio de unión del receptor de 2019-nCoV
https://www.biorxiv.org/content/10.1101/2020.01.30.927871v1.full 9/15
27/10/22, 18:11 Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag | bioRxiv
Se ha especulado que 2019-nCoV es una variante del coronavirus derivada de una fuente
animal que se transmitió a los humanos. Teniendo en cuenta el cambio de especificidad para
el huésped, decidimos estudiar las secuencias de la glicoproteína espiga (proteína S) del virus.
Las proteínas S son proteínas de superficie que ayudan al virus a reconocer y adherirse al
huésped. Por lo tanto, un cambio en estas proteínas puede reflejarse como un cambio en la
especificidad del huésped del virus. Para conocer las alteraciones en el gen de la proteína S de
2019-nCoV y sus consecuencias en los reordenamientos estructurales realizamos in-
sillicoanálisis de 2019-nCoV con respecto a todos los demás virus. Una alineación de
secuencias múltiples entre las secuencias de aminoácidos de la proteína S de 2019-nCoV, Bat-
SARS-Like, SARS-GZ02 y MERS reveló que la proteína S ha evolucionado con la diversidad
significativa más cercana del SARS-GZ02 ( Figura 1 ).
Dado que la proteína S de 2019-nCoV comparte ascendencia más cercana con el SARS GZ02, la
secuencia que codifica las proteínas de punta de estos dos virus se comparó utilizando el
software MultiAlin. Encontramos cuatro nuevas inserciones en la proteína de 2019-nCoV-
“GTNGTKR” (IS1), “HKNNKS” (IS2), “GDSSSG” (IS3) y “QTNSPRRA” (IS4) ( Figura 2 ). Para nuestra
sorpresa, estas inserciones de secuencias no solo estaban ausentes en la proteína S del SARS,
sino que tampoco se observaron en ningún otro miembro de la familia Coronaviridae (Figura
complementaria). Esto es sorprendente, ya que es bastante improbable que un virus haya
adquirido tales inserciones únicas de forma natural en un corto período de tiempo.
Se observó que las inserciones estaban presentes en todas las secuencias genómicas del virus
2019-nCoV disponibles de los aislados clínicos recientes ( Figura 1 complementaria ). Para
conocer la fuente de estas inserciones en 2019-nCoV, se realizó una alineación local con
BLASTp utilizando estas inserciones como consulta con todo el genoma del virus.
Inesperadamente, todas las inserciones se alinearon con el Virus de inmunodeficiencia
humana-1 (VIH-1). Un análisis adicional reveló que las secuencias alineadas de VIH-1 con 2019-
nCoV se derivaron de la glicoproteína de superficie gp120 (posiciones de la secuencia de
aminoácidos: 404-409, 462-467, 136-150) y de la proteína Gag (366-384 aminoácidos) ( tabla
1). La proteína gag del VIH está implicada en la unión a la membrana del huésped, el
empaquetamiento del virus y la formación de partículas similares a virus. Gp120 juega un
papel crucial en el reconocimiento de la célula huésped al unirse al receptor primario CD4.
https://www.biorxiv.org/content/10.1101/2020.01.30.927871v1.full 10/15
27/10/22, 18:11 Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag | bioRxiv
Esta unión induce reordenamientos estructurales en GP120, creando un sitio de unión de alta
afinidad para un correceptor de quimioquinas como CXCR4 y/o CCR5.
Discusión
Conclusiones
https://www.biorxiv.org/content/10.1101/2020.01.30.927871v1.full 11/15
27/10/22, 18:11 Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag | bioRxiv
Referencias
↵Beniac , DR , Andonov , A. , Grudeski , E. y Booth , TF ( 2006 ). Arquitectura del pico de prefusión del coronavirus del SARS .
Nature Structural and Molecular Biology , 13 ( 8 ), 751 – 752 . https://doi.org/10.1038/nsmb1123 Google Académico
↵Bosch , BJ , van der Zee , R. , de Haan , CAM y Rottier , PJM ( 2003 ). La proteína de punta de coronavirus es una proteína de
fusión de virus de clase I: caracterización estructural y funcional del complejo central de fusión . Diario de Virología , 77 ( 16 ), 8801
– 8811 . https://doi.org/10.1128/jvi.77.16.8801-8811.2003 Resumen / Texto Completo GRATIS Google Académico
↵Chan , JF-W. , Kok , K.-H. , Zhu , Z. , Chu , H. , To , KK-W. , Yuan , S. y Yuen , K.-Y. ( 2020 ). Caracterización genómica del nuevo
coronavirus patógeno humano de 2019 aislado de un paciente con neumonía atípica después de visitar Wuhan . Microbios e
infecciones emergentes , 9 ( 1 ), 221 – 236 .https://doi.org/10.1080/22221751.2020.1719902 Google Académico
↵Chan , JFW , Lau , SKP , To , KKW , Cheng , VCC , Woo , PCY y Yuen , K.-Y. ( 2015 ). Coronavirus del síndrome respiratorio de
Oriente Medio: otro betacoronavirus zoonótico que causa una enfermedad similar al SARS . https://doi.org/10.1128/CMR.00102-14
Google Académico
↵Chan , J. , To , K. , Tse , H. , Jin , D. , microbiología , KY-T. en, & 2013, indefinido . (Dakota del Norte). Transmisión entre especies y
aparición de nuevos virus: lecciones de murciélagos y aves . Elsevier . Google Académico
↵Corpet , F. ( 1988 ). Alineación de secuencias múltiples con agrupamiento jerárquico . Investigación de ácidos nucleicos .
https://doi.org/10.1093/nar/16.22.10881 Google Académico
https://www.biorxiv.org/content/10.1101/2020.01.30.927871v1.full 12/15
27/10/22, 18:11 Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag | bioRxiv
↵DeLano , WL ( 2002 ). El sistema de gráficos moleculares PyMOL, versión 1.1 . Schr{ö}dinger LLC .
https://doi.org/10.1038/hr.2014.17 Google Académico
↵Du , L. , Zhao , G. , Kou , Z. , Ma , C. , Sun , S. , Poon , VKM , Lu , L. , Wang , L. , Debnath , AK , Zheng , B.-J. , Zhou , Y. y Jiang , S.
( 2013 ).Identificación de un dominio de unión al receptor en la proteína S del nuevo coronavirus humano Coronavirus del
síndrome respiratorio de Oriente Medio como objetivo esencial para el desarrollo de vacunas . Diario de Virología , 87 ( 17 ), 9939
– 9942 . https://doi.org/10.1128/jvi.01048-13 Resumen / Texto Completo GRATIS Google Académico
↵Edgar , RC ( 2004 ). MÚSCULO: Alineación de secuencias múltiples con alta precisión y alto rendimiento . Investigación de ácidos
nucleicos . https://doi.org/10.1093/nar/gkh340 Google Académico
↵Elba , S. y Buckland-Merrett , G. ( 2017 ). Datos, enfermedad y diplomacia: la contribución innovadora de GISAID a la salud mundial
. Desafíos globales . https://doi.org/10.1002/gch2.1018 Google Académico
↵Kumar , S. , Stecher , G. , Li , M. , Knyaz , C. y Tamura , K. ( 2018 ). MEGA X: análisis de genética evolutiva molecular en
plataformas informáticas . Biología Molecular y Evolución . https://doi.org/10.1093/molbev/msy096 Google Académico
↵Li , F. ( 2016 ). Estructura, función y evolución de las proteínas de pico de coronavirus . Revisión anual de virología , 3 ( 1 ), 237 – 261
. https://doi.org/10.1146/annurev-virology-110615-042301 Google Académico
↵Murakami , T. ( 2008 ). Papeles de las interacciones entre las proteínas Env y Gag en el ciclo de replicación del VIH-1 . Microbiología
e Inmunología , 52 ( 5 ), 287 – 295 . https://doi.org/10.1111/j.1348-0421.2008.00008.x Referencia cruzada PubMed
Google Académico
↵Ou , X. , Guan , H. , Qin , B. , Mu , Z. , Wojdyla , JA , Wang , M. , Dominguez , SR , Qian , Z. y Cui , S. ( 2017 ). Estructura cristalina
del dominio de unión al receptor de la glicoproteína espiga del betacoronavirus humano HKU1 . Comunicaciones de la Naturaleza .
https://doi.org/10.1038/ncomms15216 Google Académico
↵Snijder , EJ , van der Meer , Y. , Zevenhoven-Dobbe , J. , Onderwater , JJM , van der Meulen , J. , Koerten , HK y Mommaas , AM (
2006 ). Ultraestructura y origen de las vesículas de membrana asociadas con el complejo de replicación del coronavirus del
síndrome respiratorio agudo severo . Diario de Virología , 80 ( 12 ), 5927 – 5940 .https://doi.org/10.1128/JVI.02501-05
Resumen / Texto Completo GRATIS Google Académico
↵Zhou , P. , Yang , X.-L. , Wang , X.-G. , Hu , B. , Zhang , L. , Zhang , W. , Si , H.-R. , Zhu , Y. , Li , B. , Huang , C.-L. , Chen , H.-D. ,
Chen , J. , Luo , Y. , Guo , H. , Jiang , R.-D. , Liu , M.-Q. , Chen , Y. , Shen , X.-R. , Wang , X. , … Shi , Z.-L. ( 2020 ).
Descubrimiento de un nuevo coronavirus asociado con el reciente brote de neumonía en humanos y su posible origen en
murciélagos . BioRxiv . https://doi.org/10.1101/2020.01.22.914952 Google Académico
Volver arriba
Anterior próximo
https://www.biorxiv.org/content/10.1101/2020.01.30.927871v1.full 13/15
27/10/22, 18:11 Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag | bioRxiv
Biología evolucionaria
Áreas Temáticas
Bioquímica
Bioingeniería
Bioinformática
Biofísica
Biología Celular
Ensayos clínicos*
Ecología
Epidemiología*
Biología evolucionaria
Genética
genómica
Inmunología
Microbiología
Biología Molecular
neurociencia
Paleontología
Patología
Farmacología y Toxicología
https://www.biorxiv.org/content/10.1101/2020.01.30.927871v1.full 14/15
27/10/22, 18:11 Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag | bioRxiv
Fisiología
biología vegetal
Biología sintética
Biologia de sistemas
Zoología
https://www.biorxiv.org/content/10.1101/2020.01.30.927871v1.full 15/15