Está en la página 1de 8

Alineamientos múltiples

Revisar antes de la clase:


1. ¿Qué es un alineamiento múltiple?
Un alineamiento múltiple es una colección de tres o más secuencias de aminoácidos o nucleótidos
parcial o completamente alineados.
 Residuo: secciones homólogas de las secuencias, en un sentido
 Evolutivo: presumiblemente provenientes de un ancestro común
 Estructural: suelen ocupar lugares relevantes en la estructura 3D
http://vis.usal.es/rodrigo/documentos/bioinfo/temas/5_Alineamientos%20m%C3%BAltiples.pdf
2. Menciones tres aplicaciones de los alineamientos múltiples.
Las aplicaciones más habituales de los alineamientos múltiples son:
 La reconstrucción filogenética,
 el análisis estructural de proteínas,
 la búsqueda de dominios conservados y
 la búsqueda de regiones conservadas en promotores.
 Dar información acerca de la función, estructura y evolución de
 una secuencia
 Al conocer cómo se alinea respecto a un grupo de secuencias
 Válido para análisis de genes, proteínas o poblaciones
 Encontrar miembros distantes de una familia de proteínas
 Es muy frecuente que estén distantes, y el alineamiento de pares no suele ser lo
suficientemente preciso para encontrarlos
 Clasificación y generación de BBDD de proteínas una vez secuenciado el genoma completo
de un organismo
 Primer paso (y el más importante) en la generación de árboles filogenéticos
3. ¿Qué características deben tener las secuencias usadas en un alineamiento múltiple?
4. La estrategia de alineamientos usada por CLUSTAL Omega
(https://www.ebi.ac.uk/Tools/msa/clustalo/) se puede dividir en tres pasos: Alineamientos globales
pareados, cálculo del árbol guía, creación del alineamiento múltiple. Estudie cada uno de estos pasos
para comprender como funciona CLUSTAL Omega.
5. Una vez que tiene sus secuencias listas y realiza el alineamiento múltiple, ¿cuál es el paso crítico
para que este sea exitoso?

Actividad en el aula:
Ingrese a la página de Clustal Omega https://www.ebi.ac.uk/Tools/msa/clustalo/, revise la documentación
asociada al programa.

Ejercicio.
La proteina mitocondrial llamada Frataxina, involucrada en enfermedad de ataxia de Friedreich en humanos,
condición autosomica reseva. La Frataxina esta involcrada en el metabolismo del hierro y se ha encontrado
en organismos eucariotas y en algunas bacterias. En este ejercicio, se desea comparar la secuecia proteica de
varias especies y discutir la similitud entre ellas. Se le solicita a usted como estudiante del curso de
bioinformática, realizar un alineamiento múltiple a partir de las siguientes secuencias, útilizando el
programa Clustal Omega.

>Raton gi|6679863|ref|NP_032070.1| frataxin [Mus musculus]


MWAFGGRAAVGLLPRTASRASAWVGNPRWREPIVTCGRRGLHVTVNAGATRHAHLNLHYLQILNI
KKQSV
CVVHLRNLGTLDNPSSLDETAYERLAEETLDSLAEFFEDLADKPYTLEDYDVSFGDGVLTIKLGGDL
GTY
VINKQTPNKQIWLSSPSSGPKRYDWTGKNWVYSHDGVSLHELLARELTKALNTKLDLSSLAYSGKG
T
>Rata gi|109463707|ref|XP_001078791.1| PREDICTED: similar to Frataxin, mitochondrial precursor (Fxn)
[Rattus norvegicus]
MWTFGRRAAAGLLPRTASRASAWVRNPRGRERIGTCGRRGLHVTANADAIRHSHLNLHYLGQILNI
KKQS
VCVVHLRNSGTLGNPSSLDETAYERLAEETLDALAEFFEDLADKPYTLKDYDVSFGDGVLTIKLGG
DLGT
YVINKQTPNKQIWLSSPSSGPKRYDWTGKNWVYSHDGVSLHELLARELTEALNTKLDLSSLAYSGK
GT
>Perro gi|158262735|ref|NP_001103428.1| frataxin [Canis lupus familiaris]
MWTLGRRAAAGLLPRSAPPGSAAAGAGTRGPTRAAPLHGGRGLRVGTGAARGPSHANLSLHHLN
QLVNVK
KQSVCLMNMRTVGTVSSPGSLDETTYERLAETTLDSLAEFFEDLADKPYTLEDYDVSFGSGVLTVK
LGGD
LGTYVINKQTPNKQIWLSSPSSGPKRYDWTGKNWVYSHDGVSLHELLATELTKAFKIKLDLSSLAYS
GKG
T
>Rhesus gi|109111727|ref|XP_001093449.1| PREDICTED: similar to frataxin isoform 1 preproprotein
[Macaca mulatta]
MWTFGRRAVAGLLASPSPAQAQTLTRAPRLAELAQLCSRRGLRTGINATCTTHHTSSNLRGLNQIRN
VKR
QSVYLMNLRKSGTLGHPGSLDDTTYERLAEETLDSLAEFFEDLADKPYTFEDYDVSFGSGVLTVKL
GGDL
GTYVINKQTPNKQIWLSSPSSGPKRYDWTGKNWVYSHDGVSLHELLGAELTKALKTKLDLSSLAYS
GKDA
>Hombre gi|31077081|ref|NP_000135.2| frataxin isoform 1 preproprotein [Homo sapiens]
MWTLGRRAVAGLLASPSPAQAQTLTRVPRPAELAPLCGRRGLRTDIDATCTPRRASSNQRGLNQIWN
VKK
QSVYLMNLRKSGTLGHPGSLDETTYERLAEETLDSLAEFFEDLADKPYTFEDYDVSFGSGVLTVKL
GGDL
GTYVINKQTPNKQIWLSSPSSGPKRYDWTGKNWVYSHDGVSLHELLAAELTKALKTKLDLSSLAYS
GKDA
>Caballo gi|149736956|ref|XP_001490501.1| PREDICTED: similar to frataxin [Equus caballus]
MIYRSPAAISGLGERVDVWRERAAPCLARGRAIPSVSRLLPSPGKRGIVSRSASAGKGTGKGREGGQ
SSS
LHFLSQILNVKKQSVCVMHLRTTGTLGDPGSLDETTYERLAEETLDSLAEFFEDLADKPYTFEDYD
VSFG
SGVLTIKMGGDLGTYVINKQTPNKQIWLSSPSSGPKRYDWTGKNWVYSHDGVSLHELLAAELTKA
LKTKL
DLSSLAYSGKGT
>Macaco gi|62510646|sp|Q8HXX9|FRDA_MACFA Frataxin, mitochondrial precursor (Fxn)
MWTFGRRAVAGLLASPSPAQAQTLTRAPRLAELAQLCSRRGLRTGINATRTTHHTSSNLRGLNQIRN
VKR
QSVYLMNLRKSGTLGHPGSLDDTTYERLAEETLDSLAEFFEDLADKPYTFEDYDVSFGSGVLTVKL
GGDL
GTYVINKQTPNKQIWLSSPSSGPKRYDRTGKNWVYSHDGVSLHELLGAELTKALKTKLDLSSLAYS
GKDA
>Vaca gi|123959744|ref|NP_001074196.1| hypothetical protein LOC505694 [Bos taurus]
MWTLGRRSVASFLPRSALPGFAPTRAGAPRPAKDLSLSGLPGLRIGTAKAPARSQSSLSLRCLNQTLD
VK
KQSVCWINLRTAGTLGDAGTLDDTTYERLAEETLDSLAEFFEDLADKPYTFEDYDVSFGSGVLTVK
LGGD
LGTYVINKQTPNKQIWLSSPSSGPKRYDWTGRNWVYSHDGVSLHELLATELTQALKTKLDLSALAY
SGKD
TCCPAQC
>Chimpance gi|114624942|ref|XP_001137864.1| PREDICTED: frataxin [Pan troglodytes]
MWTLGRRAVAGLLASPSPAQAQTLTRVPRPAELAPLCGRRSLRTGIDATCTPRRASSNLRGLNQIWN
VKK
QSVYLMNLRKSGTLGHPGLLGSNPYERLAEETLDFLAEFFEDLADKPYTFEDYDVSFGSGVLTVKL
GGDL
GTYVINKQTPNKQIWLSSPSSGPKRYDWTGKNWVYSHDGVSLHELLAAELTKALKTKLDLSSLAYS
GKDA

Para el análisis copie las secuencias en siguiente espacio “sequence in any supported format”. Corra el
programa con los parametros por defecto. Dar clic en “submit”. La página de resultados presenta
diferentes pestañas, explore cada una, interprete el alineamiento que acaba de realizar y responda:

1. ¿Que puede concluir acerca de los residuos conservados y la similitud entre el grupo de secuencias?
2. Una vez realizado el alineamiento múltiple, describa el dominio conservado entre las secuencias de
proteina, correspondiente a Frataxina en diferentes especies, puede ayudarse del NCBI.
3. En la pestaña “Phylogenetic Tree” aparece un cladograma, defina este concepto y explique (teniendo
en cuenta como funciona Clustal) que representa el arbol observado y como fue reconstruido.
4. Realice una alineamiento múltiple con la misma proteína en los siguientes organismos

>Hombre gi|1218024|gb|AAA98508.1| frataxin [Homo sapiens]


MWTLGRRAVAGLLASPSPAQAQTLTRVPRPAELAPLCGRRGLRTDIDATCTPRRASSNQRGL
NQIWNVKK
QSVYLMNLRKSGTLGHPGSLDETTYERLAEETLDSLAEFFEDLADKPYTFEDYDVSFGSGVL
TVKLGGDL
GTYVINKQTPNKQIWLSSPSSGPKRYDWTGKNWVFSHDGVSLHELLAAELTKALKTKLDLS
WLAYSGKDA
>Drosophila gi|17647048|ref|NP_511094.1| frataxin-like CG8971-PA [Drosophila melanogaster]
MFAGRLMVRSIVGRACLATMGRWSKPQAHASQVILPSTPAIAAVAIQCEEFTANRRLFSSQIE
TESTLDG
ATYERVCSDTLDALCDYFEELTENASELQGTDVAYSDGVLTVNLGGQHGTYVINRQTPNKQI
WLSSPTSG
PKRYDFVGTVAAGRWIYKHSGQSLHELLQQEIPGILKSQSVDFLRLPYCS
>Abeja gi|66536649|ref|XP_625012.1| PREDICTED: similar to frataxin-like CG8971-PA [Apis
mellifera]
MLLTRGTIKHSVFKILSYDLVKSIINKCLIQEINVKCQTNIGYHILHFKKNLNINKDLKILSYESI
AHNH
CNKNLFIISSNNLSTQELTSVQFEKVSDETLTSLTEYFDELVEQAIHLSDADVSYGDGVLTIKF
GDTHGT
YVINRQSPNRQIWLSSPKSGPKRYDFIDGKWIYKYDRKTLHELLDDEIPAIIGNQTNFNKCSFS
GK
>Escarabajo harina gi|91091522|ref|XP_969887.1| PREDICTED: similar to CG8971-PA [Tribolium
castaneum]
MFAFRSFFRAGRALAPFAHFRHLHSCTIQVLRAPNVQNSANLVFRLCSTQPLEVDASTFEKA
CDETLESL
TEYFEQIVEEADNLKTADVAYTSGVLTVNLGPEYGTYVINRQSPNRQIWLSSPVSGPKRYDFV
VRDQSWV
YKHDGRTLHRLLQDEISRIVKIDVNFADCSYGKL
>Esquistosoma gi|76156615|gb|AAX27787.2| SJCHGC08926 protein [Schistosoma japonicum]
GFTKLYCTDSLSGAEYERVSTRTLESLAETFEQLPEQFPLTKEYDVEHAYGVLKVTFGPSIGT
YIINRQA
PNKQLWLSSPISGPKRYDYVPSVCLWIYKHDGKSLHSLLSEEISTIVGGRVEFQS
>Nematodo gi|157751916|ref|XP_001679670.1| Hypothetical protein CBG02538 [Caenorhabditis
briggsae]
MLTNVLRNGFVRRAFSVRVFSQNEYESAADSTLEKLSDYFDQIADSYPVSDQFDVSHAMGV
LTVTVSKTV
GTYVINKQSPNKQIWLSSPLSGPKRYDLAEEQSWKYSHDGENLDELLNREFRKILGDDRIDF
SRHV
>Levadura1 gi|50419243|ref|XP_458144.1| hypothetical protein DEHA0C11616g [Debaryomyces
hansenii CBS767]
MFRQVLKVSHRRVVPSIARTTRLVPVLRRPSPNLCISTRSYAFSTEGEAFDDKVDSLSLGQYN
NISNEYL
ETLADELEMLSEDYPQIDCELTQGVMTLSVPPNGTYVINKQPPNKQIWLSSPISGPKRYDLIG
GKWITLR
DGSALTTLLEEEISVALEGAFHFEGIEN
>Ameba gi|66800591|ref|XP_629221.1| hypothetical protein DDBDRAFT_0191848 [Dictyostelium
discoideum AX4]
MIFNFLNKASNKTHTKLLLFSSIRNRILINNISSTSKWSSINNNNKQSSVSKTNIFIITTHNKQQ
QQLSK
SFSTINNNTKPISDVNLFHDIVDEEFELFVDRLEILSEANTCEGFEVEGNDGVLTIIVGNKGTY
VINKQT
PNRQIWWSSPLSGPKRFDYDSVEKRWVDNRDGTPLRQLLNSEINTLCKYDMEI

5. Compare con los resultados del anterior ejercicio e interpretelos, que puede concluir?, es relevante la
comparación usando esta proteina en estos organismos, por que?

También podría gustarte