Está en la página 1de 12

30/09/13

Alineament ml0ple de seqncies. Alineaments progressius, fonaments. Matrius de distncia. ClustalW. Aplicacions del alineament ml0ple. Matrius de posici (pes) i LOGOS

Alineament ml+ple

Pairwise alignment

Mul$ple alignment

30/09/13

Comparacin de ms de una secuencia


En teora, hacer un alineamiento p0mo entre dos secuencias es fcil y rela0vamente rpido si usamos el algoritmo de Smith- Waterman.

Alinear ms de dos secuencias usando el mismo mtodo es prc+camente imposible. Este problema se incrementa exponencialmente con el nmero de secuencias a comparar.

Comparacin de ms de una secuencia


Muchos de los algoritmos para Alineamientos Ml+ples usan el Mtodo de Alineamiento Progresivo, que parte haciendo un alineamiento de pares y va adicionando a este alineamiento las otras secuencias de manera progresiva.
||||||||||||||||||||||||||||||

|||||||||||||||||||||||||||||| ||||||||||||||||||||||||||||||

Para seleccionar el orden en que alinearemos las secuencias se construye una matriz de distancias

. . . . . . . . .

30/09/13

Matriz de distancias: En bioinform0ca es una matriz que representa las distancias entre cada uno de los pares de secuencias que se quieren comparar.
Seq1 Seq2 Seq3 Seq4 Seq5 AATTACCGGCACAGCATAGCATGACAGTCAGTCAGATGAC AATTATCGGCACAGCATAGCATGTCAGTCAGTCAGATGAC GATTATGGGCACAGCATAGCATGTCAGTCAGTCACAAGAT GATTATGGGCACAGCGTAGCATGTCAGAATGTCACAAGAT GATTATGGGCAGAGCGTAGCATGTCAGTCAGTCACAAGAT
Distancia = # de mutaciones

Paquete de Programas Clustal ClustalV ClustaX ClustalW Clustal


Mtodo general empleado por el programa Clustal para construir los alineamientos 1) Alineamiento en pareja de todas las secuencias usando Programacin Dinmica. - Alineamentos 0po Global (Needleman-Wunsch) - Obtencin de matriz de distancia basada en estos alineamientos 2) Usando los scores de la matriz de distancia se construye un rbol gua ( p.ej.- Neighbor-joining UPGMA) 3) Construccin del alineamiento ml0ple por Mtodo Progresivo usando como gua el rbol Re-alineamiento global (Needleman-Wunsch) de las secuencias ms prximas en el alineamiento
[Higgins and Sharp. Gene. 1988. 73(1):237-44.] CLUSTALW program [Thompson, et al. Nucleic Acids Research, 1994]

30/09/13

Unweighted Pair Group Method with Arithme$c Mean (UPGMA).

A B 2 C 4 D 6 E 6 F 8

B 4 6 6 8

D E

6 6 8

4 8

Neighbor joining

A B C D

A 0 7 11 14

B 7 0 6 9

C 11 6 0 7

D 14 9 7 0

30/09/13

ClustalW Webservers You don't necessarily have to go through the hassle to install Clustal on your computer. Instead, you can run Clustal online on several servers on the web: EBI web server hnp://www.ebi.ac.uk/Tools/msa/clustalw2/ Swiss Ins0tute of Bioinforma0cs hnp://www.ch.embnet.org/sopware/ClustalW.html

30/09/13

Clustal W Formatos de Entrada/Salida Este programa acepta un amplio rango de formatos de entrada. NBRF/PIR, FASTA, EMBL/Swissprot, Clustal, GCC/MSF, GCG9 RSF y GDE. El formato de salida puede ser alguno de los siguientes: Clustal, NBRF/PIR, GCG/MSF, PHYLIP, GDE, NEXUS.

* The input for ClustalW is limited to a maximum of 500 sequences or to a 1MB le

Clustal W Formatos de Entrada/Salida

Input Format

>gi|315623200|gb|DQ859014.2| Homo sapiens neanderthalensis from Spain, control region, partial sequence; mitochondrial GTTCTTTCATGGGGGAGCAGATTTGGGTACCACCCAAGTATTGACTCACCCATCAGCAACC GCTATGTATTTCGTACATTACTGCCAGCCACCATGAATATTGTACAGTACCATAATTACTT GACTACCTGCAGTACATAAAAACCTAATCCACATCAAACCCCCCCCCCCATGCTTACAAGC AAGCACAGCAATCAACCTTCAACTGTCATACATCAACTACAACTCCAAAGACGCCCTTACA CCCACTAGGATATCAACAAACCTACCCACCCTTGACAGTACATAGCACATAAAGTCATTTA CCGTACATAGCACATTACAGTCAAATCCCTTCTCGCCCCCATGGATGACCCCCCTCAGATA GGGGTCCCTTGAT >gi|315623200|gb|DQ859014.2| Homo sapiens neanderthalensis from Spain, control region, partial sequence; mitochondrial GTTCTTTCATGGGGGAGCAGATTTGGGTACCACCCAAGTATTGACTCACCCATCAGCAACC GCTATGTATTTCGTACATTACTGCCAGCCACCATGAATATTGTACAGTACCATAATTACTT GACTACCTGCAGTACATAAAAACCTAATCCACATCAAACCCCCCCCCCCATGCTTACAAGC AAGCACAGCAATCAACCTTCAACTGTCATACATCAACTACAACTCCAAAGACGCCCTTACA CCCACTAGGATATCAACAAACCTACCCACCCTTGACAGTACATAGCACATAAAGTCATTTA CCGTACATAGCACATTACAGTCAAATCCCTTCTCGCCCCCATGGATGACCCCCCTCAGATA GGGGTCCCTTGAT

ClustalW

Concatenated FASTA Sequence Format

Output Format
alignment .aln .gcg .phylip .nexus .pir .gde .fasta tree .dnd

30/09/13

Iden0cacin de si0os conservados o semi-conservados. Eje. Prediccin del si0o ac0vo de una enzima

Aplicacin de Alineamientos ml0ples

Semi-conserved subs0tu0ons Same size OR same hydropathy Conserved subs0tu0ons Same size AND same hydropathy Iden0cal in all sequences

Aplicaciones de los alineamiento ml0ples


Detectar mo0vos o regiones conservadas con funcin comn Iden0cacin del si0o de unin al ribosa RBS en bacterias

30/09/13

Aplicaciones de los alineamiento ml0ples


Construccin de matrices de posicin o peso (Posi0on weight matrices PWM) y LOGOS para iden0car mo0vos en otras secuencias

Binding sites

ACCCGTT ACCGGTT ACAGGAT ACCGGTT ACATGAT


1 2 3 4 5 6 7

PWM

5 0 2 0 0 2 0 A 0 5 3 1 0 0 0 C 0 0 0 3 5 0 0 G 0 0 0 1 0 3 5 T

hnp://weblogo.berkeley.edu/logo.cgi

Aplicaciones de los alineamiento ml0ples


Posi0on Weight Matrices y LOGOS Ejemplo: Iden0cacin del si0o de splicing durante la eliminacin de intrones

These logos show a small sample of Human intron-exon splice boundaries. Sequences of experimentally conrmed genes were extracted from EID: the Exon-Intron database.

30/09/13

Aplicaciones de los alineamiento ml0ples


Iden0cacin de mo0vos proteicos
ADHE_CLOAB FUCO_ECOLI GLDA_BACST GLDA_ECOLI MEDH_BACMT ADH1_CLOAB ADHE_ECOLI ADH2_ZYMMO ADH4_YEAST ADHA_CLOAB ADHB_CLOAB ( ( ( ( ( ( ( ( ( ( ( 720) 262) 259) 269) 259) 258) 721) 261) 263) 266) 266) CHSMAIKLSSEHNIPSGIANAL 66 VHGMAHPLGAFYNTPHGVANAI 44 HNGFTALEGEIHHLTHGEKVAF 100 VHNGLTAIPDAHHYYHGEKVAF 100 VHSISHQVGGVYKLQHGICNSV 78 CHSMAHKTGAVFHIPHGCANAI 47 CHSMAHKLGSQFHIPHGLANAL 47 VHAMAHQLGGYYNLPHGVCNAV 36 VHALAHQLGGFYHLPHGVCNAV 41 CHPMEHELSAYYDITHGVGLAI 50 VHLMEHELSAYYDITHGVGLAI 49

Aplicaciones de los alineamiento ml0ples


Estructura secundaria del RNA

30/09/13

Aplicaciones de los alineamiento ml0ples


Establecer relaciones logen0cas

Aplicaciones de los alineamiento ml0ples


Inferencias Evolu0vas Eje. Presin selec0va actuando sobre la poblacin (Alineamientos de codones)

10

30/09/13

Aplicaciones de los alineamiento ml0ples (Protenas)


Prediccin de estructura

Aplicaciones de los alineamiento ml0ples


Detectar regiones de variabilidad relacionadas con estructura

11

30/09/13

Fast

12

También podría gustarte