Está en la página 1de 5

Alineamiento múltiple

 Cuando deseas conocer el papel de cada aminoácido o nucleótido que


contiene.
 Son útiles para la predicción de estructuras de proteínas, central para la
predicción de la función de la proteína y para el análisis filogenético.
 Buenos modelos estructurales, mejores predicciones funcionales, mejores
arboles filogenéticos.
 Programas:
o CrustalW
o MUSCLE
o Tcoffee
 Sirve para estudiar una familia de secuencia en la que todas las secuencias
comparten el mismo ancestro en común.
 Herramientas de montaje de secuencias especializadas
o Phred
o Phrap
o cap3
 Cuatro criterios importantes de un alineamiento múltiple:
o Similitud estructural: Aminoácidos que cumplen el mismo rol en
cada estructura están en la misma columna. (Programas)
o Similitud evolutiva: Aminoácidos o nucleótidos relacionados con el
mismo aminoácido en común con el sucesor de todas las secuencias
se colocan en la misma columna. (No programas que lo realicen
automáticamente)
o Similitud de funcionalidad: Aminoácidos con la misma función
están en la misma columna. (No programas que lo realicen
automáticamente)
o Similitud de secuencia: Aminoácidos en la misma columna son los
que proporcionan una máxima similitud. Cuando las secuencias
están íntimamente relacionadas, su estructura, evolución y
funcionales son similares y equivalente a su similitud en secuencia.
(Programas)

 Aplicaciones:
o Extrapolación: Ayuda a convencer de que una secuencia sin
caracterizar es realmente un miembro de una familia de proteínas.
(Alineamientos más informativos con secuencias de Swiss-Prot, se
utiliza ExPASyBLAST: www.Expasy.ch/tools/blast/)

o Análisis filogenético: Permite construir la historia evolutiva de esas


proteínas (Pasteur Phylip server).
www.bioweb.pasteur.fr/seqanal/phylogeny/phylip-uk.html)

o Identificación del patrón: Para descubrir posiciones muy


conservadas, se puede identificar una región que es característica de
la función (Logo server:
www.lmmb.ncifcrf.gov/~toms/sequencelogo.html)

o Predicción de la estructura: Permite convertir un alineamiento


múltiple en un perfil que describa a una familia de proteínas o un
dominio de una proteína (PSSM), que pueda usarse en una base de
datos de escaneo para los nuevos miembros de la familia. (NCBI-
BLAST, realiza un PSSM:
( www.ncbi.nlm.nih.gov/blast/blastcgihelp.shtml#pssm)

o Elementos reguladores del ADN: Se puede convertir un


alineamiento múltiple de ADN de un sitio de unión en una matriz de
peso y escanear otras secuencias para sitios de unión similares
(Gibbs: www.bayesweb.wadsworth.org/gibbs/gibbs.html)

o Análisis nsSNP: Varios alelos de genes poseen diferentes


secuencias de aminoácidos. Puede predecir si un Non-Synonymous
Single-Nucleotide Polymorphism sería nocivo.
(SIFT: www.blocks.fhcrc.org/sift/SIFT.html)

o Análisis de PCR: Ayuda a identificar las posiciones menos


degeneradas de una familia de proteínas con la finalidad de
encontrar nuevos miembros por PCR
(www.blocks.fhcrc.org/codehop.html.)

 Análisis:
o Los sitios más conservados son los más importantes para la función.
o Entre mayor numero de secuencias usadas mayor seguridad de las
posiciones más importantes.

 Pasos del alineamiento múltiple:


o Elegír las secuencias correctas y pocas:
 10-15 secuencias son suficientes.
o Elegir correctamente el programa o método para el alineamiento
múltiple.
 Ninguno es perfecto, todos usan aproximaciones.
o Evaluar la calidad del alineamiento visual:
 Conservar un alineamiento que muestre bloques altamente
conservados.
 Si cada secuencia son 30 y 70 porciento idénticas a más de la
mitad de las secuencias del set. (Denota nueva información y
calidad).
o Nombrar correctamente las secuencias
 No muy largos, no espacios en blanco, no símbolos
especiales.
o Recolección de secuencias:
 Búsqueda de homólogos con BLAST, que sirve para
identificar de bases de datos que son similares a la secuencia
de estudio.
 3 softwares:
 www.expasy.ch/tools/blast/
 npsa-pbil.ibcp.fr/cgi-bin/ npsa_automat.pl?page=
npsa_blast.html
 srs.ebi.ac.uk
o Reducir redundancia de las secuencias:
 Seleccionar las mas relevantes para el estudio con Reduce
redundancy https://web.expasy.org/decrease_redundancy/

o Buscar motivos conservados de mis secuencias sin realizar un


alineamiento:
 Pratt
https://web.expasy.org/pratt/
 Es una herramienta para descubrir patrones
conservados en un conjunto de secuencias de
proteínas.
 CrustalW: https://www.ebi.ac.uk/Tools/msa/clustalo/

 3 parametros que pueden cambiar el alineamiento:


 Matrices de sustitución: controlan el coste de las
mutaciones en los alineamientos de secuencias.
(BLOSUM o PAM)
 Penalizaciones por gap de apertura (GOP) controlan el
costo de abrir gaps en el alineamiento.
 Gap-extensión de control de penas: controla el tamaño
de los gaps.
 Tcoffee: www.tcoffee.org

 Se produce alineamientos más precisos a costa de un poco


más de tiempo en funcionamiento.
Es su capacidad para secuencias y estructuras de alineación,

incorporar toda la información estructural disponible en su
alineación. Se producen las mejores alineaciones de la
secuencia de las estructuras están disponibles. (EXPRESSO)
 La posibilidad de evaluar la exactitud de una alineación,
evaluar la fiabilidad de un alineamiento múltiple existente.
(CORE)
 La posibilidad de combinar muchos múltiples alineamientos de
secuencias en uno (Mcoffee).
 phylogenetic_tree: The true phylogenetic tree in Newick
format,
 generated from the Tcoffee multiple alignment by using the
NeighborJoining method. This is not a guide tree but a real
 phylogenetic tree.
 MUSCLE www.drive5.com/muscle/

o Paquete eficiente para hacer rápido y de alta calidad alineamiento


múltiples.
o Es ideal si desea alinear varios cientos de secuencias.

 Interpretación de mi alineamiento múltiple.


o Los E-valores, nos dirán que tan relevante es la búsqueda de tus
datos.
o Se espera encontrar bloques sin huevos que correspondan a las
regiones centrales.
o * Indica una columna conservada en toda la columna
o : Indica la columna que tiene aproximadamente el mismo tamaño e
hidropatía
o . Indica la columna donde el tamaño o la hidropatía ha sido
preservada en el curso de la evolución.
o 4 o 5 posiciones conservadas pueden ser suficientes para convencer
que lo que ves es una señal.
o Conocer el tipo de aminoácido que se conserva:
 Nos brinda información de los patrones característicos de
mutaciones/conservación en el alineamiento multiple:
 Cada tipo de aminoacido corresponde a una posible
pista (Pagina 314, pdf)
o Llevar la interpretación a fondo:
 Identificar posiciones importantes.
 Encontrar los aminoácidos que no están permitidos para ser
mutados.
 Encontrar aquellos aminoácidos que se conservan aun
cuando se alinea con proteínas distantemente relacionadas
 Determinar a través de la conservación del N-terminal o el C-
terminal el mejor candidato para una unión o sitio activo.
 Gibbs sampler:
bayesweb.wadsworth.org/gibbs/gibbs.html
bioweb.pasteur.fr/seqanal/interfaces/gibbs-simple.html
Es muy bueno en la identificación HTH (hélice-giro-hélice)
dominios a través de una familia de proteínas. También es
una buena manera de buscar elementos reguladores
compartidos por secuencias de ADN que de otro modo no
estarían relacionados.
o Herramientas útiles para extraer la información de tu
alineamiento múltiple de secuencias
 Usar logos de proteínas para identificar las posiciones más
conservadas.

o
o
o

También podría gustarte