Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Los alineamientos globales, que intentan alinear cada residuo de cada secuencia, son ms
tiles cuando las secuencias problema iniciales son similares y aproximadamente del mismo
tamao (no quiere decir que los alineamientos globales no puedan terminar en huecos). Una
estrategia general de alineamiento global es el algoritmo Needleman-Wunsch basado en
programacin dinmica. Los alineamientos locales son ms tiles para secuencias
diferenciadas en las que se sospecha que existen regiones muy similares o motivos de
secuencias similares dentro de un contexto mayor. El algoritmo Smith-Waterman es un
mtodo general de alineamiento local basado en programacin dinmica. Con secuencias
suficientemente similares, no existe diferencia entre alineamientos globales y locales.
Los mtodos hbridos, conocidos como semiglobales o mtodos "glocales" intentan encontrar
el mejor alineamiento posible que incluya el inicio y el final de una u otra secuencia. Puede ser
especialmente til cuando la parte "corriente arriba" de una secuencia se solapa con la parte
"corriente abajo" de la otra. En este caso, ni el alineamiento global ni el local son
completamente adecuados: un alineamiento global intentar forzar a la alineacin a
extenderse ms all de la regin de solapamiento, mientras que el alineamiento local no
cubrir totalmente la regin solapada.
DOT PLOT
Para ver si hay indels, repeticiones, inversiones.
NEEDLEMAN WUNSCH
AGACTAGTTAC
CGAGACGT
Para encontrar el alineamiento con el puntaje ms alto, una matriz bidimensional es asignada. Esta
matriz a menudo es llamada matriz F y su (i,j)sima entrada frecuentemente es denotada Fij . All
hay una columna para cada carcter de la secuencia A, y una fila para cada caracter de
la secuencia B. As si estamos alineando secuencias de tamaos n y m, el tiempo de ejecucin
del algoritmo es O(nm) y la cantidad de memoria utilizada es O(nm).
SCORE GLOBAL
MOTIVOS Y PATRONES: Generalmente, un motivo tiene mayor definicin de los residuos que lo
componen, mientras que los patrones son posibles combinaciones de distintos tipos de residuos
[AC]-x-V-x(4)-{ED}
This pattern is translated as: [Ala or Cys]-any-Val-any-any-any-any-{any but Glu or Asp}
< A-x-[ST](2)-x(0,1)-V
This pattern, which must be in the N-terminal of the sequence (`<'), is translated as: Ala-any-
[Ser or Thr]-[Ser or Thr]-(any or none)-Val
<{C}*>
This pattern describes all sequences which do not contain any Cysteines.
PROFILE: Matriz de sustitucin especfica para cada posicin de la secuencia (position specific
scoring matrix).
Dimensiones 20xL (L, longitud del patrn).
Tiene en cuenta la frecuencia de los aminocidos en cada posicin, as como sus propiedades
fsico-qumicas.
Descripcin cuantitativa del motivo.
ui log 2 f i
N N
Mi
i 1 M
ui f u
i 1
i i
M
U f i log 2 f i
i 1
LOCAL COMPOSITION COMPLEXITY ( Se hace con tamao de ventana, es decir la ecuacin
anterior se usa para toda la composicin, esta ecuacin se usa por ejemplo para una ventana de
15 nucleotidos avanzando luego de a un nucletido para obtener un grafico)
M
LCC y f i log 2 f i
i 1
Donde Rsecuencia(L)
(contenido informativo de la columna)
ABUNDANCIA RELATIVA (GENOMIC SIGNATURE)
f
XY XY
f f
X Y
Donde:
EJEMPLO
f
GT GT
f f
G T
Parches cortos (entre 100 bp y varios kb) ricos en %G+C pueden tener significado biolgico Los
exones y mas marcadamente la regin promotora se suelen desmarcar de su entorno mediante un
G+C mas alto Las retro-transposones Alus son ricas en G+C Un regin rica en G+C en una
Bacteria rica en A+T puede indicar un evento de transferencia horizontal Isocoras en los
genomas de muchos mamferos
Prediccin de zinc fingers basada en la frecuencia de H y C y la distribucin