Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Jesús Fernández C.
Cinvestav-Zacatenco
1 Motivos y Dominios
Introducción
Identicación de motivos y dominios en alineamiento múltiple de
secuencias
Usando expresiones regulares en las bases de datos
Usando modelos estadísticos en las bases de datos
Descubrimiento de motivos en secuencias no alineadas
Motivos reguladores en secuencias de ADN
Proles
El problema de hallar motivos.
Motif Finding Problem.
Median String Problem.
Search Trees
Motif Problem
Median String Problem
Introducción
Introducción
1 Motivos y Dominios
Introducción
Identicación de motivos y dominios en alineamiento múltiple de
secuencias
Usando expresiones regulares en las bases de datos
Usando modelos estadísticos en las bases de datos
Descubrimiento de motivos en secuencias no alineadas
Motivos reguladores en secuencias de ADN
Proles
El problema de hallar motivos.
Motif Finding Problem.
Median String Problem.
Search Trees
Motif Problem
Median String Problem
1 Motivos y Dominios
Introducción
Identicación de motivos y dominios en alineamiento múltiple de
secuencias
Usando expresiones regulares en las bases de datos
Usando modelos estadísticos en las bases de datos
Descubrimiento de motivos en secuencias no alineadas
Motivos reguladores en secuencias de ADN
Proles
El problema de hallar motivos.
Motif Finding Problem.
Median String Problem.
Search Trees
Motif Problem
Median String Problem
1 Motivos y Dominios
Introducción
Identicación de motivos y dominios en alineamiento múltiple de
secuencias
Usando expresiones regulares en las bases de datos
Usando modelos estadísticos en las bases de datos
Descubrimiento de motivos en secuencias no alineadas
Motivos reguladores en secuencias de ADN
Proles
El problema de hallar motivos.
Motif Finding Problem.
Median String Problem.
Search Trees
Motif Problem
Median String Problem
1 Motivos y Dominios
Introducción
Identicación de motivos y dominios en alineamiento múltiple de
secuencias
Usando expresiones regulares en las bases de datos
Usando modelos estadísticos en las bases de datos
Descubrimiento de motivos en secuencias no alineadas
Motivos reguladores en secuencias de ADN
Proles
El problema de hallar motivos.
Motif Finding Problem.
Median String Problem.
Search Trees
Motif Problem
Median String Problem
1 Motivos y Dominios
Introducción
Identicación de motivos y dominios en alineamiento múltiple de
secuencias
Usando expresiones regulares en las bases de datos
Usando modelos estadísticos en las bases de datos
Descubrimiento de motivos en secuencias no alineadas
Motivos reguladores en secuencias de ADN
Proles
El problema de hallar motivos.
Motif Finding Problem.
Median String Problem.
Search Trees
Motif Problem
Median String Problem
1 Motivos y Dominios
Introducción
Identicación de motivos y dominios en alineamiento múltiple de
secuencias
Usando expresiones regulares en las bases de datos
Usando modelos estadísticos en las bases de datos
Descubrimiento de motivos en secuencias no alineadas
Motivos reguladores en secuencias de ADN
Proles
El problema de hallar motivos.
Motif Finding Problem.
Median String Problem.
Search Trees
Motif Problem
Median String Problem
Proles
Proles
Proles
Para hacer mas difícil el problema podemos hacer que ADN mute en
cierto nucleótidos, como por ejemplo tomando los NF-kB binding sites
TCGGGGATTTCC , y se da un conjunto donde cada cadena cambia
muy poco.
Proles
Proles
Proles
Proles
1 Motivos y Dominios
Introducción
Identicación de motivos y dominios en alineamiento múltiple de
secuencias
Usando expresiones regulares en las bases de datos
Usando modelos estadísticos en las bases de datos
Descubrimiento de motivos en secuencias no alineadas
Motivos reguladores en secuencias de ADN
Proles
El problema de hallar motivos.
Motif Finding Problem.
Median String Problem.
Search Trees
Motif Problem
Median String Problem
1 Motivos y Dominios
Introducción
Identicación de motivos y dominios en alineamiento múltiple de
secuencias
Usando expresiones regulares en las bases de datos
Usando modelos estadísticos en las bases de datos
Descubrimiento de motivos en secuencias no alineadas
Motivos reguladores en secuencias de ADN
Proles
El problema de hallar motivos.
Motif Finding Problem.
Median String Problem.
Search Trees
Motif Problem
Median String Problem
1 Motivos y Dominios
Introducción
Identicación de motivos y dominios en alineamiento múltiple de
secuencias
Usando expresiones regulares en las bases de datos
Usando modelos estadísticos en las bases de datos
Descubrimiento de motivos en secuencias no alineadas
Motivos reguladores en secuencias de ADN
Proles
El problema de hallar motivos.
Motif Finding Problem.
Median String Problem.
Search Trees
Motif Problem
Median String Problem
Una vez calculado el string medio del ADN puede ser usado para
generar un prole que resuelva el problema de busqueda de motivos.
1 Motivos y Dominios
Introducción
Identicación de motivos y dominios en alineamiento múltiple de
secuencias
Usando expresiones regulares en las bases de datos
Usando modelos estadísticos en las bases de datos
Descubrimiento de motivos en secuencias no alineadas
Motivos reguladores en secuencias de ADN
Proles
El problema de hallar motivos.
Motif Finding Problem.
Median String Problem.
Search Trees
Motif Problem
Median String Problem
Search Trees
Como hemos visto hasta ahora para resolver los problemas de hallar el
motivo y encontrar la cadena mediana, es necesario manejar una gran
cantidad de información (( n − l + 1)t y k l )
Search Trees
Search Trees
Search Trees
NEXTLEAF( a, L, k )
1 for i ← L to 1
2 if ai < k
3 ai ← ai + 1
4 return a
5 ai ← 1
6 return a
Search Trees
3 output a
4 a ←NEXTLEAF(a, L, k )
5 if a = (1, 1, ..., 1)
6 return
Search Trees
Estas hojas pueden ser utilizadas para construir un árbol como el siguiente.
Search Trees
PREORDER( v)
1 output v
2 if v has children
Search Trees
Una manera iterativa de hacer esto es la siguiente.
NEXTVERTEX( a, i , L, k )
1 if i <L
2 ai +1 ← 1
3 return (a, i + 1)
4 else
5 j ← L to 1
for
6 if aj < k
7 aj ← aj + 1
8 return (a, j )
9 return (a, 0)
1 Motivos y Dominios
Introducción
Identicación de motivos y dominios en alineamiento múltiple de
secuencias
Usando expresiones regulares en las bases de datos
Usando modelos estadísticos en las bases de datos
Descubrimiento de motivos en secuencias no alineadas
Motivos reguladores en secuencias de ADN
Proles
El problema de hallar motivos.
Motif Finding Problem.
Median String Problem.
Search Trees
Motif Problem
Median String Problem
Motif Problem
Motif Problem
4 s ← NEXTLEAF(s , t , n − l + 1)
5 if Score (s , ADN ) > bestScore
9 return bestMotif
Motif Problem
O en su defecto podemos utilizar el algoritmo de NextVertex para generar
un árbol.
SIMPLEMOTIFSEARCH( ADN , t , n, l )
1 s ← (1, 1, ..., 1)
2 bestScore ← 0
3 i ←0
4 while i > 0
5 if i < t
6 (s , i ) ←NEXTVERTEX(s , i , t , n − l + 1)
7 else
8 Score (s , ADN ) > bestScore
if
9 bestScore ← Score (s , ADN )
10 bestMotif ← (s 1, s 2, ..., st )
11 (s , i ) ←NEXTVERTEX(s , i , t , n − l + 1)
12 return bestMotif
Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del 2013 53 / 58
Motivos y Dominios Motif Problem
Motif Problem
Podemos observar de los resultados para hallar la mejor puntuacion. Por
ejemplo si al primeras i posiciones de inicio t son un perl débil, puede que
no sea necesario seguir analizando esa rama, ya que lo más probable es que
los perles que se puedan generar no sean mejores que los perles que
generen las otras ramas.
BRANCHANDBOUNDMOTIFSEARCH( ADN , t , n, l )
1 s ← (1, 1, ..., 1)
2 bestScore ← 0
3 i ←0
4 while i > 0
5 if i < t
8 (s , i ) ← BYPASS(s , i , t , n − l + 1)
Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del 2013 54 / 58
Motivos y Dominios Motif Problem
Motif Problem
1 else
2 (s , i ) ←NEXTVERTEX(s , i , t , n − l + 1)
3 else
1 Motivos y Dominios
Introducción
Identicación de motivos y dominios en alineamiento múltiple de
secuencias
Usando expresiones regulares en las bases de datos
Usando modelos estadísticos en las bases de datos
Descubrimiento de motivos en secuencias no alineadas
Motivos reguladores en secuencias de ADN
Proles
El problema de hallar motivos.
Motif Finding Problem.
Median String Problem.
Search Trees
Motif Problem
Median String Problem
5 if i < l
9 (s , i ) ← BYPASS(s , i , t , 4)
1 else
2 (s , i ) ←NEXTVERTEX(s , i , t , 4)
3 else