Documentos de Académico
Documentos de Profesional
Documentos de Cultura
evolución a lo macro:
a) morfología
b) cruzas viables
c) registro fósil
evolución a lo micro:
comparación de secuencias de proteínas y ácidos nucleicos
se busca información sobre su estructura, conformación y localización
a 1000 bp por proteína à E. coli debería tener ~4600 ORF (vs. 4400)
y nosotros, 3 millones … un error de dos órdenes de magnitud
Se puede incluir una penalización para inserciones/deleciones (gaps), que son más
caros que una diferencia en secuencia.
alternativa: qi = exp(-βεi)
εi es el costo de poner i en esa posición
si no hay relación entre las dos secuencias, para dos posiciones: exp[-β(εi + εj)]
si sí hay relación, entonces exp[-β(εi + εj + εij)]; εij es Sij
Sij > 0 à calificación negativa à sustitución menos probable de lo que marca el azar
Sij < 0 à calificación positiva à sustitución más probable de lo que marca el azar
¿Cómo saber si una calificación es buena o mala?
Se necesita una referencia: alineamientos aleatorios
p: probabilidad de 0 (P)
(1 – p): probabilidad de 1(H)
10 aa idénticos
mayor conservación
a nivel HP
ausencia de evidencia
no es
evidencia de ausencia
Localización de sitios de unión de proteínas en ADN: regulación
variación en secuencia del sitio de unión
b = base, i = posición
Z = función de partición (todas las bases en todas las posiciones, que den ε al sumarlas)
Localización de sitios de unión de CRP en E. coli
10% de bases
cambiadas
relación entre secuencia y expresión
Información mutua: liga entre variables
queremos averiguar cuánto del nivel de expresión se debe a la secuencia
bi = base en posición i
µ = nivel de expresión
f = frecuencia
Modelo HT de información mutua
sitio de unión de dos posiciones
f(µ):
f(b):
f(b,µ):
=1
para la segunda posición es 0
La localización de nucleosomas no es al azar.
Se estorban, cuesta enrollar al ADN, y hay motores
que los relocalizan.
si N >> i à S(i - 1)
todas las maneras de cubrir los sitios con pares de bases o con nucleosomas