Está en la página 1de 65

Modelos booleanos

de regulacin gentica
Redes de regulacin
qu es qu
modelos booleanos
atractores, transientes, grafo de transiciones
arabidopsis
kauffman, el applet
otros tipos de redes biolgicas
Importancia topologa
Motifs, redes complejas

Extendiendo el paradigma
hematocitos
clula muscular neurona
A pesar de tener el mismo genoma, las clulas pueden
ser muy distintas.
Adems, puede estar haciendo cosas distintas en un
momento y en otro.
Redes de regulacin
Lo que distingue la naturaleza y estado de una clula
son las molculas que contiene.

En relacin al genoma, lo que interesa es qu genes
estn siendo expresados, y en qu cantidad.
Ion
Channels
Receptors
Transcription
Factors
Ligands
ELECTROPHYSIOLOGY
Extracellular
space
Cytoplasm
Nucleus
Translation +
processing
cis sites
Intracellular
Signaling
Genetic
Regulatory
Network
mRNA
Redes de regulacin
Para modelar la relacin entre todas esas entidades,
se han propuesto diversos modelos, con distintos:
Niveles de continuidad (variables binarias,
discretas, continuas)
Niveles de estocasticidad (deterministas o
probabilistas)

...que a su vez los hacen diferir en
Realismo
Cantidad de parmetros (cantidad de datos!)

As que hay desde redes booleanas hasta ecuaciones
diferenciales parciales estocsticas.
Redes de regulacin
En estos modelos las entidades pueden ser:

Molculas (protenas, RNA, etc.)

Componentes celulares

Condiciones ambientales

Reacciones qumicas

Etc.
Redes de regulacin
Y las interacciones pueden ser:

Transformacin en una reaccin

Relacin cataltica

Regulacin de transcripcin

Regulacin de traduccin

Activacin / desactivacin

Etc...
Redes de regulacin
Redes de regulacin
Para entender una clula, habra que entender algo as:
Redes de regulacin
An estamos muy lejos.

Los modelos funcionales hoy en da no pasan en
general de una docena de nodos (entidades).



Para hacernos una idea del tipo de comportamiento y
dificultades que aparecen, hablaremos del tipo ms
simple de modelo: redes booleanas.


Redes de regulacin
Asumimos:

-estados binarios para
las entidades (nodos)

-funciones booleanas
para las relaciones

Por lo general tambin
se asume iteracin
paralela (todos los
nodos se actualizan al
mismo tiempo).
Redes booleanas
AND
NOT
NAND
Ventajas:

Permiten analizar comportamientos cualitativos
de la red
Su construccin requiere relativamente pocos
datos.

Desventajas:

No es cuantitativo
No puede modelar seales con intensidad variable
Ergo, no es realista.
Es difcil incluir el ruido (azar) del sistema vivo.
Redes booleanas
Ventajas:

Permiten analizar comportamientos cualitativos
de la red
Su construccin requiere relativamente pocos
datos.

Desventajas:

No es cuantitativo
No puede modelar seales con intensidad variable
Ergo, no es realista.
Es difcil incluir el ruido (azar) del sistema vivo.
Redes booleanas
Las redes booleanas son el caso ms simple de redes
de autmatas (MEF puestas en un grafo).

Las podemos ver como un digrafo (G,V) con estados
booleanos en los nodos, y funciones de actualizacin
que dependen de los nodos incidentes.

O como funciones F:{0,1}
n
{0,1}
n
.

Modo de iteracin: en el caso ms simple, es paralelo
(sncrono) todos los nodos se iteran a la vez, as
que simplemente se aplica F.
Redes booleanas
Como el sistema es finito, siempre caemos en ciclos
de algn largo p (es decir, un punto fijo de F
p
).

Y podemos visualizar ciclos y transientes haciendo el
grafo de transiciones del sistema.
Redes booleanas
f
1
= x
4
f
2
= x
4
. x
3
f
3
= x
2
. x
4
f
4
= x
2
. x
1
. x
3
Grafo de transiciones
Grafo de transiciones
Nota: la cantidad de estados del sistema es 2
n


crece exponencialmente con n


Hay una serie de problemas NP duros asociados a la
dinmica.

Por ejemplo: dada una RB, encontrar un punto fijo.

NP completo.
Grafo de transiciones
Aparte de la iteracin ms simple (paralela,
determinstica), se usan varias alternativas.

Iteracin secuencial: iteramos primero el nodo 1,
luego el 2, ..., hasta el n-simo, y luego volvemos al
1.

Iteracin por bloques: le asignamos a cada nodo
un bloque de iteracin, y ponemos un orden a esos
bloques. Iteramos los bloques uno despus de otro,
pero cada bloque se itera en paralelo.

Modos de iteracin
Eso agota las opciones determinsticas que iteran
todos los nodos 1 y slo 1 vez por vuelta.


Alternativas probabilistas:

Iteracin asncrona: en cada paso escogemos un
nodo al azar y lo iteramos.

Combinaciones varias.
Modos de iteracin
Nota:

los puntos fijos no dependen del modo de iteracin.

Ergo, el cambio en el modo de iteracin afecta slo
los ciclos y transientes del sistema.


En lo que sigue asumir iteracin paralela, salvo que se
indique otra cosa.
Modos de iteracin
Conviene distinguir algunos tipos de funciones
booleanas que aparecen al modelar (y le dan a la red
dinmicas particulares).

Funciones de umbral: se pueden escribir como

Tipos de funciones

>
=

no si 0
1
) , , , (
2 1
i
j
j ji
n i
x w
x x x f
u

donde los w
ij
son pesos y los u
i
son umbrales.

Es el tipo de funcin que aparece en las redes
neuronales discretas.
Funciones canalizadoras: existe algn
input que, con un valor, determina el
resultado. Si est en el otro valor, no
lo determina.
Tipos de funciones
Canalizadoras anidadas: existe un orden en los
inputs; uno es canalizador, en su defecto el siguiente
lo es, etc.

En general las funciones canalizadoras aumentan la
estabilidad de la dinmica.
Una red canalizadora anidada
Tipos de funciones
f
1
= x
4
f
2
= x
4
. x
3
f
3
= x
2
. x
4
f
4
= x
2
. x
1
. x
3
Funciones montonas: f
i
es montona en el input j si
se verifica siempre

Tipos de funciones
) , , , , 1 , , , ( ) , , , , 0 , , , (
1 1 1 1 1 1 n j j i n j j i
x x x x f x x x x f
+ +
s
Una red en que todas las funciones son montonas en
todos sus argumentos tiene la gracia de que se pueden
asociar signos a los arcos: el efecto de un nodo sobre
otro siempre es, ora positivo (+1), ora negativo (-1).

Nota: tanto las funciones de umbral como las
canalizadoras son montonas.
o si se verifica siempre la desigualdad contraria
(montona creciente, o decreciente).
Tipos de funciones
f
1
= x
2
f
2
= (x
1
v x
3
)

f
3
= x
1
. (x
2
v x
3
)
Ejemplo de red con funciones montonas:

Un circuito de largo L es un camino cerrado en el
grafo: x
c(1)
x
c(2)
...x
c(L)
,
(x
c(i)
,x
c(i+1)
)eV para todo i, (x
c(L)
,x
c(1)
)eV

As que tiene L nodos, y L arcos. Es simple si no repite
nodos.
Decimos que un circuito es positivo si el producto de
los signos de sus arcos es +1, y negativo en caso
contrario.
Circuitos positivos y negativos
Circuitos simples:
Negativos:
1 2
1 3 2
2 3
Positivos:
3
Un circuito representa una accin de un estado sobre
si mismo (feedback loop).

La presencia de circuitos positivos est asociada a la
existencia de atractores mltiples (en un atractor, el
nodo est "bajo" y se refuerza as; en el otro, est
"alto")
"multiestacionaridad"

La presencia de circuitos negativos est asociada a la
estabilidad (si el valor est alto, tiende a bajo, y
viceversa)
"homeostasis"
Circuitos positivos y negativos
Algunos problemas clsicos:

Analizar la dinmica (atractores, estabilidad, etc.) de
una red dada.

Estudio estadstico de clases de redes (definidas a
travs de su conectividad, topologa, tipo de
funciones, etc.)

Reconstruccin de redes a partir de informacin
parcial sobre su dinmica (atractores, algunas
interacciones, ...)
Problemas de estudio tpicos
Estudio estadstico clsico: Random
Boolean Networks (RBN), o "redes de
Kauffman".

Stuart Kauffman, ~1969
Redes booleanas aleatorias
Las redes son determinsticas.

Lo "random" viene de su generacin aleatoria, para
estudiar estadsticamente el comportamiento.

Preguntas (entre otras):
Qu tanta estabilidad sale de la estructura de la red?
Entender los roles relativos del azar y de la seleccin
natural en la construccin de las GRN.


Modelo NK:

N nodos
K inputs por nodo (desde otros nodos), al azar
Funciones booleanas escogidas al azar

Para N=8, k=2, ~2
70
redes distintas (muchas
equivalentes, pero an as, hartas).
Redes booleanas aleatorias
Encuentra varios tipos de comportamiento:

Orden ( k = 1 )

La mayora de los nodos se puede perturbar, sin
modificar el atractor alcanzado.

Perturbaciones pequeas provocan cambios pequeos.

Casi todos los nodos se estabilizan rpido.

El atractor alcanzado es corto, O(1). La cantidad de
atractores es O(2
N
).
Redes booleanas aleatorias
Caos ( k > 3 ):

Muy sensible a perturbaciones:
cambios pequeos se amplifican
exponencialmente.

Pocos nodos se estabilizan.

Pocos atractores, pero largos: O(2
N
)

[recordar que 2
N
es el tamao del espacio de
configuraciones, "espacio de fase" para los fsicos]
Redes booleanas aleatorias
Pero para k = 2:


Sensibilidad intermedia a perturbaciones:
Algunos cambios afectan poco, otros afectan
harto.

Muchos nodos se estabilizan, pero persisten "zonas de
actividad".

[Si se dibuja la red poniendo cerca los nodos que estn
linkeados, lo que se ve son "islas" de actividad dentro de un
"mar" de nodos constantes.]

Redes booleanas aleatorias
Pero para k = 2:

Ciclos lmite no son largos, duran O(\n) pasos.
Cantidad de atractores tambin escala como O(\n).
Hay una reduccin efectiva del espacio de fase:
Para n=100, de 2
100
configuraciones posibles, el
sistema "escoge" quedarse en ~10 atractores,
de largo ~10 un conjunto de 100
configuraciones!
Redes booleanas aleatorias
k=2 es aprox. el promedio en redes de regulacin
gentica reales.

Kauffman identifica los atractores con tipos de
clulas, alcanzados despus de la diferenciacin
(glbulos blancos, neuronas, etc.), y el transiente con el
proceso de desarrollo.

Para las cantidades de genes, y la cantidad de tipos de
clulas, que se estimaban en los 70, cuadraban las
cantidades.
Redes booleanas aleatorias
Ms tarde se ha visto que haban problemas:

La cantidad de tipos celulares estaba sub-estimada.

La cantidad de genes estaba sobreestimada.

Hay ms formas de regulacin (y ms compleja) que lo que se
supona.

La topologa no parece ser aleatoria, y su estructura
especfica parece ser relevante para la dinmica. Sobre eso,
volveremos.

Pero de todos modos lo de Kauffman fue una buena
aproximacin, y hasta hoy es punto de referencia.
Redes booleanas aleatorias
Qu tiene de especial k=2 ?

Un clculo va aproximacin "mean field" (cosas de
fsicos, tomar el promedio de los estados y las
interacciones).

Consideremos dos configuraciones iniciales X e Y que estn a
distancia de Hamming D.

En promedio, cada nodo controla (incide sobre) k nodos.

En promedio, las nodos que difieren entre X e Y controlan kD
nodos.
Redes booleanas aleatorias
Qu tiene de especial k=2 ?

En cada uno de esos nodos cuya preimagen diferir entre X e Y,
hay probabilidad de que eso afecte el nuevo valor.

Por lo tanto en promedio los nodos que diferirn entre F(X) y
F(Y) sern kD/2.

La distancia entre F
t
(X) y F
t
(Y) ser
Redes booleanas aleatorias
| | | | Y X D
k
Y F X F D
t
t t
,
2
) ( ), (
|
.
|

\
|
~
Qu tiene de especial k=2 ?
Redes booleanas aleatorias
| | | | Y X D
k
Y F X F D
t
t t
,
2
) ( ), (
|
.
|

\
|
~
Para k<2, las rbitas se acercan.

Para k>2, se alejan exponencialmente.

k=2 es el valor crtico: la distancia no se mantendr
constante, pero depender de fluctuaciones locales no
capturadas por esta aproximacin mean field.
Nota: slo se supuso que k era el grado promedio.
Los experimentos confirman esto: basta que la
cantidad promedio de inputs sea k.

Complicando un poco ms el modelo:

Supongamos ahora que al escoger la funcin booleana
al azar, no se toma probabilidad de 1 y 0 en cada
item de la tabla, sino probabilidad p de poner un 1.

En tal caso k=2 ya no es crtico. Un desarrollo un poco
ms complicado [ver el apunte de Gross] muestra que
en ese caso
Redes booleanas aleatorias
) 1 ( 2
1
p p
k
c

=
Redes booleanas aleatorias
Los dibujos ilustran la dinmica para distintos regmenes
(horizontal: nodos; vertical hacia arriba: tiempo).
Derrida y Pomeau (1986) hicieron este anlisis, y
mostraron que efectivamente hay un cambio de fase
en la frontera entre el orden y el caos.

[En realidad lo demostraron suponiendo que las funciones se
vuelven a escoger al azar a cada vuelta; sin embargo mostraron
despus que para N el comportamiento coincide con el usual
(funciones escogidas slo al comienzo)].

Redes booleanas aleatorias
Por qu k=2 en las redes biolgicas? Por qu la vida
escogi (al parecer) el borde del caos?

k>2:
la dinmica se vuelve inestable: malo para una clula!
La seleccin natural lo eliminar.

k<2:
hay poca flexibilidad
poco orden, con O(2
N
) atractores
adems, hay "espacio" para agregar conexiones
La seleccin natural hara crecer k.
Redes booleanas aleatorias
El efecto de perturbaciones en la red (N,2) sigue
leyes de potencia:

muchas con poco efecto (tpicamente, entre 80 y 95%)

unas pocas con grandes efectos.

Es el rgimen ptimo para el procesamiento de la
informacin:
hay donde guardarla (a diferencia del caso catico)
y tiene como propagarse (a diferencia del caso
ordenado, donde perturbaciones pequeas slo
provocan cambios pequeos).
Redes booleanas aleatorias
Pero volviendo al caso de los genes: qu tan sencillo
es modelar fenmenos biolgicos con RB?

Problemas:

A veces simplemente no se puede (pero en ese caso
es til demostrar que no se puede, i.e., mostrar que el
comportamiento del sistema requiere un modelo de
otro tipo).

Por lo general no se tiene informacin completa, as
que hay que resolver alguna forma del problema
inverso (RB, dados los atractores, y algunas
interacciones conocidas).
Redes de regulacin gnica
Ejemplo: cascada
de la caspasa,
generando
apoptosis (muerte
celular).


Tpico mono de
paper biolgico.
Bastar modelar
booleanamente las
interacciones?
Redes de regulacin gnica
En este caso al
parecer s: el
modelo
"booleanizado"
permiti predecir
de manera
efectiva el efecto
de dos posibles
medicamentos
para intervenir en
el proceso.
Redes de regulacin gnica
Otro caso (un modelo "clsico"): formacin de la flor
en Arabidopsis thaliana
Redes de regulacin gnica
Cuatro zonas,
concntricas
correspondientes
a los traslapes de
tres genes
Fenotipos mutantes
Redes de regulacin gnica
A C
B
C
B
A
A
Red de
Mendoza
et al.
B
A
C
Red booleana, funciones tipo umbral
Redes de regulacin gnica
Iteracin por bloques
Redes de regulacin gnica
Cuadraba, pero no predeca todos los fenotipos
experimentales.
Redes booleanas aleatorias
A la izquierda, una
red ms reciente
para el mismo caso.

No slo agrega nodos:
adems algunos
tienen tres estados.

Se est trabajando
en otra mucho mayor.
Recordemos cmo era la topologa que us Kauffman:

Cada nodo recibe input desde k nodos, al azar.
La importancia de la topologa
Ergo, el grado de entrada de los
nodos es k, y el de salida es una
binomial con media k. , aproximando,
una Poisson de parmetro k.
No hay nodos "escogidos", que se salgan mucho de la
norma.

No hay grupos de nodos que estn especialmente
conectados entre s. Es "todos con todos".
No es realista. Incluso en 1970 se saba que:

Algunos grupos de genes interactan ms entre s,
que con el resto de lo genes de la clula.

Algunos genes regulan mucho ms que la media
(protenas que se dedican a regular "factores de
transcripcin).

La duda era: esos rasgos de la topologa, influirn en
la dinmica?

No haba teora. Ni modelos alternativos para un
grafo aleatorio.
La importancia de la topologa
Veamos un ejemplo para una dinmica bastante simple.

k = 7.

Funcin booleana idntica en todos los nodos:

Sea s la suma de los 7 inputs en el tiempo t
En t+1 paso a 1 si 1 s s s 6, a 0 si s =0 s =7.

Evalo, despus de cada iteracin, la proporcin de
nodos que estn en 1.

Los siguientes grficos son con N=10.000
La importancia de la topologa
Resultado:
catico.
La importancia de la topologa
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1 3 5 7 9
1
1
1
3
1
5
1
7
1
9
2
1
2
3
2
5
2
7
2
9
3
1
3
3
De hecho, si hacemos una aproximacin mean field se ve que
para r% de 1's en tiempo t, la proporcin en t+1 es 1-(1-r)
7
-r
7
.

Y se demuestra que la funcin r1-(1-r)
7
-r
7
es catica (como
lo era la logstica de parmetro 4).
Como la regla es homognea, podemos
aplicarla como autmata celular. Es decir,
irnos al extremo contrario e imponer una
topologa completamente regular.
La importancia de la topologa
Ponemos entonces los N nodos en un crculo, y cada
uno recibir input de sus tres vecinos en cada
direccin (y de s mismo). La funcin es la misma.
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1 3 5 7 9
1
1
1
3
1
5
1
7
1
9
2
1
2
3
2
5
2
7
2
9
3
1
3
3
Resultado: orden! [La
fluctuacin es un
efecto del tamao
finito; tiende a
desaparecer con
N].
Son casos extremos, por cierto.

Cmo podemos interpolar entre un caso y otro?

Introducimos un parmetro p en la construccin de la red.

Asignamos los 7 inputs ms cercanos, como en el segundo caso.

"Repensamos" ahora cada uno de ellos. Con probabilidad p, lo
reasignamos de modo que venga de un nodo escogido al azar.

Con p=1, tenemos el primer caso (grafo aleatorio).

Con p=0, tenemos el segundo (malla regular).
La importancia de la topologa
p = 0.3
La importancia de la topologa
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1 3 5 7 9
1
1
1
3
1
5
1
7
1
9
2
1
2
3
2
5
2
7
2
9
3
1
3
3
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1 3 5 7 9
1
1
1
3
1
5
1
7
1
9
2
1
2
3
2
5
2
7
2
9
3
1
p = 0.45
La importancia de la topologa
p
%

d
e

1
'
s

Diagrama hecho con
N=1.500.000.
Moralejas:

Incluso para funciones muy simples, la topologa puede
ser decisiva para la dinmica.
Hay diferencia entre un grafo aleatorio, y uno en que
haya algn nivel de orden.
Puede haber sensibilidad dinmica a variaciones
pequeas en un parmetro que define la topologa.

Y eso que el caso que vimos no se meti con otras formas
de modificar la topologa; por ejemplo, el modelo sigui
siendo "democrtico" (no haba nodos especialmente
conectados).
La importancia de la topologa
Redes complejas
Redes complejas
El nfasis pasa
definitivamente a la
topologa.
Incluso sin dinmica (sin T)
las caractersticas de la
topologa son tema de estudio
(no trivial; reciente; hot).

También podría gustarte