Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Enfoque Enfoque
reduccionista integracionista
• Interpretación de la información
• Herramientas para el manejo e interpretación de la
información
• Diferenciar entre artefactos y señales biológica
• Estandarización de los datos para poder comparar
entre muestras (mismo lab y dif labs).
• Generación de modelos de interacción (búsqueda
de motivos y generación de redes).
Biología Computacional
Biología Computacional
Genome Sequencing Projects in
Different Phylogenetic groups
El número de Genomas completamente secuenciado se ha
incrementado number rápidamende desde el reporte del primer
organismo secuenciado hace diez años.
Apis mellifera
(~2x108 pb)
Mycoplasma genitalium
(only ~5x105 pb)
Microbial genomes Data analysis: the signs before the flood
published per year
Completely sequenced
14Miogrowth
and published Early linear
followed by exponential
microbial genomes increase
ORFs from
complete
genomes vs
metagenomics
ORFs
1.1Mio 1.5Mio
350k 500k 750k 1.5Mio
2 0 0 3 2 0 0 4 2 0 0 5 20 0 6
2003 2004
2004 2005 2006
2006
No of ORFs in all genomes (incl. ours)
Microbial genomes Data analysis: the signs before the flood
published per year
98 00 01 02 03 04 05 06 07
Craig Venter
98 00 01 02 03 04 05 06 07
Craig Venter
Craig Venter
human
5 chimp
40
mouse
75 rat
310MY dog
450MY chicken
fish
600-1200MY?
worm
?
bee
370MY
flies
Human draft: Nature Feb 2001 250MY
Mosquito: Science Oct 2002
Mouse: Nature Dec 2002 Chimp: Nature Sep 2005 mosquito
Rat: Nature Apr 2004 Chicken: Nature Dec 2004 Honey bee: Nature, Oct 2006
Chicken genome analysis
Hillier et al
Nature 04
15%
45%
Ca 310 MY divergence
The model organism as a system: integrating
‘omics’ data sets
Identificación
de módulos
Generación de
modelos
Omics’ data-integration approaches for identifying,
decomposing and modelling cellular networks
Network-motif enrichment: an example of
network decomposition
a) A reconstructed Escherichia coli regulatory network. 104 regulators and 479 target-
enzyme genes
b) Network-motif-enrichment analysis.
Redes de interacción
Biología Computacional
La idea de elaborar modelos metabólicos, no es nueva...
Sistema investigado Referencia
Producción de serina alcalina proteasa por B. licheniformi Calik,P. et al.Biotechnol Bioeng 1999,64:151-167
Mutantes de E.coli sin la vía de producción de acetato ( ackA-pta) Yang YT et al. Biotechnol Bioeng 1999,65:291-297
Expresión del gene de acetolactato sinteasa de B. subtilis en E. coli Aristidou A. et al. Biotechnol Bioeng 1999, 63:737-749
Expresión del operón phb de R.eutropha en E.coli Shi,H. et al. J Biosci Bioeng 1999,87:666-667
Producción de lgG contra fibronectina humana en células de Follstand B. et al. Biotechnol Bioeng 1999, 63:675-683
hibridoma murino.
Fermentación de glucosa, fructosa y xilosa en cepas silvestres y DeGraaf AA. et al Arch Microbiol 1999, 171:371-385
recombinantes de Z. mobilis
Análisis del metabolismo del carbono en E. coli silvestre y mutantes Edwards and Palsson Proc. Natl. Acad. Sci., 2000,
97:5529-5533
Tomado de Gombert and Nielsen (2000)Curr Opin Biotech. 11:180-186 Biología Computacional
Biología Computacional
Metaboloma
Biología Computacional
Construcción de redes metabólicas
hxk
GLC G6P
pgi
BLAST G6P F6P
pfkA
F6P F1,6dP
Identificación de ORFs
Secuenciación y asignación de funciones Definición individual de Definición de
del genoma por homología funciones vías metabólicas
Gombert and Nielsen (2000) Current Opinion in Biotechnology 11:180–186
Biología Computacional
Construcción de redes metabólicas
Secuencias
genómicas
conocidas
Diversidad
funcional de
las proteínas
Biología Computacional
Bovine chymotrypsin (1chg)
E()<10-32 42% 233/245 S. griseus trypsin (1sgt)
E()10-19 34% 228/259
Eones =mutación
Especiación
Eones =mutación
A B C D
Identificación de proteínas de al menos 3 organismos de clados diferentes que
comparten una relación de un “mejor hit bidireccional” cuando se realizan
comparaciones “todas-contra-todas” las proteínas de un par de genomas
No hay línea
porque son parálogos
Lípidos Aminoácidos
Moléculas Toxinas
Con el subconjunto de genes que codifican señal
las enzimas metabólicas se puede construir Pirimidinas
Purinas
una red de reacciones metabólicas. Hemo
Iones
GLC JM101
10.6 100
Zwf NADPH
G6P 6PG
Se puede escribir un balance de flujo para cada Pgi 76.6
22.3
Gnd
NADPH
Metabolitos
R
e
1,6dP
GLC
a
La estequiometría de todas las reacciones de la
G6F
F6F
c
-1 1 0 0 0 … 0 hxk c
red se puede representar por una matriz 0 -1 1 0 0 … 0 pgi i
0 0 0 -1 1 … 0 pfkA o
estequiométrica : : : : : ::: : n
: : : : : ::: : e
: : : : : ::: : s
: : : : : ::: :
Cells are subject to a variety of constraints
Las restricciones de flujo pueden obtenerse a partir de los
resultados de transcriptoma, proteoma y estudios de MNR
GLC JM101
10.6 100
Zwf NADPH
G6P 6PG
22.3
Pgi 76.6 NADPH
Gnd
F6P R5P
Tkt Tkt, Tal
G3P E4P
1.5
ABP
PEP
Pck
PykA,F
PTS 100 7.7
40.7 Mez
PIR
NADPH
NADH + CO 2
Acetato + CO2
ACoA
55.4 2 0
GltA
CIT OAA MAL
Biología Computacional
Construcción de redes de interacción
Método de perfiles filogenéticos
Construcción de redes de interacción
Método de la Roseta
Construcción de redes de interacción
Método de los vecinos correlacionados
Construcción de redes de interacción
Biología Computacional
La red de interacciones se construirá a partir
de la integración de los anteriores metodolologías
Red neuronal
Red de interacciones
Biología Computacional
Construcción de redes de interacción
Construcción de redes de interacción
Construcción de redes de interacción
Genomics, gene expression and DNA arrays
¿Son realmente lo mismo?
The goal is not simply to provide a catalogue of all the genes and
information about their functions, but to understand how the components
work together to comprise functioning cells and organisms.
*Identificación de Regulones