Está en la página 1de 56

Informacin en los seres vivos

El fenotipo se correlaciona con el genotipo


Dogma central: ADN - ARN - protenas - rasgos
Estable y transmisible
Puede ser copiada y diseminada

Capacidad de modificacin
Mutacin
Recombinacin
Sexo (intercambio de material gentico)

Del genotipo al fenotipo

Material gentico
(ADN)
Genes

Protenas
Estructura
molecular

Funcin

Rasgos

Bacterias
Animales

Hongos

Plantas

Almacenamiento de la informacin
gentica: estructura del ADN

Estructura del genoma de los


organismos procariotas
Contienen un nico cromosoma de estructura circular
Bsicamente ADN desnudo
Mayora de la secuencia de ADN compuesta por genes

E. coli- 4.6 Mb
~87% --- 4288
genes

Estructura del genoma de los


organismos eucariotas
Material gentico almacenado en el ncleo
Organizado de forma compleja en varios
cromosomas de estructura linear
ADN asociados a protenas (histonas y no histonas):
fibras de cromatina

En los eucariotas la informacin gentica se


reparte en un n variable de cromosomas

Complejidad del genoma eucariota


Parte del genoma de los organismos eucariotas
no codifica para protenas:
ADN altamente repetitivo, centrmeros, ADN satlite,
telmeros (5% del genoma humano)
ADN moderadamente repetitivo, SINEs, LINEs, ARNr
y VNTRs (30% del genoma humano)

Los organismos eucariotas contienen secuencia


no codificante (no traducida a protena) incluso
dentro de la secuencia gnica

Replicacin del ADN

El ADN se replica en direccin 5 3


OH Extremo 3

Extremo 5 P

P
O

O
P

P
O

OH
P

O
OH
C

Extremo 5

Replicacin del ADN

Video replicacin del ADN


http://www.youtube.com/watch?
v=zmu9OPuXj-k&feature=related

El ADN contiene la informacin para


producir las protenas de un organismo

Naturaleza qumica de las protenas


La unidad bsica de la protena
es el aminocido, existen 20
aminocidos distintos
Los aminocidos estn unidos
covalentemente mediante
enlaces formando cadenas
(polipptidos)

Protenas
Las protenas son la clase ms verstil de
macromolculas en la clula
Existen 20 amino cidos diferentes que forman
parte de las protenas
Gran variedad de caractersticas qumicas
Pueden sufrir muchas modificaciones
bioqumicas que alteran o regulan su funcin
Llevan a cabo la mayora de las funciones
celulares

Niveles de organizacin de las protenas

Flujo de la informacin gentica para


generar protenas
ADN
Cdigo de 4 letras
Largas molculas con
miles de genes

Protena
Cdigo de 20 letras
Molculas de tamao
discreto

(RT)

TRANSCRIPCIN

TRADUCCIN

Estructura los genes eucariotas

Transcrito

El splicing tiene lugar en el


spliceosome
http://www.youtube.com/watch?
v=FVuAwBGw_pQ

Transcripcin
Proceso complejo que implica varios pasos
La ARN polimerasa sintetiza un molcula de ARN monocatenario
usando como molde la secuencia de una de las cadenas de ADN
El inicio de la transcripcin est regulado por factores de transcripcin
que reconocen secuencias normalmente situadas justo antes del punto
de inicio de la transcripcin (extremo 5)
Existen secuencias que indican el final de la transcripcin, al ARN recin
sintetizado se le aade una secuencia de adeninas, la denominada cola
poli A

(RT)

TRANSCRIPCIN

TRADUCCIN

Video sntesis de protenas


http://www.youtube.com/watch?
v=FNqmh4PoMPQ

Flujo de informacin, de la secuencia


genca a la protena

Regulacin del flujo de la


informacin gentica

ADN

Pre-ARNm

Transcripcin

Cromatina
ADN-B
ADN-Z

Nivel principal
de regulacin

Transcripcinal

ARNm
Splicing

Traduccin

Protena

Protena
activa

Modificaciones
post-traduccionales

Estabilidad

Splicing
alternativo

Post-transcripcin

Post-Traduccional

Splicing alternativo
Hace referencia a variaciones en la forma de combinar
exones que generan diversas formas de una protena
El splicing alternativo de pre-ARNm es un importante
mecanismo de regulacin de la expresin de genes en
eucariotas superiores. Regulacin cualitativa
Explica por ejemplo la existencia de aproximadamente
1.000.000 de anticuerpos diferentes en humanos a pesar
de que el genoma humano contiene nicamente unos
30.000 genes

Splicing alternativo

Fig 24.4 Alternate splicing of transcripts from the rat troponin T gene.

Result in slightly different action of muscle

Genes expressed that


lead to female
development

Genes expressed that


lead to male
development

Fig 24.5 Alternate splicing of transcripts from the Sex-lethal gene in male and female Drosophila.

Bioinformtica
Las nuevas tecnologas de secuenciacin
permiten secuenciar el genoma completo de un
organismo
Se est generando una enorme cantidad de
datos
Cmo analizar todos estos datos?
Bioinformtica
Fusin de las ciencias de la computacin con la ciencia
genmica
Desarrollo de nuevas herramientas para analizar datos

Contig 190 25703 - 32806


atgctctttaccatgcaattcaccactcgatccaccgtggcctcgcccgagcagcagcaccaacaccaacagcgcagtatctcgtactcggatatcgaacttggtcttgagcgcatcagctctcgcgacagcaatggcagctc
caactttacgcacagagcctatcctccaccgctatctcagcaatatgacgacacatccaccaactcctttcattcatcgcagccagacatcacagcctcttcttcaactttgtcgtctcgcctcgtgagcgccaactactcccgtcct
cggttcgagcatgcgcacactcaaccacccacacccgaccaagaccgctccagctccggctccggctccggctccggctctcgctcctactttcccgccaactcgcattccgactctttgcccggtcccagcactcatagcat
cagcccttcctttgacgaggacgaactccgtcagatcatgtcgcacattccagctaaccaagccacgtccagctcggatggcgatgtaggcaaggccgtccagtctgccaaccatcaggacatcagtccgttcctcttccaga
gcgagaacgcagctcccttttcctcctcccactccaaccgtaccagtgtcaatccatccgcagcctcgaccgccagcccgtcgacttcggcggcaaccaggacacgtccgcgcgggggcaccaacgcctcgcagtacaa
caccctagacactagcttcggtagcatcgatcggcctggcctttcttcttcccgctctcagtattcattgcgcccacagaccccaccctcggcgtccacttccactagcactctcaacggctccaaggacacgcacgcttctgccg
tcaagaagacgcgcaatccgttcggctttctcaaaaagaagtcctcggcccactcaaatgcttcctcgaatcaccccacgcgccacgacatcggctcggtctcttcgctctcgtcgcgctacggtcccaacgcggcggccaa
cgtcaatccgatgcgcccacctgcctggctcgataatcactgcacacttgccaactccaactcgccttcttcggcttcgctgcgctctcactaccaccagcctcctgcctcttcgaatccccctccttggcagaaccccctcgtgtct
cgtgcagactcgactccttccgccatgagtctcgaagatgaggtcgaggctgagcatcatctcaagaaggaccctcgcaagcgcatcaaaggcgttcgccatcaccttgcaaagaccaccaagcccggcgaggacgcc
gactcggcacgcgaccctgcctttgcagcccagagccagtccatcgaacaagaggtcgaactctcgttggacatgaactttgaccagctcgatgactttgtcgacaccaacgcagcgcgccagcggctccagggctcgatc
actgagtctgccagtccttccgagcatcgctcaccaaacggaagcgaagccggcgtgtatcgctcgccatccccttcccagactcccattgccgaacgccagacttcggtcacttctaccgtcgaatctccctcgcacgcctcg
gaagcctcgctcgcaccctcgggctctctgcgaaccccgagtcgcactactgcgtctacctctacctcgtccgcttccaccgtactcagcgaccgtcttccttcgcaggtcaacatgcttcctcgcaatagcgtccccaggctca
gcctagccgagatgcaaaactaccagtcgctccgtaaactctcgaacaacctcatcgacatgtcccagacgcaaaacccttccgctatgggcgcatcctaccgccgcggatccatcgcagccgcccaagcacctgtcgac
gcgcctcagctaggtgtcgctcctcgtactgactctgagctctccgatcgcaaggacagcgtagtctctacccacagcatgcgctccaaccatagcggcatctcgcccaagacctcatacgccaacctgcccagtgtcattca
ggagcgtcagaagccggctactgcacttccctccgccgcgaattggacatcatccatcaccagagacaaaacggccaatggacatgctgaccacgcctaccaatttccgcccgcaactgagtatcagtccaacttgctgct
cagcgtgcgcaagtcgagtgccagctcggggcaggagcctagctccagctggatggctcccgacagttgggccgtacaaccggacaagatgcgcgactatcttcgcgacgataatgtcggcgaggaggaagacgacg
acgacgaccagcaccaagccagagccgctttggccaccgatggcaagaggcgcggttccagctccggtatcagctcgacgcatgcatcgagcatgttccgcacctcatccaccgaccctttcaagaagactgcctcgctt
gctggctcacgtcgcggcacggacgactcggtcgatccgctcaccgctttgcctccattgccaggctccaagtcggtggacgaggcagcagccaacaaggtcgatgtactccagcagaccaataatctcgctcaatcggct
ctggtgcaacagcagtctcaatcccagaaccaccaccagcccagccccaacgtccgtcccacctcgagaggcggtgctggtgcccacatgtttgcctccgccggcgcttccgctgcagcagctgctgcgggcaagcttggt
ttacatcgtccatctaaacatcgtatgaacgcgcgacccaataccgcaggctccgttggtgcgacccgaccttccaccaccacgctcggctcgaccctctcggcagaggacgacacaagcatcaacggctccatccgacg
cgacggccatccgctcaagcgctccgcaactgccaacacgaacaacgccacgggaactttgcctcgcaaccacttcatccgcgtctacaagacggacggcacctttgcaacgctctcgtgctcactcgtctcgacggcaa
acgaagtacagacaatcctcgcgcgcaagagcctcaccaccgaatcggccgcatacaggctttttgtgcgggacaagggctccgagagaccgctggggatctcggacaagccttctcagctccagcgtcgtcgtctcattc
aggcaggctacaccgagaacgatggcttggaagatatgggcagagacgatttgtcatacctgcttcgcttcgtctttcgccccgacagtgttcccaccttcgactcggaatccatcggccacagcgagcacacattccagcat
ctcgatctgcacagccgcaatctcgaaatggtgcccatctttctgtataagcatgccgactggattgttagcctcgatctgtcaggcaatcccatgtctgatcttccgctcgactttgtacagctctgttcaagcctgcgaactctgcg
actctcaaacttggcgctcaagcgcatcccgcaaagtgtccggcacagcgaaaccttgacgcacctcgacgtatccaacaatcgaattgtcgagctcgcgcatgtcagtctcgatcttattccggagctcatgtcgctcaaggt
gcaaaacaatcgtctctttgacttgccctcatacttttccagcatcagcacgctgaggaacctcaacatctctaacaaccgctttgaagaattccccaaggtcatctgcgacgtcccttcgctggtcgatcttgatgtgtcattcaattc
gatcactgaattgcccgccgaaatcgccaacctcatcaacttagagcgcttcatcctagccggcaacgagctggaaaagctgccggacagcatgagcgagctcgtcagcttgcgcaccatcgacctgcgtcgtaacaagg
tgcaggacgtttcgtcgctgcttggtcttccacgccttcaaaacatccaggccgagagcaacaacatcaagtcgtttgaagctacactgggtccgcaactcactcaggtcgagctcggtcgcaacccactcagcaaggtgcg
catcgctgctctcaccacgtgcgatctcacctcgctcgacctgtcgtcgaccaacatgacgcggctcgaggaaggtctcttcccgcagctgcctgcgctcgtcaagctgacgctcgatggcaatcagctcgttgtgctgcccga
cacgctcggagacttgaagcgactcgagatgctatcatgcagcaacaatctgcttgctaccctccccgagtcgatcggtgatctcaaggcgctcaaggagctgcttgtgcacaacaacaacctcaaaacgcttccacagac
cttgtggctctgcgagagcctcgcacacatcaatctcagctccaacttgctcgaatcgttcccagcagtgcctgacattcgcaccgatgcttccgttggagatgcggctgcagctgccggcacttcggccgttatcgctgcacga
aagggatctacaagctcgtcgctgacgcacaggtctaacactggtggcgccaatgggaacatcaatctctctacgccctccgaggtctttgtggcgccgctctcgctcagcctgcagaagctgcgtctgggagacaatcgtct
aggcgatgacgttttcagtgtcctgtccgagctcacctcgctcgaggtgctcaacctcagcttcaacgagatctttgagattcccgattttagtctccagacgctcaccaagctgcgtgagctatacatcagtggtaatcagcttagc
acgattccttccgacgatcttgtggtgctacaagagctgcgcatcctccacctcaactgcaacaagctcactactctccccaccgaacttggcaagctcaagaagctcgccaacctggatgtcggtaataacgtgctcaagtac
aacattgccaattggcattacgactggaactggaacatgaacccggagctacgctacctcaacctttccggcaacacgcgtctcgagatcaagaccaagctgagcgatatgggcttcacgcgcaagtccaacatctcggac
ttcagccgcttaaccagcttgcgcatgctgggtctcatggatgtcacaatgccattgcattcaaatgccacgccggatgagtcggacaaccgccgtgtgcgaacctcgctctcgcaggtcaacggaatggcttacggaatcgc
cgacgcactcggcaagcacgacaacttgagcgtcatcgatcttgtgattccaacattccgtaaggacgaaggagagtgcatttttggtctatttgacggtaggggccacggtgcacatgttggcagccgtatcgcgcatcacct
ggccgaatggagtggacatcgtctatcgtgggagttccagaagcaccagaatgaaatgaccgccgaacctgtttcggttccggatgcgctgcgccgcgccttcctacgcctgcagaaggactacgccgacgcgctcatcaa
cgatggcagccgcaagctctctgaagcacacgcagaggcggctgcggatgtgacgcgaagctctgcgcctgcgattgcggccgcctccaacaagcatgactggcgcgccggcgcttccgcgattttagcgtacgtggtcg
accacacgctctacattgctaatgcgggtgatgctctggcggtcatgtcgcgcaacggtggcacagcacatctgatcagtaacaagcacgagccgtttgaccgtgccgagatcgagaggattcgatcggcggaaggatgg
gtctcgctgcgtggctatgtcaacgacatgctcgatgtctcgcgttcgtttggctacttccatctgttcccgattgtcaatgctgcacctgcggtgacgacggtgcagttgactgactcggatgaatttgtgattatcgccaaccgcacg
ctgtggcagtatgtgtcgtaccagaccgcggtcgacattgcacgtacacagcgaaacgatcctatgattgcagcgcagaagctgcgagattttgccatcagctacggtgccgaggagagcatcatggtcatggtgatctcggt
gggtgatttgttctatcgttcagatcagcgtaacggcggtggactcaactttgcgtcgtacaagaacagcgacgccatccaaaaggcaggacgtcgattccgcgaggagctgcctggcgatcgcacgctggcgagactgga
ccgtgaagtggcacctcccatcggacaggtggcgctggtgtttacggatatcaagaactcgacgtcgctgtgggagaccaacaatggcatgcagacggcgatgcgattgcacaactacctgttgcgacgacagttgcgcac
tattgggggttatgaggtcaagacggaaggcgatgcatttatggtttcattcccctcggtcagtgcagctctgctgtggtgttttacagtacagcaacagctgctgcaagaggactggccgcgcgagatcttggacagcgaggac
ggcaaggaggtgtacgatcagtcgggcgaactcattcatcgaggtctgtcggtgcgcatgggcattcactggggacggccagtgtgtgaggcggatccgatcacgagacgaatggactactttggaccgatggtgaaccgt
gctgctcgaatcagcggtgcagccgatggcggtcagatcttggcgagcaaggacgtaatcaaggagctgcagggcctattgggtacgtttgacgagtcgtcgacagccggaggtgcgggcggagaaggtgaaaatctag
agaagaccgaggaggagctagacgaggatgcgttccgactgctcaacccgaacgtcagccgcgatgtggtgctgctacgtaggatgggttttggtctatcgcagctgggagagcgcagactcaagggtttggagacgccc
gagatgctgtggcttgtctatccgaagcagttagcaggacgtctggagcaggccaagaccgacgatgcacctgacgcacccacggcgcaagtgtatgagccgacagtgcagctgctagatatcgaggatgtaaagcaag
tgggcatgctctgcttgcgactcgagtatctgtccaactctacggtctgtcctggcatctttgctgccaaggatgaagcggatcgatcgcaaccttcgacgcctctggacgataacggacggaatccgatcgacggccacggaa
cggcggtgcccctgctgtcacaccaggcgcgacgcaaaggggttgaggcgatgttgacgatgcatcccgagctgctcatctacagcatccgagacgatgcgacggatgaagagttggcgggcatcttggatcagctgacg
acgcggatccagaacgccgtgtcttcgctcatgctgaatatgttgcgggacaagacggccaacggtaccaaggaacttggcgtggatcctggggtgctcgagttgttgatgggcttgctttcacagccgcctccgcgagcgtc
aacgtcggcgttgagtttgcccagcccacggacgagccctcgcaacaggctgttggagctggttccctag ......

Terminologa

Genoma: conjunto de ADN de un organismo


Transcriptoma: poblacin total de ARNm en una condicin
determinada
Proteoma: poblacin total de protenas en una condicin
determinada
Interactoma: descripcin de todas las interacciones que tienen
lugar entre molculas
Metaboloma: descripcin de todos los reactivos/productos/enzimas
implicados en metabolismo
ORFeoma/predictoma: descripcin de todas las protenas
potenciales codificadas por el genoma. Genoma anotado
Secretoma: descripcin de todas las protenas secretadas
codificadas por el genoma

Fig 21.17 Annotated, sequence-based


map of an 8-mb segment of DNA at the tip
of human chromosome 1.

2003 John Wiley and Sons Publishers

Fig 15.18 A single gene may produce a family of closely related


polypeptides by using alternate pathways of exon splicing.

Genomas bacterianos
Un gran nmero de genomas bacterianos
secuenciados
Mycoplasma genitalium 580,070 bases
Mycobacterium tuberculosis- 4.4 Mb
E. coli- 4.6 Mb
~87% --- 4288 genes
~30% bien caracterizado
~38% funcin desconocida
Espacio promedio entre genes 118 bp

0.7% elementos repetitivos no codificantes


~11% elementos reguladores o de funcin desconocida

Genoma de levadura
Sacchromyces cerevisae

16 cromosomas 12 Mb
5885 genes codificantes de protenas (1 gene/~2100 bp)
140 genes ARNr
275 genes ARNt
40 genes ARNsn
Principal diferencia con procariotas
Redundancia gentica
Mltiples copias de genes y secuencias no codificantes
til para estudair evolucin de secuencias

Genoma de C. elegans
Primer organismo multicelular secuenciado
97 Mb
Relativamente poca cantidad de ADN
repetitivo
19,099 genes (1 gene/~5100 bp)
Mismo # de protenas que llevan a cabo funciones
bsicas de la clula
Muchos genes especficios de organismo
multicelulares
Sealizacin intercelular
43% similitud con protenas humanas

Genoma de Drosophila melanogaster


180 Mb
~30% heterocromatina centromrica
97% de eucromatina secuenciada
13.601 genes
# de genes de copia nica similar al de C.
elegans
Contiene ~180 genes similares a 290 human
genes humanos implicados en enfermedades
Drosophila un buen modelo para estudiar
enfermedades

Genoma de Arabidopsis thaliana


125 Mb baja cantidad de elementos
repetitivos
~26,000 genes
70% se encuentran duplicados o forman parte
de familias de genes
~15,000 genes claramente diferenciados

Proyecto Genoma Humano


2.95 Gb de 3.2 Gb es eucromatina
>90% de eucromatina secuenciada
~1% de secuencias codifican protenas

Se predicen entre 30.000 y 35,000 genes


# poco elevado:

Levaduras - 6,000 genes


Drosophila - 13,000 genes
C. elegans - 19,000 genes
A. thaliana - 26,000 genes

Genes en genoma humano


Exones 1.1 %
Intrones ~24%
Regiones intergnicas 74%
Tamao promedio de genes ~7 kb
Nmero promedio de intrones - 10
Solo 94 de 1.278 familias de protenas son
especficas de vertebrados
Genes implicados en procesos bioqumicos bsicos
parece que evolucionaron solo una vez y se han
mantenido de bacterias a levaduras y a mamferos

Genoma humano
60% de protenas predecidas son
similares a otras secuencias
Principales diferencias con
gusanos/moscas
Complejidad de las protenasComplexity of
proteins
Ms dominios/protena y nuevas combinaciones
de dominios
Aparicin de nuevas funciones en dominios ya
existentes

2003 John Wiley and Sons Publishers

Fig 21.19 Pie chart showing homology of predicted


human proteins to proteins of other species for those
where homologues were detected by computer
searches of the public databases.

2003 John Wiley and Sons Publishers

Fig 21.18 Functional classification of the 26,383 genes


predicted by Celera Genomics first draft of the
sequence of the human genome.

También podría gustarte