Está en la página 1de 10

TEMA 1

CONCEPTOS BÁSICOS EN GENÉTICA MOLECULAR

NATURALEZA QUÍMICA Y ESTRUCTURA MOLECULAR DE LOS GENES

-BREVE REPASO HISTÓRICO

o Miescher (1871): describe la nucleína


o Levene (1910): Composición del DNA
o Avery, MacLeod y McCarty (1944): DNA, material hereditario (con DNAsas se ve)
o Chargaff (1950): A=T; C=G
o Franklin (1952): Difracción rayos X
o Watson y Crick (1953): la doble hélice

-ESTRUCTURA MOLECULAR DEL GEN

GEN: Unidad fundamental, física y funcional, de la herencia.

- Unidad de almacenamiento de información genética

- Cadena lineal de nucleótidos

- Incluye las regiones que contienen la información + las secuencias responsables de su correcta
expresión

Tiene capacidad de replicarse, expresarse y mutar

Un código es la forma de pasar de un lenguaje a otro. Genes no codificantes dan RNA, no


proteínas, si da proteínas es codificante. No todos los genes son codificantes y además, también
se conocen genes de RNA pero muchos menos que de DNA.

-QUÉ ES UN GENOMA

GENOMA: Dotación completa de material genético de un organismo. Si somos diploides, cada


célula tiene dos genomas. Cada una de las dotaciones es un genoma., y están organizados en
cromosomas.

El genoma almacena toda la información biológica de un organismo. La utilización de esa


información depende una compleja maquinaria bioquímica de expresión genómica. Un genoma
es mucho más que un conjunto de genes, sino que también contiene elementos estructurales
que aseguran su correcto funcionamiento. En el genoma puede haber regiones repetidas.

CROMOSOMA: Moléculas de ácidos nucleicos extraordinariamente largas en las que está


organizado el genoma de un organismo.

DOTACIÓN CROMOSÓMICA Y PLOIDÍA

-¿Cómo se miden los genomas?

Todos los organismos (sistema biológico con estructura celular, por eso virus no son
organismos, son subcelulares, no son m.o, son microbios) presentan genomas de DNA de doble
cadena. Por ello, la longitud de las moléculas se define en pares de bases (pb) y sus múltiplos
(kb, Mb, Gb).

-QUÉ ES LA GENÓMICA
GENOMICA: Estudio molecular del contenido, organización, función y evolución de la
información genética contenida en un genoma completo.

Los estudios genómicos se caracterizan por ser interdisciplinares: la enorme cantidad de datos
generados requiere combinar tanto conocimientos relativos a diversas disciplinas biológicas
(genética, bioquímica, biología celular, biología evolutiva…), como conocimientos estadísticos e
informáticos.

La diferencia con la genética, es que la genética estudia los genes uno a uno; mientras que la
genómica hace un estudio global, analizando la secuencia de DNA para conocer todo lo que hay
en esa secuencia.

Diversas subdisciplinas:

o GENÓMICA ESTRUCTURAL: Secuenciación y análisis de la información contenida en el


genoma insílico, sin hacer experimentos.
o GENÓMICA FUNCIONAL: Análisis funcional de las interacciones entre genes y sus
productos para dar lugar a las características propias de una especie. Expresión.
o GENÓMICA COMPARADA: Comparación de genomas de diversos organismos, tanto en
su estructura como contenido génico.

Todas ellas requieren del apoyo de la bioinformática

Importante, gen White, si no está, blanco, si está, no blanco.

PROYECTOS GENOMA Y SU IMPORTANCIA

OBJETIVO DE LA GENÓMICA ESTRUCTURAL

Cartografiar y determinar de forma completa y precisa la secuencia de DNA del genoma haploide
representativo de una determinada especie, indicando la información que contiene.

¿Por qué cartografiar y secuenciar genomas?

─ El DNA es la molécula universal de la herencia y constituye la base genética de la vida.

─ Su conocimiento molecular puede darnos la clave de muchos fenómenos vitales. Podemos


conocer todas las funciones que tiene el genoma de un organismo en cualquier medio.

La secuencia de cada genoma aporta una ingente cantidad de información, ya que permite:

- Predecir y catalogar el número total de genes.


- Conocer la estructura de genes y regiones reguladoras.
- Predecir las proteínas codificadas por el genoma.
- Definir los principios sobre la organización básica del organismo a partir de las diferentes
clases funcionales de productos génicos: energía, información, comunicación, etc.
- Inferir la evolución del genoma a partir de la conservación del orden de genes (sintenia)
y cambios de la secuencia.

Los Proyectos Genoma son un punto de partida para nuevos descubrimientos

• mejora agrícola y ganadera


• nuevas claves de la evolución
• avances importantes en Medicina
Se abren nuevas perspectivas:

- Los genomas de todos los eucariotas contienen grandes cantidades de DNA no


codificante. Para entender su papel necesitamos saber cómo está organizado en los
diferentes genomas. Descubrimos funciones nuevas.
- Podemos llegar a conocer los genes esenciales para la vida: genoma mínimo (siempre
está en todos los genomas). Cuando comparamos organismos podemos ver qué genes
se han mantenido, entonces si esos genes se han mantenido a lo largo de las
generaciones tienen que ser muy importantes. Esto nos permite llegar a conocer el
genoma mínimo, es decir, los genes esenciales para la vida.

El primer Proyecto genoma planteado: Homo sapiens

Propuesta inicial: DOE (Department of Energy, USA), 1986 secuenciar el genoma humano para
una evaluación sistemática del efecto de las radiaciones

HUGO (HUman Genome Organization) creada en 1988

Inicio del Proyecto Genoma Humano en 1990

Se pretende secuenciar el genoma humano para una evaluación sistémica del efecto de las
radiaciones. Se propone para este proyecto formar una organización denominada HUGO. Con la
formación de esta organización se pretende que se trabaje simultáneamente en todos los
lugares del mundo y así poder dividir el trabajar y compartir la información que obtengan.

─ Planificado a 15 años

─ Dos etapas:

1. Elaboración de mapas genéticos y físicos de alta resolución


2. Secuenciación del genoma humano completo

─ Valor añadido:

1. Puesta a punto de técnicas más eficientes de secuenciación + análisis y almacenamiento


de datos
2. Secuenciación de genomas modelo

El primer genoma completo secuenciado: Fue de una bacteria, Haemophilus influenzae

ESTRATEGIAS PARA LA SECUENCIACIÓN Y ENSAMBLAJE DE GENOMAS COMPLETOS

LA LÓGICA DE LA SECUENCIACIÓN DE UN GENOMA*

─ No podemos leer secuencias completas, para ello, el genoma se rompe en fragmentos


pequeños cuya secuencia es determinada individualmente (lecturas). Es la fase de
secuenciación. Se lee, se secuencia esos fragmentos.

─ Las lecturas se analizan con programas informáticos que encuentran secuencias idénticas y
permiten conectarlas en secuencias más largas o contigs (los fragmentos que ha puesto juntos
eran continuos, es la secuencia original si no se hubiese cortado). A este proceso se le
denomina ensamblaje.

─ El objetivo final es conseguir que cada cromosoma se encuentre unido en un solo contig.
Así se secuencia poco a poco, pero con la lectura conseguiré la secuencia final, denominada
secuencia consenso (puede darse errores y no ser la original 100%). Lo he leído al menos 6 veces
en un sentido y en otro, y la base que más aparezca, estará en la secuencia consenso.

Pero un proyecto genoma es más que secuenciación

ESTRATEGIAS USADAS EN SECUENCIACIÓN GENÓMICA

“SHOTGUN” GLOBAL

─ Implica la rotura aleatoria de todo el genoma y su ensamblaje computacional.

─ Estrategia usada para la secuenciación de genomas “pequeños” (generalmente procariotas).

─ Plantea problemas si el genoma presenta secuencias repetitivas. Imaginar que tengo una
secuencia que aparece repetidas 7 veces consecutivas. Cuando se fragmenta el genoma, si se
encuentra un extremo de una secuencia repetida con otra secuencia repetida que no es la
consecutiva, puede ser que se salten algunas secuencias. Si la secuencia repetida se encuentra
algo alejada respecto a otra, se pueden juntar los extremos y puedo perder toda la información
del medio y puede 6 ser que sean repeticiones que estén en cromosomas distintos. Por tanto,
plantea problemas si el genoma presenta secuencias repetitivas.

Perdigonada. Cada una de las secuencias es como un perdigón. Cuando lo secuencio todo junto.
Si hay regiones repetitivas, los ensambla, no sabré cuánto de largo era la repetición, o incluso
puede que esté en sitios diferentes o cromosomas diferentes y lo juntan. Mirar mutaciones
cromosómicas para la organización de cromosomas. Para saber si hay o no esa traslocación, se
utiliza lo de abajo:

UTILIZANDO MAPAS FÍSICOS PREVIOS (SHOTGUN JERÁRQUICO)

─ Estrategia usada para la secuenciación de genomas “grandes” o con muchas secuencias


repetitivas (generalmente eucariotas).

─ El genoma suele fragmentarse inicialmente en segmentos manejables (unos cientos de Kb)


que pueden ser secuenciados por “shotgun”.

Primero hago un mapa, secuencia los segmentos solapantes y luego lo otro. Secuencio por
partes, jerárquicamente. Se fragmenta el genoma en fragmentos manejables, cada uno de ellos
va a ser aislado y cada uno de ellos va a ser roto aleatoriamente hasta las secuencias que pueden
ser secuenciadas por “shotgun”. A continuación, busco marcadores genéticos moleculares en
cada uno de los segmentos, lo que me permite identificar marcadores comunes, y por tanto,
ordenarlos. Puedo hacer el mapa de todos esos fragmentos y ver cómo coinciden esos mapas.
Una vez tenga los mapas, puedo secuenciar cada fragmento, pero no todos, se seleccionan los
segmentos mínimamente solapantes para su secuenciación completa. ¿Cómo secuencia cada
uno? Mediante shotgun. En definitiva, secuencio lo que me es útil después de hacer el mapa.

MÉTODOS PARA EL ESTUDIO DEL CONTENIDO DE UN GENOMA

ANÁLISIS COMPUTACIONAL: ANOTACIÓN

Una vez conocida la secuencia completa del genoma de un organismo, el paso siguiente es
realizar predicciones sobre qué regiones del mismo contienen información relevante.
Buscar todos los elementos funcionales y darles un significado funcional. Es un programa de
anotación. Primero los identifico (anotación estructural), y luego digo que hacen (anotación
funcional).

Anotación estructural (a nivel nucleotídico)

Identificación de los elementos estructurales presentes en el genoma.

- “Gene finding”: ORFs y genes de RNA (no solo los que codifiquen proteínas) (longitud, uso de
codones o estructura secundaria…)

- Secuencias iniciadoras y terminadoras de la transcripción

- Elementos reguladores

Consiste en identificar elementos estructurales presentes en el genoma como genes que se


definen por parámetros (ORFs y genes de RNA), secuencias iniciadoras y terminadoras, así como,
todos los elementos reguladores.

Anotación funcional

Asignar significado biológico a estos elementos

- Función bioquímica

- Función biológica

- Regulación e interacciones

- Expresión

Se utilizan sistemas automáticos de anotación por ordenador, complementados mediante un


seguimiento manual. La ventaja de tener genes modelo es que puede ser que la funcionalidad
de unos genes en un organismo sea la misma que en otro, y eso se consigue conocer analizando
esos genes modelo.

Dentro de esos sistemas automáticos de anotación estructural por ordenador tenemos:

Sistemas automáticos de anotación estructural por ordenador

Intrínsecos (ab initio) Se basan sólo en el análisis de las características de la secuencia que
está siendo analizada. Modelos probabilísticos complejos analizan 2 tipos de signos:

Ø Señales: secuencias específicas que permiten predecir la presencia de un gen en sus


proximidades.
− Secuencias promotoras, terminadoras
− Secuencias que delimitan intrones
-Te encuentra operones. Si me encuentro una secuencia promotora en un sitio
y la terminadora está lejos, puedo determinar la existencia de un operón.
Ø Contenido: propiedades estadísticas de los genes en sí mismos.
− Pautas de lectura abiertas
− Codones de parada
− Contenido en G+C (tanto en genes codificantes como en los de RNA), si hay,
habrá un gen cerca.
En una pauta de lectura abierta, tendremos un codón de inicio y de parada y entre medias
debería ser un gen. No todos van a ser genes, porque por azar por cada cierto número de
nucleótidos me encuentro un codón de inicio y de parada, por eso si son secuencias muy cortas
no se conocen como genes, sino que tienen que ser secuencias más largas. También hay que
considerar su contenido en GC. En el caso de procariotas el codón de inicio puede ser cualquier
NTG o incluso un ATT. Sin embargo, es más frecuente encontrar un ATG. El programa desestima
todas las secuencias que sean cortas. En eucariotas no es tan fácil porque las pautas de lectura
abierta pueden estar interrumpidas por intrones. Hay bastantes errores.

Pipeline, tubería, lo que sale de una entra en la otra.

La longitud de la ORF importa. Si en medio de dos ORF no hay ningún promotor, es todo un
operón creo, preguntar.

Extrínsecos

Se basan en comparaciones con datos de secuencias ya disponibles en las bases de datos.

Premisa: las secuencias conservadas en diferentes organismos es muy probable que hayan
mantenido funciones similares, tanto más cuanto mayor sea el grado de homología entre ellas.

BLAST: Programa bioinformático más utilizado en las comparaciones (nucleótidos o


aminoácidos)

- El servidor de BLAST, mantenido por el NCBI, permite realizar búsquedas contra bases
de datos de DNA y proteínas en permanente actualización.
- Una búsqueda con BLAST permite comparar una secuencia diana (“query”) con una base
de datos de secuencias, e identificar aquellas que se parecen a la diana por encima de
un determinado umbral.
- La principal ventaja del algoritmo usado por BLAST es su velocidad, una característica
esencial para que resulte práctico, debido a la inmensa cantidad de información
disponible en las actuales bases de datos de secuencias

Si homología baja, negro, y si más de un 80% es cuando magenta o rojo. Verde intermedio.

Los estudios de homología son también muy útiles para definir correctamente los genes:

─ Las ORF cortas pueden ser genes reales si secuencias similares se encuentran en la misma
posición (sintenia*) en otros genomas de las bases de datos.

─ En eucariotas, la presencia de intrones dificulta mucho su anotación y es frecuente cometer


errores por exceso o defecto a la hora de definir los exones. Si una serie de tripletes es un exón
real, pueden detectarse secuencias muy similares en otros genes homólogos, evolutivamente
relacionados. Hay genes muy pequeños (ribosomales) y se lo salta. En animales próximos, se
conserva el orden por lo que puedo ir a buscarlo en otro animal para ver si lo ha saltado o no.

Los programas de anotación actuales suelen combinar métodos intrínsecos y extrínsecos… pero
ningún sistema de anotación es infalible:

- Sólo detectan el 90% de los genes

- El 15% son falsos positivos

Sintenia conservada: conservación del orden génico y orientación a lo largo del cromosoma en
diferentes especies.
Podemos refinar las anotaciones estructurales mediante estudios experimentales:

1. Técnicas de hibridación: Basadas en la capacidad de los ácidos nucleicos de unirse a


secuencias complementarias.
− Sonda: fragmento “marcado” del genoma
− Transferencia de ácidos nucleicos celulares a una membrana
− Hibridación con la sonda de interés.

Pueden detectarse fragmentos de DNA de genomas de especies próximas (“Southern blotting”)


o los transcritos del gen de interés en un tipo celular concreto (“Northern blotting”, sólo detecta
genes que se expresan)

2. Secuenciación de cDNA:
Secuenciando el cDNA se tiene el mRNA de un gen. Al comparar una secuencia de cDNA
con una secuencia de DNA genómico se delimita la posición de los intrones de ese gen.

Sistemas automáticos de anotación funcional

Una vez hemos localizado los genes en la secuencia genómica, necesitamos averiguar su función
y proponer un nombre para cada uno de ellos: Þ análisis computacionales y estudios
experimentales.

Análisis computacionales: búsqueda de homologías.

─ Fundamento: genes relacionados presentan secuencias similares. Si una nueva secuencia


presenta similitudes con un gen conocido de otro organismo, debe tratarse del mismo gen o de
un gen con función similar.

─ Mayor o menor grado de certeza dependiendo del grado de homología.

─ Muchos genes de función desconocida: genes huérfanos.

─ Dominios conservados: podemos conocer su función, pero no el proceso celular en el que


están implicados

Clasificación en ortólogos, genes que vienen de un ancestro común, pero no son iguales. Los
grupos con mayor número de genes son los poco caracterizados.

El problema de analizar los genes ortólogos (secuencias homólogas que se han separado por un
evento de especiación) es que el mismo gen puede tener distintas denominaciones. Para tratar
de evitar eso se promueve una iniciativa según la cual se pretende utilizar términos estándar. Se
caracterizan los genes en base a su función, su posición en la célula y el mecanismo molecular
en el que están implicados. Esto facilita mucho el intercambio de datos entre las diferentes bases
de datos.

Podemos refinar las anotaciones funcionales mediante estudios experimentales:

1. Inactivación génica:

Los genes responsables de una función se identifican porque cuando no son activos producen
fenotipos mutantes. La estrategia es mutar el gen (disrupción génica) e identificar el cambio
fenotípico resultante. Si no ocurriese nada, no sabríamos para qué sirve.
2. Supresión de la expresión génica:

RNA de interferencia (siRNA) y RNA antisentido (complementario al RNAm) y así evitar que el
RNAm pueda expresarse al formar una doble cadena con el complementario. Impedimos que se
dé la proteína, si sobrevive no era esencial y si no, era esencial.

GENÓMICA COMPARADA

─ Comparación de genomas de diversos organismos, tanto en su estructura como contenido


génico.

─ Fundamento: los genomas de organismos emparentados son similares.

Dos organismos con un ancestro común relativamente reciente tendrán genomas que presenten
diferencias especie-específicas, pero construidos sobre un plan común procedente del genoma
ancestral.

Las cuestiones abordadas por la genómica comparada es poder conocer el número mínimo de
genes indispensable para crear un organismo, así como, conocer qué familias de proteínas son
universales y cuáles específicas de un organismo.

Se secuencia genoma chimpancés.

Las diferencias entre humanos y chimpancés es 10 menor que entre ratones y las ratas.

Sólo es 10 veces mayor que entre dos personas cualesquiera

DE LOS GENOMAS A LAS CÉLULAS: EL TRANSCRIPTOMA Y EL PROTEOMA

TRANSCRIPTÓMICA:

DNA MICROARRAYS

No todo el transcriptoma será traducido.

Conocemos que todos los genes no van a estar expresándose continuamente. Puedo tomar el
RNA completo de una célula y de otra y compararlos entre sí para ver cuáles se expresan y en
qué condiciones. Para ello, se utilizan microarrays que suele consistir en un porta al que se unen
nucleótidos y a continuación se añaden RNAs marcados para ver si hibridan con las secuencias
de nucleótidos del porta, en el caso de hibridar emitirían fluorescencia que puede ser detectada
y así conocer la cantidad de RNA que tenemos. Sin embargo, esto está siendo sustituido por la
secuenciación, ya que se consigue mayor resolución.

RNASeq

Se capturan los RNAm y se analizan.

Ejemplo: El transcriptoma humano Transcriptoma del cromosoma 11 para ocho tipos celulares.
Las barras indican los niveles de expresión de los genes. La longitud de las barras azules es
proporcional a la cantidad de expresión génica. Las barras rojas indican genes con niveles de
expresión que se salen de la escala. (Montalva no pone nada).

PROTEÓMICA Y OTRAS ÓMICAS

La metodología para estudiar el Proteoma se denomina Proteómica y utiliza la electroforesis de


proteínas y la espectroscopía de masas. Mas allá del proteoma, el metaboloma es el conjunto
completo de metabolitos presentes en una célula o un tejido, en una serie de condiciones
particulares.

Genoma – transcriptoma – proteoma – metaboloma. Tendremos muchos transcriptomas y para


cada transcriptoma habrá un proteoma y para cada proteoma, un metaboloma.

METAGENÓMICA

─ También llamada genómica ambiental o ecogenómica. Más allá de la genómica.

─ Análisis, independiente de cultivo, del conjunto de genomas (metagenoma) de una comunidad


microbiana.

─ Ha experimentado un auge en los últimos años gracias a:

o Capacidad masiva de secuenciación


o Desarrollo de herramientas bioinformáticas para el análisis de la gran cantidad
de información que se obtiene en estudios metagenómicos.

Si sé la metogenómica puedo saber todo lo que puede hacer el organismo. En ocasiones los
organismos no los podemos cultivar y por ello, no podemos aislarlos, pero sí podemos coger una
muestra ambiental y secuenciar lo que hay en ella. Si estoy interesado en qué hacen los
organismos secuencio todo el genoma, si quiero conocer la presencia de un organismo en
concreto puedo utilizar cebadores específicos para RNAr 16S, ampliando esa molécula y así
identificando al microorganismo.

Se expresa en un sistema
heterólogo si lo puedo meter en
un vector.

Ahora no clonamos, hacemos las


dos flechas que salen del segundo
paso.

No es necesario clonar si solo


quiero conseguir secuenciación
masiva. Si realizo secuenciación
masiva puedo comparar
comunidades, ya que no todos los
microorganismos hacen todas las
12 funciones, sino que existen
muchas comunidades donde sus
microorganismos contienen poco
genoma porque cada uno de ellos
se ha especializado en una función
concreta. Las comunidades
procariotas pueden ser diferentes,
cada una es rica y diversa. Algunos
taxa están en todas partes (son
ubicuos) y otros son específicos de
ambiente
La microbiota humana como ejemplo

Microorganismos que viven dentro de los humanos sobrepasan* (en verdad no, entre las
mismas y 10 veces más) a las células somáticas y germinales por un factor superior a 10

- Humanos = Células de la microbiota + Células humanas


- Fondo genético = Genoma humano + Microbioma
- Caracteres metabólicos = Caracteres humanos + Caracteres microbianos

También podría gustarte