Documentos de Académico
Documentos de Profesional
Documentos de Cultura
- Incluye las regiones que contienen la información + las secuencias responsables de su correcta
expresión
-QUÉ ES UN GENOMA
Todos los organismos (sistema biológico con estructura celular, por eso virus no son
organismos, son subcelulares, no son m.o, son microbios) presentan genomas de DNA de doble
cadena. Por ello, la longitud de las moléculas se define en pares de bases (pb) y sus múltiplos
(kb, Mb, Gb).
-QUÉ ES LA GENÓMICA
GENOMICA: Estudio molecular del contenido, organización, función y evolución de la
información genética contenida en un genoma completo.
Los estudios genómicos se caracterizan por ser interdisciplinares: la enorme cantidad de datos
generados requiere combinar tanto conocimientos relativos a diversas disciplinas biológicas
(genética, bioquímica, biología celular, biología evolutiva…), como conocimientos estadísticos e
informáticos.
La diferencia con la genética, es que la genética estudia los genes uno a uno; mientras que la
genómica hace un estudio global, analizando la secuencia de DNA para conocer todo lo que hay
en esa secuencia.
Diversas subdisciplinas:
Cartografiar y determinar de forma completa y precisa la secuencia de DNA del genoma haploide
representativo de una determinada especie, indicando la información que contiene.
La secuencia de cada genoma aporta una ingente cantidad de información, ya que permite:
Propuesta inicial: DOE (Department of Energy, USA), 1986 secuenciar el genoma humano para
una evaluación sistemática del efecto de las radiaciones
Se pretende secuenciar el genoma humano para una evaluación sistémica del efecto de las
radiaciones. Se propone para este proyecto formar una organización denominada HUGO. Con la
formación de esta organización se pretende que se trabaje simultáneamente en todos los
lugares del mundo y así poder dividir el trabajar y compartir la información que obtengan.
─ Planificado a 15 años
─ Dos etapas:
─ Valor añadido:
─ Las lecturas se analizan con programas informáticos que encuentran secuencias idénticas y
permiten conectarlas en secuencias más largas o contigs (los fragmentos que ha puesto juntos
eran continuos, es la secuencia original si no se hubiese cortado). A este proceso se le
denomina ensamblaje.
─ El objetivo final es conseguir que cada cromosoma se encuentre unido en un solo contig.
Así se secuencia poco a poco, pero con la lectura conseguiré la secuencia final, denominada
secuencia consenso (puede darse errores y no ser la original 100%). Lo he leído al menos 6 veces
en un sentido y en otro, y la base que más aparezca, estará en la secuencia consenso.
“SHOTGUN” GLOBAL
─ Plantea problemas si el genoma presenta secuencias repetitivas. Imaginar que tengo una
secuencia que aparece repetidas 7 veces consecutivas. Cuando se fragmenta el genoma, si se
encuentra un extremo de una secuencia repetida con otra secuencia repetida que no es la
consecutiva, puede ser que se salten algunas secuencias. Si la secuencia repetida se encuentra
algo alejada respecto a otra, se pueden juntar los extremos y puedo perder toda la información
del medio y puede 6 ser que sean repeticiones que estén en cromosomas distintos. Por tanto,
plantea problemas si el genoma presenta secuencias repetitivas.
Perdigonada. Cada una de las secuencias es como un perdigón. Cuando lo secuencio todo junto.
Si hay regiones repetitivas, los ensambla, no sabré cuánto de largo era la repetición, o incluso
puede que esté en sitios diferentes o cromosomas diferentes y lo juntan. Mirar mutaciones
cromosómicas para la organización de cromosomas. Para saber si hay o no esa traslocación, se
utiliza lo de abajo:
Primero hago un mapa, secuencia los segmentos solapantes y luego lo otro. Secuencio por
partes, jerárquicamente. Se fragmenta el genoma en fragmentos manejables, cada uno de ellos
va a ser aislado y cada uno de ellos va a ser roto aleatoriamente hasta las secuencias que pueden
ser secuenciadas por “shotgun”. A continuación, busco marcadores genéticos moleculares en
cada uno de los segmentos, lo que me permite identificar marcadores comunes, y por tanto,
ordenarlos. Puedo hacer el mapa de todos esos fragmentos y ver cómo coinciden esos mapas.
Una vez tenga los mapas, puedo secuenciar cada fragmento, pero no todos, se seleccionan los
segmentos mínimamente solapantes para su secuenciación completa. ¿Cómo secuencia cada
uno? Mediante shotgun. En definitiva, secuencio lo que me es útil después de hacer el mapa.
Una vez conocida la secuencia completa del genoma de un organismo, el paso siguiente es
realizar predicciones sobre qué regiones del mismo contienen información relevante.
Buscar todos los elementos funcionales y darles un significado funcional. Es un programa de
anotación. Primero los identifico (anotación estructural), y luego digo que hacen (anotación
funcional).
- “Gene finding”: ORFs y genes de RNA (no solo los que codifiquen proteínas) (longitud, uso de
codones o estructura secundaria…)
- Elementos reguladores
Anotación funcional
- Función bioquímica
- Función biológica
- Regulación e interacciones
- Expresión
Intrínsecos (ab initio) Se basan sólo en el análisis de las características de la secuencia que
está siendo analizada. Modelos probabilísticos complejos analizan 2 tipos de signos:
La longitud de la ORF importa. Si en medio de dos ORF no hay ningún promotor, es todo un
operón creo, preguntar.
Extrínsecos
Premisa: las secuencias conservadas en diferentes organismos es muy probable que hayan
mantenido funciones similares, tanto más cuanto mayor sea el grado de homología entre ellas.
- El servidor de BLAST, mantenido por el NCBI, permite realizar búsquedas contra bases
de datos de DNA y proteínas en permanente actualización.
- Una búsqueda con BLAST permite comparar una secuencia diana (“query”) con una base
de datos de secuencias, e identificar aquellas que se parecen a la diana por encima de
un determinado umbral.
- La principal ventaja del algoritmo usado por BLAST es su velocidad, una característica
esencial para que resulte práctico, debido a la inmensa cantidad de información
disponible en las actuales bases de datos de secuencias
Si homología baja, negro, y si más de un 80% es cuando magenta o rojo. Verde intermedio.
Los estudios de homología son también muy útiles para definir correctamente los genes:
─ Las ORF cortas pueden ser genes reales si secuencias similares se encuentran en la misma
posición (sintenia*) en otros genomas de las bases de datos.
Los programas de anotación actuales suelen combinar métodos intrínsecos y extrínsecos… pero
ningún sistema de anotación es infalible:
Sintenia conservada: conservación del orden génico y orientación a lo largo del cromosoma en
diferentes especies.
Podemos refinar las anotaciones estructurales mediante estudios experimentales:
2. Secuenciación de cDNA:
Secuenciando el cDNA se tiene el mRNA de un gen. Al comparar una secuencia de cDNA
con una secuencia de DNA genómico se delimita la posición de los intrones de ese gen.
Una vez hemos localizado los genes en la secuencia genómica, necesitamos averiguar su función
y proponer un nombre para cada uno de ellos: Þ análisis computacionales y estudios
experimentales.
Clasificación en ortólogos, genes que vienen de un ancestro común, pero no son iguales. Los
grupos con mayor número de genes son los poco caracterizados.
El problema de analizar los genes ortólogos (secuencias homólogas que se han separado por un
evento de especiación) es que el mismo gen puede tener distintas denominaciones. Para tratar
de evitar eso se promueve una iniciativa según la cual se pretende utilizar términos estándar. Se
caracterizan los genes en base a su función, su posición en la célula y el mecanismo molecular
en el que están implicados. Esto facilita mucho el intercambio de datos entre las diferentes bases
de datos.
1. Inactivación génica:
Los genes responsables de una función se identifican porque cuando no son activos producen
fenotipos mutantes. La estrategia es mutar el gen (disrupción génica) e identificar el cambio
fenotípico resultante. Si no ocurriese nada, no sabríamos para qué sirve.
2. Supresión de la expresión génica:
RNA de interferencia (siRNA) y RNA antisentido (complementario al RNAm) y así evitar que el
RNAm pueda expresarse al formar una doble cadena con el complementario. Impedimos que se
dé la proteína, si sobrevive no era esencial y si no, era esencial.
GENÓMICA COMPARADA
Dos organismos con un ancestro común relativamente reciente tendrán genomas que presenten
diferencias especie-específicas, pero construidos sobre un plan común procedente del genoma
ancestral.
Las cuestiones abordadas por la genómica comparada es poder conocer el número mínimo de
genes indispensable para crear un organismo, así como, conocer qué familias de proteínas son
universales y cuáles específicas de un organismo.
Las diferencias entre humanos y chimpancés es 10 menor que entre ratones y las ratas.
TRANSCRIPTÓMICA:
DNA MICROARRAYS
Conocemos que todos los genes no van a estar expresándose continuamente. Puedo tomar el
RNA completo de una célula y de otra y compararlos entre sí para ver cuáles se expresan y en
qué condiciones. Para ello, se utilizan microarrays que suele consistir en un porta al que se unen
nucleótidos y a continuación se añaden RNAs marcados para ver si hibridan con las secuencias
de nucleótidos del porta, en el caso de hibridar emitirían fluorescencia que puede ser detectada
y así conocer la cantidad de RNA que tenemos. Sin embargo, esto está siendo sustituido por la
secuenciación, ya que se consigue mayor resolución.
RNASeq
Ejemplo: El transcriptoma humano Transcriptoma del cromosoma 11 para ocho tipos celulares.
Las barras indican los niveles de expresión de los genes. La longitud de las barras azules es
proporcional a la cantidad de expresión génica. Las barras rojas indican genes con niveles de
expresión que se salen de la escala. (Montalva no pone nada).
METAGENÓMICA
Si sé la metogenómica puedo saber todo lo que puede hacer el organismo. En ocasiones los
organismos no los podemos cultivar y por ello, no podemos aislarlos, pero sí podemos coger una
muestra ambiental y secuenciar lo que hay en ella. Si estoy interesado en qué hacen los
organismos secuencio todo el genoma, si quiero conocer la presencia de un organismo en
concreto puedo utilizar cebadores específicos para RNAr 16S, ampliando esa molécula y así
identificando al microorganismo.
Se expresa en un sistema
heterólogo si lo puedo meter en
un vector.
Microorganismos que viven dentro de los humanos sobrepasan* (en verdad no, entre las
mismas y 10 veces más) a las células somáticas y germinales por un factor superior a 10