Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Carlos J. Minahk
Instituto de Química Biológica “Dr. Bernabé Bloj”. Fac. de Bioq., Qca y Fcia. - UNT
Instituto Superior de Investigaciones Biológicas (CONICET/UNT)
carlos.minahk@fbqf.unt.edu.ar
Tel: 0381-4248921 int. 205
Si bien conociendo el genoma de un organismo podemos predecir hasta cierto punto la
expresión de los genes codificados e inferir las diferentes actividades enzimáticas y
metabólicas derivadas (genómica), el mero conocimiento de la secuencia completa del
DNA no puede darnos ninguna certeza. Es preciso estudiar qué genes se expresan en un
determinado momento y en una determinada condición (transcriptómica), y para conocer
el cuadro completo es necesario hacer un estudio de las proteínas presentes en cada
situación y cómo interaccionan entre sí (proteómica e interactómica). Los diferentes
procesos biológicos que se activan o desactivan a consecuencia de estos cambios tiene
impacto en los metabolitos que se generan en las células (metabolómica).
El genoma es algo fijo, no cambia la información con el tiempo en una misma célula.
Por el contrario, los RNA que se expresen en cada célula sí cambian en el tiempo, cambian en respuesta a los
estímulos a los que son sometidas las células.
El hecho que una célula tenga presente en su genoma un determinado gen no significa necesariamente que ese
gen se expresará en algún momento. Por ejemplo el gen que codifica para la albúmina no se expresará nunca
en una neurona.
Las funciones y actividades metabólicas que desarrolle una determinada célula dependerá entonces no de los
genes presentes en su DNA sino de aquellos genes que se expresen.
El conjunto de todos los RNA de todo tipo que presenta un célula se denomina transcriptoma y su estudio se
denomina transcriptómica.
≥ 200 nucleótidos
ncRNA regulatorio
(de 19 a 22 nucleótidos)
El Northern blot solo permite analizar en forma semi-cuantitativa la expresión de genes utilizando sondas específicas
para los mRNA en estudio. Similar a lo que sucede con la PCR en tiempo real, que es una excelente herramienta,
cuantitativa, pero limitada a un grupo reducido de genes (cebadores específicos para cada uno)
El microarray permite estudiar todos los mRNA que se están expresando en un determinado tiempo, mediante el uso
de chips conteniendo las secuencias de todos los genes conocidos. Sin embargo, esta técnica no permite encontrar
nuevos transcriptos ya que está limitada a las sondas que tiene cada chip, fusiones de genes e isoformas no se
pueden encontrar, tampoco variantes de nucléotido único. Por último, no son sensibles para detectar diferencias
sutiles en los niveles de expresión.
Las tecnologías de secuenciación de nueva generación (NGS) son las más utilizadas en los últimos años para
estudiar el transcriptoma.
Proyectos de investigación
aprobados por NIH para
estudiar expresión de Chimenti (2017)
genes https://www.youtube.com/watch?v=7BLS_YY9HeM&t=51s
mRNA Seq
El primer paso luego de realizar el experimento es extraer y purificar el RNA mensajero. Será diferente el
procedimiento según se esté trabajando con una célula eucariota o con una célula procariota. Luego se procede a la
secuenciación
https://rockefelleruniversity.github.io/RU_RNAseq/presentations/slides/RU_RNAseq_p1.html#1
Secuenciación sin síntesis de ac. nucleicos largos (Nanopore)
Mediante una secuencia adaptadora se une a
un motor que permite la entrada de una hebra
de DNA a través de un poro por el que pasa
corriente. Los cambios que se ven en la
corriente dependerá del tamaño de la base
nitrogenada que esté entrando.
Permite secuenciar fragmentos muy largos de
DNA (tercera generación de secuenciadores).
Leggett & Clark (2017) J Exp Bot 20: 5419–5429
En primer lugar es preciso enriquecer las a. captura de RNA b. degradación del RNA procesado
muestras en mRNA por lo menos del 1-5% al perlas magnéticas con sondas que se
50% del total de RNA disminuyendo el rRNA + unen específicamente al rRNA
tRNA de 95% a 50%.
Chung, M., Bruno, V.M., Rasko, D.A. et al. Best practices on the differential expression
analysis of multi-species RNA-seq. Genome Biol 22, 121 (2021)
Por otro lado, también se pueden alinear las secuencias obtenidas en la secuenciación con transciptomas anotados (en
vez de hacerlo contra genomas de referencia). Esto se llama pseudo-alineamiento y es una salida mucho más rápida
que la anterior, solo que está limitada a que existan transcriptomas depositados. Por otro lado, haciendo esto se
sacrifica la posibilidad de encontrar nuevos transcriptos. Es una estrategia mucho más ágil y más corta que comparar
genomas.
En estos casos, son precisos otros programas como ser Kallisto y Salmon-Quasi
genoma
transcriptoma
La transcriptómica se utiliza principalmente para conocer qué genes se expresan en una condición comparada
con otra. Análisis cualitativo
Pero las NGS aplicadas al estudio del transcriptoma también permiten cuantificar cuánto hay de cada
transcripto. Cuantas más copias haya de un determinado mRNA, tanto mayor será la señal/lectura obtenida.
En general se compara la expresión de los transcriptos entre 2 o más situaciones o condiciones diferentes pero
también se puede comparar la expresión de varios genes en una misma condición.
A
D 1 copia y 60 lecturas
B
E
2 copias y 48 lecturas
F
3 copias y 48 lecturas
Las lecturas obtenidas se deben normalizar para evitar estos problemas. Una forma es la RPKM (reads per
kilobase million) o también FPKM (fragments per kilobase milion). Alternativamente se puede utilizar TPM (transcripts
per million)
Primero se normaliza por el tamaño de cada gen Luego se normaliza por la profundidad de lecturas sobre los
(se dividen las lecturas en las kilobases de cada gen) valores ya normalizados por los tamaños de los genes
Con esta estrategia se pierde la capacidad de analizar los posibles cambios en las secuencias de los transcriptos
(análisis cualitativo) para enfocarse exclusivamente en la medición cuantitativa
Los estudios in silico del genoma pueden haber predicho una determinada estructura de un operón, en este
Sorek & Cossart
ejemplo, un operón de 4 genes. Sin embargo, los resultados de la transcriptómica permiten ver que en realidad (2010) Nat Rev Genet
el sistema tiene un operón de 3 genes y luego el cuarto gen se transcribe en forma independiente 11: 9-16
La transcriptómica trajo asociada la cuarta generación de secuenciación de ácidos nucleicos: secuenciación in situ
Existe una variedad de técnicas relacionadas, pero todas apuntan a obtener información de la expresión genética en
una célula determinada o en diferentes células de un tejido.
Los cortes son analizados por imágenes, cada pixel identificado y asociado a un tipo celular.
Una vez permeabilizadas las células, los mRNA se unirán por su poliA a las regiones de captura conteniendo poli dT. Se
realizará una retrotranscripción y luego los cDNA conteniendo el código de barras se cortarán y serán secuenciados por
Illumina.
Finalmente se analizará qué secuencias fueron identificadas y cuánto había de cada una en cada spot del chip,
correlacionando esto con la información del tipo celular presente
Además de los mRNA existen otros RNA que son estudiados por secuenciación: los RNA cortos y los RNA largos no
codificantes.
Los diferentes lncRNA
intrónico intergénico divergente reciben su nombre de
acuerdo a dónde se
encuentran codificados
RNA codificando proteína
No se purifica el
extracción de RNA total RNA con oligo dT
y eliminación del rRNA
(a diferencia de todos los
casos anteriores, para Remoción de los transcriptos que
RNA no codificante no se codifican para proteínas
transcriptos ensamblados
puede porque no todos
preparación de la los ncRNA tienen poliA) transcriptos conocidos por
biblioteca y secuenciación codificar proteínas