Está en la página 1de 20

Genómica 3º Biotecnología

Tema 5
Análisis de expresión

1. Introducción

El objetivo es cuantificar niveles de RNA de todos los genes del genoma.


A lo largo de este tema estudiaremos diferentes metodologías para el análisis de la
expresión del DNA a nivel genómico, no a nivel de un gen concreto sino a nivel del
genoma competo. El problema de los niveles de expresión es que en función de la
condición del cultivo o del tejido varían los genes que se manifiestan, así como el nivel
de la expresión de un mismo gen. Los niveles de RNA van a variar en función del tipo
celular, estado de desarrollo y de los estímulos externos (estreses). El momento y
localización de la expresión proporciona información sobre la función génica. Este es el
problema de cuantificar y cualificar la expresión en RNA.

Transcriptoma: conjunto de los diferentes RNA mensajeros de la célula. Los estudios


de transcriptoma van a ser estudios de tipo coyuntural.

 Microarrays: metodología basada en análisis mediante hibridación. En


principio van a ser ensayos de tipo cualitativo. Los métodos que se llevan a cabo
son:
- Construcción de microarrays.
- Comparative Genomic Hybridization (CGH) arrays.

 Real-time PCR: se emplea para llevar a cabo estudios de niveles de expresión


aunque no a nivel de genoma completo. No es muy empleada.
 Análisis mediante secuenciación de RNAs:
- SAGE (Serial Analysis of Gene Expression) (obsoleto).
- MPSS (Massively Parallel Signature Sequencing) (obsoleto).
- MACE (Massively Analysis of Gene Expression): técnica derivada del
SAGE.
- RNA-seq (secuenciación masiva de de RNA o más bien de cDNA).

75
Genómica 3º Biotecnología

2. Hibridación

Los ensayos de hibridación más empleados son los microarrays basados en hibridación
al igual que sucedía en el bloting. Normalmente se lleva a cabo hibridación cDNA con
DNA.

Los microarrays o arrays consisten en una superficie sobre la que se fijan


ordenadamente pequeños oligos monocatenarios de secuencia conocida de DNA. Suelen
ser fragmentos pequeños de unos 15 o 20 nucleótidos. El tamaño de la plataforma se ha
ido reduciendo a la vez que el número de celdillas ha ido aumentando. Inicialmente el
revelado se llevaba a cabo mediante radiactividad pero en la actualidad se lleva a cabo
un marcaje con fluorocromos. Lo que se hace es una matriz con secuencias conocidad
que se pueden
posicionar. Los
oligos pueden
incorporarse
fabricados o
polimerizarlos “in
situ”. Actualmente,
el array es una
superficie cristalina
que se recubre con
streptabilina de
modo que los
oligos, que tienen
biotina unida se
van a fijar a la
superficie.

Las secuencias que contiene originalmente el chip pueden introducirse directamente


formados mediante la unión a biotina o polimerizarse “in situ” en la superficie del chip.
Si nos encontramos en el segundo de los casos, se comienza con un nucleótido unido a
biotina, por el que se unirá a la superficie que contiene streptabilina, y por el otro
contienen un complejo fotolábil que se va a escindir cuando se irradie con una
determinada longitud de onda. Este complejo protector va a ocultar el extremos 3’ del
nucleótido. Los complejos van a ser diferentes, es decir, que se escinden con diferentes
longitudes de onda. De esta manera al irradiar, no todos los complejos se escinden,
dejando libres algunas posiciones. A continuación, se añade el segundo tipo de
nucleótido, también provisto con el complejo protector, de modo que se unirán donde el
complejo haya sido escindido. De esta forma vamos a ir diseñando el oligo que
queremos tener en el chip.

76
Genómica 3º Biotecnología

Para realizar el array, en primer lugar se lleva a cabo la extracción del RNA y se
convierte a cDNA. A este cDNA se le añaden fluorocromos de diferentes colores en
función de lo que queramos estudiar. El cDNA se añade al chip (se vierte), se mezcla
todo el cDNA para que se extienda bien por toda la placa y pueda unirse a los oligos y
se deja incubando en condiciones de hibridación. A continuación se lava para eliminar
el exceso de cDNA que no ha hibridado y se procede a revelar los resultados mediante
fluorescencia.
De esta manera podremos conocer cómo hay genes que se expresan en unas
condiciones, en otras o en ambas, por ejemplo. Inicialmente, esta era su única función
que tenía esta metodología, pero actualmente, nos permite conocer qué genes se
expresan, así como la intensidad de síntesis.

La pareja de fluorocromos más empleada en este tipo de ensayos van a ser el Cy-3 y el
Cy-5 que presentan distintos espectros tanto de absorción como de emisión.

El primer trabajo importante que se publicó en el que se basaba esta metodología fue el
análisis en la regulación del ciclo celular.

77
Genómica 3º Biotecnología

Una de las aplicaciones que


tiene en la actualidad esta
metodología está centrada en
los chips para el análisis de
tumores. Estos chips están
preparados para el estudio de
genes que se expresan en
tumores. Permite hacer un
chequeo rápido para
diagnosticar un tipo de tumor
concreto.

78
Genómica 3º Biotecnología

3. Comparative Genomic Hybridisation(CGH) arrays

El CGH array es una variante de los arrays convencionales. En este caso la finalidad no
es el análisis de expresión. Se lleva a cabo una hibridación DNA-DNA pero no cDNA.
Se emplea en medicina con frecuencia.

Se lleva a cabo la hibridación de DNA de pacientes frente a un chip preparado con


oligonucleótidos concretos. Se emplea en tumores para ver fenómenos de duplicaciones
y deleciones génicas.

Los arrays están cargados con secuencias conocidas de tumores, de modo que se
muestra si hay más de una dosis de un gen concreto, o si por el contrario está
delecionado. Se compara la intensidad relativa de fluorescencia generada por el DNA de
un individuo control respecto de la muestra del paciente. Se compara la intensidad de
dos fluorocromos de modo que el control tiene asignado un color y el paciente otro. Se
observa la relación de intensidades entre estos. Así, mediante la relación de intensidad
podemos encontrar deleciones y duplicaciones respecto del control.

79
Genómica 3º Biotecnología

4. Ensayos de normalización

Cuando se llevan a cabo estudios de expresión e interesa conocer qué genes se expresan
y llevar a cabo el análisis cuantitativo de los niveles de expresión, no se debe practicar
ensayos de normalización, porque no permite hacer ensayos cuantitativos. Sin embargo,
si únicamente no interesa identificar los genes que se expresan sí se deben llevar a
ensayos de normalización.

Normalización: metodología que nos va a permitir disminuir la presencia en el ensayo


de transcritos que se expresan moyoritariamente, dejando percibir aquellos que se
expresan en menor medida y tienen menor representación. Con estos ensayos,
aseguramos que los genes que se expresan mucho y que por lo tanto dejan mucho
transcrito no interfieran.

Cuando se realiza la
extracción del RNA, la
mayor parte del RNA va a
ser del tipo ribosomal, sin
embargo, sin nos fijamos en
el mRNA, habrá pocos genes
cuya transcripción es muy
activa y que por lo tanto la
carga en mRNA es muy
grande mientras que hay
muchos genes que se
expresan muy pocos. Con la
normalización se disminuye
la carga de mRNA, sobre
todo de los que se expresan
mucho. Debido a esta razón
no podemos llevar a cabo
estos ensayos cuando
pretendamos realizar un
ensayo cuantitativo. Hay que
tener en cuenta que la
reducción no es constante y
que se reduce RNA de todos
los tipos.

El proceso se lleva a cabo por hibridación y requiere del empleo de la enzima DSN,
capaz de degradar dúplex bicatenarios perfectos. Empleando un adaptador que presenta
un poli-T se genera la copie en cDNA de los mensajeros. A continuación, se
desnaturaliza, de modo que tenemos en solución tanto los mensajeros como sus
complementarios cDNAs. Se devuelven las condiciones fisiológicas de modo que se
80
Genómica 3º Biotecnología

permite la hibridación. En
esta renaturalización, los
mRNA más numerosos
tendrán mayor facilidad
que los que tienen poca
representación de modo
que los minoritarios no
suelen encontrar su
complementario.

A continuación, se trata
con la enzima DSN de
modo que va a degradar
los dúplex que sean
perfectos. Lo que queda
tras el tratamiento son copias de todos los tipos de RNA y las copias de cDNA pero
habiendo reducido el número. Después, se trata el medio con RNAasa para eliminar el
RNA de modo que ahora solo nos quedamos con las copias de cDNA que no hibridaron.
Como el cDNA tiene un poli-T se lleva a cabo la replicación, obteniendo dúplex de
cDNA.

La clave del proceso es la etapa de hibridación de modo que los tiempos que se tienen
que mantener es crucial porque si se alarga en el tiempo, prácticamente todo el RNA
hibridará.

5. Técnicas para llevar a cabo ensayos de expresión

5.1. SAGE (Serial analysis of gene expression)

Metodología que emplea la secuenciación. Esta técnica está desfasada actualmente pero
es importante porque dio lugar a otra metodología. Cuando se lleva a cabo, no se lleva a
cabo una normalización previa porque se pretende llevar a cabo el análisis de genes y un
ensayo cuantitativo.

La metodología trabaja con cDNA bicatenario obtenida a partir de mRNA. El cDNA


bicatenario tienene unido un resto de biotina junto al poli-T. La mezcla de cDNA total
es cortada con una enzima de restricción a digestión completa de forma que la enzima
corta los fragmentos por varios puntos. La técnica trabaja con los fragmentos de
restricción más próximos al poli-A. Esto se consigue añadiendo bolas recubiertas con
streptabilina, ya que los fragmentos llevan unida biotina. A la bola de streptabilina van a
unirse diferentes fragmentos procedentes de mensajeros distintos. Es posible que
algunos de los fragmentos sean idénticos.

81
Genómica 3º Biotecnología

Como conocemos la secuencia de restricción se lanzan contra el sistema unos


adaptadores con la secuencia complementaria a la diana. Estos adaptadores presentan la
diana de restricción para enzimas de restricción 2S (Foc I). Este tipo de enzimas de
restricción tienen la particularidad de reconocer la diana y cortar a una distancia de la
diana, independientemente de la secuencia que haya en el punto.

Ahora la enzima se pone a trabajar y corta en dirección hacia la bola a una determinada
distancia. La secuencia que corta es totalmente desconocida. A continuación se lleva a
cabo una primer extensión para rellenar el hueco de la enzima de restrcción y se manda
a secuenciar el fragmento.

En resumen, lo que se hace en esta metodología es obtener información de unos 25


nucleótidos del fragmento de modo que se identifica cada mensajero por los 25
nucleótidos. Los 25 nucleótidos corresponden al extremo 3’ terminal del mensajero (no
son los últimos). Esta zona terminal es una zona pobre respecto a la secuencia proteica
tanto en eucariotas como en procariotas porque pertenecen a la zona UTR de los
mensajeros.

Esta zona UTR son zonas ricas en monotonía de bases, propensas a fenómenos de
edición. Mediante el análisis BLAST de estas secuencias y otros, podremos saber el
RNA con el que se corresponde.
De todas las secuencias de 25 nucleótidos, veremos cómo hay secuencias que se repiten
más y otras menos lo que permite cuantificar la expresión. Por ejemplo, podríamos
obtener de A 5000, B 1000, C 100 y de Z 1, de modo que podríamos llegar a la
conclusión de que A se expresa 5000 veces más que Z. El problema es que no es una
zona buena porque está sujeta a diversos fenómenos de modificación.

El principal problema que presenta la técnica SAGE es que estudiamos únicamente 25


nucleótidos del extremo 3’ terminal (región UTR). En esta región la secuencia es muy
mala por lo que los análisis que podemos llevar a cabo pueden no ser del todo de buena
calidad.

En ocasiones, se lleva a cabo una PCR empleando como cebador la secuencia


complementaria al poliA. De este modo podemos sintetizar la complementaria y obtener
más información pero esto supone un trabajo mayor.

82
Genómica 3º Biotecnología

5.2. MACE (MassiveAnalysisof cDNAEnds)

Esta técnica surge derivada de la técnica SAGE. En primer lugar, se lleva a cabo el
aislamiento del RNA total y se procede a la conversión a cDNA. La diferencia con la
SAGE es que en lugar de emplear una enzima de restricción, se lleva a cabo sonicación.
Lo que conseguimos es que las múltiples copias se rompan en fragmentos diferentes.

A continuación, se procede a la secuenciación de los fragmentos obtenidos. Previo a la


secuenciación, se unen a los fragmentos unos adaptadores que llevan unida biotina lo
que nos permite unión a streptabilina.

El resultado que obtenemos es llevar a cabo la identificación con secuencias de tamaño


mayor a los 25 nucleótidos que obteníamos en el SAGE. Ahora disponemos un
fragmento de cientos de nucleótidos que podemos lanzar a un BLAST de modo que no
se hace a partir de 25 nucleótidos sino de un fragmento de gran tamaño.

83
Genómica 3º Biotecnología

Con la técnica MACE se ahorra el uso de la enzima de restricción y además el


fragmento obtenido es mayor. También podemos cuantificar cuantos RNAs había
porque para formar el fragmento hemos cuantificado los RNAs que había en un
principio.

5.3. RNA-seq

La técnica de RNA-seq es la más


empleada en la actualidad por las
oportunidades que ofrece. Está basada
en la secuenciación del RNA. En
primer lugar, se procede a la extracción
del RNA total que se convierte
posteriormente a cDNA. A
continuación, se procede a la sonicación
y después se adicionan unos
adaptadores a los fragmentos
generados. Los adaptadores se
adicionan para llevar a cabo
secuenciación. Se procede a la
secuenciación de todos los fragmentos
y se realiza el montaje. Una vez
montadas las secuencias, las secuencias
se lanzan contra una base de datos. Las
secuencias montadas son grandes unidades por lo que la información que obtenemos de
ellas es enorme.

84
Genómica 3º Biotecnología

No obstante, pueden aparecer


incongruencias a la hora de
obtener los resultados finales.
De promedio, una especie
posee unos 25 000 genes
proteicos, pero esta técnica
puede dar como resultado un
número mayor o menor. En
este caso, hay que depurar los
resultados. Además, hay que
tener en cuenta que no todo el
genoma se expresa a la vez.

El método RNA-seq es más


simple a la hora de llevar a
cabo el montaje si se compara
con el montaje de genomas,
porque no está todo el genoma
y por tanto la cantidad que
existe es menor en número de secuencias. Pueden aparecer también problemas con
casos de splycing, porque en el momento de la extracción, parte de los RNA estarán
procesados, otros no procesados y otros en proceso de splycing.

Para estimar los niveles de expresión, dentro del RNA-seq existen varios índices que no
solo tienen en cuenta el número de veces que aparece un fragmento sino que lo refiere al
tamaño de los genes. Uno de ellos es el RPKM que relaciona el número de lecturas en
función de la longitud del fragmento y el tamaño del genoma.

85
Genómica 3º Biotecnología

El índice RPKM se calcula como el número de lecturas partido por el tamaño del
fragmento (número de bases / 1000) y por el N del fragmento.

La ventaja de estos métodos es que consideran el tamaño del genoma o de la secuencia


estudiada así como el tamaño final que se obtiene, evitando el error por no tener en
cuenta el tamaño. De este modo, aunque un gen grande tendrá más lecturas que uno
pequeño aunque se expresen igual, podemos determinar la expresión de ambos.

El problema al que nos referíamos anteriormente referido a que se obtenga un número


desorbitado respecto del estándar en el número de genes puede deberse a lo siguiente. A
veces, la transcripción de una zona del genoma se realiza en las dos hebras y ambos
transcritos se someten al mismo procedimiento. Cuando llevamos a cabo el montaje
podemos encontrar un solapamiento entre las secuencias. Estas situaciones dan
infinidad de posibilidades lo que puede llevar a que la carga aumente o disminuya
respecto de lo esperado. Este problema se debe a que en el cDNA no podemos
diferenciar entre los dos transcritos.

No obstante, para subsanar este problema, existen algoritmos matemáticos que permiten
determinar cuántas de las lecturas pertenecen a una zona de solapamiento y permiten
estimar cuantas proceden de la transcripción en un sentido o en el opuesto con ello
podemos determinar cómo se expresa una determinada zona del genoma.

Mapeo con RNA-seq

Otra de las utilidades que ofrece la metodología RNA-seq, no relacionada con el análisis
de expresión, es la obtención de mapas genéticos ya que nos permiten que afloren
polimorfismos (SNPs).

86
Genómica 3º Biotecnología

Cuando hacemos secuenciación y el posterior montaje, en el primero de los casos como


es homocigoto aparece A, en el tercer, como es el otro homocigoto aparece C y en del
medio aparecen ambos porque se corresponde con el heterocigoto.

Como el RNA-seq nos proporciona unidades de montaje muy grandes obtenemos


multitud de marcadores pudiendo obtener cómo son los individuos, es decir, si son
homocigotos para un marcador, para el otro o si es heterocigoto. A continuación,
podemos encontrar los diferentes cuadros de lectura obteniendo codones de fin y
detectar así el gen. Así podemos construir mapas con multitud de marcadores y con los
genes delimitados.

Uno de los problemas en cuanto al manejo en el laboratorio cuando se trabaja con RNA
es la presencia de rRNA. La presencia de este tipo de RNA enturbia los análisis tanto en
la extracción como en pasos posteriores. Por ello hay formas de disminuir en número
estos RNAs como la normalización.

Existe un método que sirve para que afloren los mRNA. Un RNA sin procesar tiene, a
parte del CAP en el 5’ un nucleótido trifosfato, mientras que el resto de RNAs sí están
procesados y no presentan este nucleótido trifosfato. Estos ensayos requieren de una
enzima, la TEX que es capaz de degradar los RNAs con extremos 5’ procesados de
modo que se trabaja con los fragmentos que deja la enzima. EL número de RNAs que
corresponden a mensajeros ahora se incrementa en el tratamiento con la TEX a
diferencia del estudio donde no se trató con la enzima.

87
Genómica 3º Biotecnología

Uno de los problemas que presenta la metodología RNA-seq aparece a la hora de llevar
a cabo la preparación de muestras debido a la presencia incómoda de rRNA. Por lo
tanto, se llevan a cabo algunas técnicas para diezmar este tipo de RNA como son las
siguientes:

 Tras la extracción, el RNA total se


fracciona, en un caso en fragmentos de
pequeño tamaño, mientras que en el otro
en fragmentos de gran tamaño. Siguiendo
la metodología que se muestra en el
esquema, podremos reducir la carga de las
secuencias de rRNA desde un 85% a un
7% en el caso del fraccionamiento
pequeño o en un 12% en el caso del
fraccionamiento grande. Así, podremos
reducir todo tipo de RNAs para que los
ensayos posteriores sean más sencillo.

88
Genómica 3º Biotecnología

 En el segundo de los casos, a partir de una muestra total de RNA, se fracciona


en dos alícuotas y se fracciona una de ellas en secuencias de pequeño tamaño (<
200nt) y la otra en fragmentos grandes (> 200). A continuación, se añaden
adaptadores y se convierte a cDNA. En un paso posterior se pone en condiciones
de desnaturalización. Lo que ocurre es que el rRNA va a hibridar mucho más
rápido porque tiene mucha representación. Los adaptadores presentaban biotina
lo que nos permite captar los fragmentos después de la hibridación. Lo que
sucede es algo similar a una curva Cot.

El desarrollo de RNA-seq ha ido en paralelo a


ensayos de tipo celular, es decir, de estudios en los
que se trabaja con RNA de un único tipo celular o
de una única célula. Lo que se hace es emplear
anticuerpos específicos para cada una de las
células de un tejido en los diferentes tipos
celulares. A continuación, con cada tipo se hacen
ensayos de RNA-seq.

En otro caso, se aíslan células individualizadas, de


modo que de cada célula se extrae el RNA total
que se asocia con una secuencia “código de
barras” para diferenciarle de los demás. A
continuación se lleva a cabo el RNA-seq de todos
los cDNAs en estudio y no de una única célula.

Desde principios del siglo XXI se ha desarrollado


el denominado proyecto ENCODE, un proyecto
europeo que se ha desarrollado en varias fases y
que se ha desinado al estudio de los niveles de
expresión del genoma humano.

89
Genómica 3º Biotecnología

6. Estudio del degradoma

El proceso de transcripción en la célula es un proceso muy sucio que deja multitud de


“basura” tras de sí. No obstante esa basura puede ser estudiada y obtener información de
ella. Por ejemplo, cuando se transcribe un RNA, este procede de una de las dos hebras
del DNA. Sin embargo, cuando se transcribe una hebra, suele transcribirse la otra, pero
el transcrito que se obtiene no va contener información para traducción por ejemplo,
sino que suelen ser secuencias intrónicas que estabilizan el transcrito. El RNA estable
necesita de la unión entre las dos cadenas, ya que se ha comprobado que, los niveles de
transcripción son enormes en comparación con el resultado, a la vez de ser un proceso
sucio, puesto que parte del proceso sirve para estabilizar el RNA de interés.

Se puede obtener multitud de información del detritus procedente de la degradación de


los mensajeros. La información corresponde a las secuencias que han participado en el
proceso de destrucción de los mismos. Sistemas como el DICER-RISCK generan
secuencias, de pequeño tamaño que reconocen a los mensajeros, hibridan con ellos y los
degradan. Este sistema es un método de regulación natural del proceso de transcripción
pero que deja mucha “basura” tras de sí, lo que nos va a permitir obtener información
sobre el control del proceso.

Al conjunto de los residuos de nucleótidos (RNAs) se le denomina en conjunto


degradoma e incluye el conjunto de restos de RNA de los que se puede obtener
información.

Una de las maneras de las que disponemos para obtener información es empleando el
modelo empleado por el sistema DICER-RISCK que controla la regulación de la
expresión por medio de la destrucción de los RNAs. Hay una metodología que nos
permite obtener información empleando como nexo el poliA de los transcritos.

A partir de un RNA degradado por el sistema DICER-RISCK, se captura el fragmento


del poliA, se le une un adaptador y posteriormente se lleva a cabo polimerización. Los
adaptadores se unen por el extremo 5’P y se caracterizan por presentar una diana para
una enzima de restricción 2S de modo que la enzima tras reconocer la diana cortará en
el fragmento a una determinada longitud (20-30nt). A continuación, por el otro extremo
se añade otro adaptador. Las secuencias que obtenemos son secuencias
complementarias a los miRNAs que están participando en los procesos de regulación de
la expresión. Este tipo de secuencias, posteriormente se lanzan contra bases de datos
para obtener una información mayor.

90
Genómica 3º Biotecnología

Lo que se hace a continuación con estas secuencias es diseñar secuencias que sirvan
para regular o silenciar ciertas secuencias. Para ello se construye una secuencia del
siguiente tipo:

Cuando se expresa cualquiera de las dos secuencias diseñadas, como hay


complementariedad entre los extremos, se van a formar horquilla. La trasfección de esta
secuencia a un organismo vivo se lleva a cabo mediante el empleo de un vector de
transformación como podría ser Agrobacterium tumefaciens en plantas. Lo que sucede
con esta horquilla es que DICER-RISCK lo va a tomar como un RNA dúplex y va a
actuar sobre esta secuencia. Debido al ataque se rompe la secuencia de la horquilla
dando lugar a fragmentos que hibridan con el gen de procedencia por
complementariedad y DICER-RISK también actúa sobre ellos.

Existe una variante que emplea una metodología de inmunoprecipitación y ligamiento


cruzado, también basado en el sistema DICER-RISCK, en concreto centrado en uno de
los complejos del sistema, el denominado complejo argonauta. En este caso alguno de
los componentes del argonauta va a ser diana de los anticuerpos que se lanzan contra él

91
Genómica 3º Biotecnología

y hacen que precipite. De esta manera afloran los miRNAs que participan en la
regulación. En primer lugar y para mantener la interacción entre el argonauta y el RNA
se irradia con luz UV de modo que se mantienen el complejo de forma más estable. A
continuación, se lanzan los anticuerpos y se precipita. Se va a trabajar con los RNAs
que se fijaron al complejo. Tras una precipitación se hace electroforesis. De los
resultados que se obtienen, nos quedamos con los fragmentos que migran más
lentamente porque son los que han intervenido en el proceso. Posteriormente, a partir de
un adaptador que se incorpora se convierte a cDNA y se realizan estudios posteriores.

92
Genómica 3º Biotecnología

93
Genómica 3º Biotecnología

94

También podría gustarte