Está en la página 1de 40

Análisis transcriptómicos de la expresión génica

Máster Universitario en Bioinformática Sesión 3

Dra. Paula Soler Vila


paula.solerv@campusviu.es
Estudios de expresión génica con
datos de NGS
Objetivo de la sesión

1 Conocer cuáles son los puntos claves en el diseño y


desarrollo de un experimento de RNA-seq.

• Diseño Experimental
• Proceso de extracción del ARN
• Diseño de librerías
• Secuenciación
• Análisis de datos

31/01/2023
Curso 2021-22
Flujo de trabajo general
1 Diseño experimental

Un requisito crucial para un estudio ¿Qué tipo de ensayo de RNA-seq


exitoso de RNA-seq es que los datos vamos a emplear?

generados tengan el potencial de


responder las preguntas biológicas
¿Cuántas réplicas son
de interés y esto se logra definiendo necesarias realizar?
primero un buen diseño
experimental
¿Qué tipo de ensayo de RNA-seq vamos a emplear?
1 Diseño experimental

Un requisito crucial para un estudio ¿Qué tipo de ensayo de RNA-seq


exitoso de RNA-seq es que los datos vamos a emplear?

generados tengan el potencial de


responder las preguntas biológicas
¿Cuántas réplicas son
de interés y esto se logra definiendo necesarias realizar?
primero un buen diseño
experimental
¿Cuántas réplicas son necesarias realizar?

Variabilidad técnica en los procedimientos de


ARN.
Las réplicas técnicas son réplicas en las que el
material biológico es el mismo pero se repiten los
pasos técnicos utilizados para medir la expresión
génica.

Innecesarias las réplicas técnicas (solo controles)

Variabilidad biológica del sistema en estudio.


Las réplicas biológicas consisten en diferentes
muestras biológicas que se procesan por
separado.

Maximizar el número de réplicas biológicas


https://www.ebi.ac.uk/training/online/courses/functional-genomics-ii-common-technologies-and-
data-analysis-methods/rna-sequencing/performing-a-rna-seq-experiment/design-
considerations/number-of-replicates/ • Mínimo de 3 replicas biológicas
• Hasta a 3-5 réplicas por condición
Eliminación de los factores de confusión
Un experimento de RNA-Seq confundido es aquel en el que no puede distinguir los efectos de dos fuentes
diferentes de variación en los datos.

No podemos diferenciar el efecto del


tratamiento del efecto del sexo

Dividir animales por igual entre


condiciones e intentar que compartan
la mayor parte de características
Batch effect
El efecto de lote representa las diferencias técnicas sistemáticas cuando las muestras se procesan y miden
en diferentes lotes y que no están relacionadas con ninguna variación biológica.
Batch effect

¿Qué puede causar Batch effect?


Batch effect

¿Se realizaron todos los aislamientos de ARN el mismo día?

¿Se realizaron todos los preparativos de la biblioteca el mismo día?

¿La misma persona realizó el aislamiento/preparación de la biblioteca de ARN para todas las muestras?

¿Utilizó los mismos reactivos para todas las muestras?

¿Realizó el aislamiento/preparación de la biblioteca de ARN en el mismo lugar?


Batch effect
NO confunda su experimento por el lote empleado

Image credit: Hicks SC, et al., bioRxiv (2015)


1 Batch effect

Image credit: Hicks SC, et al., bioRxiv (2015)


1 Batch effect
Metadatos

Image credit: Hicks SC, et al., bioRxiv (2015)


Batch effect : Sampling time

Massoni-Badosa, R., Iacono, G., Moutinho, C. et al. Sampling time-dependent artifacts in single-cell genomics studies. Genome Biol 21, 112 (2020).
https://doi.org/10.1186/s13059-020-02032-0
Sampling time-dependent artifacts in single-cell genomics studies

Results and discussion

https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-02032-0
Sampling time-dependent artifacts in single-cell genomics studies

1. ¿El efecto del tiempo es reproducible para todos los tipos celulares y muestras?

2. ¿Hay afectación de la integridad del ARN?

3. ¿Qué ocurre con la estructura de la cromatina? ¿Se encuentra afectada?

4. ¿De forma general, la expresión de los genes aumenta o disminuye con el tiempo?

5. ¿Hay alguna forma de prevenir que esto ocurra?


Flujo de trabajo general
¿Cómo vamos a aislar el RNA?
El primer paso para caracterizar el
transcriptoma consiste en aislar
¿Cómo vamos a mediar la
y purificar el ARN celular. La calidad y cantidad de ARN y la
cantidad de material tiene un calidad del mismo?

impacto significativo en la calidad de


los datos.
2 Extracción y aislamiento del RNA

DNAase
2 Extracción y aislamiento del RNA
Dos fuentes comunes de degradación del ARN son el calor y las ribonucleasas (ARNasas).

Por lo tanto, los investigadores deben mantener las muestras de ARN a 4 °C durante el procesamiento de las mismas y
trabajar siempre en un entorno libre de ARNasa.

• Criogenia: Congelación utilizando nitrógeno líquido y posterior almacenamiento a -80°C o el transporte en hielo

• Reactivos químicos: Reactivos estabilizadores disponibles comercialmente (p. ej., RNAlater®, RNAprotect® y
tubos de estabilización de ARN) inhiben las ARNasas y previenen el daño de la hidrólisis y oxidación del ARN.

• Liofilización: Ciertas estrategias de estabilización de ARN deshidratan el ARN en presencia de una matriz de
estabilización. Esto evita la desnaturalización por calor y la digestión por parte de las RNasas, además de
permitir que las muestras se almacenen y envíen a temperatura ambiente.
¿Cómo vamos a aislar el RNA?
El primer paso para caracterizar el
transcriptoma consiste en aislar
¿Cómo vamos a medir la
y purificar el ARN celular. La calidad y cantidad de ARN y la
cantidad de material tiene un calidad del mismo?

impacto significativo en la calidad de


los datos.
2 Calidad y cantidad del ARN

Calidad

Integridad

Pureza
2 Calidad y cantidad del ARN

Calidad

Integridad - Agilent 2100 Bioanalizador


- or TapeStation

Pureza - Espectroscopia UV y cálculo de ratios de absorbancia


2 Calidad y cantidad del ARN

Integridad

- Empleo del ARNr para evaluar la calidad general del ARN

- Estimación la integridad de la muestra mediante electroforesis en


gel y análisis de las proporciones de las bandas ribosómicas 28S a
18S = RNA Integrity Number (RIN)

- RIN > 7 (1-10)


- No sirve en todas las especies
2 Calidad y cantidad del ARN

Calidad Cantidad
- Métodos basados en fluorescencia (Qubit® o PicoGreen™)
Integridad
- Espectroscopia UV (NanoDrop™)

Necesitaremos alcanzar cantidades de ~ 1000 ng de RNA total


por microlitros muestra con una integridad mínima de 7 RIN.
Pureza Idealmente, debe mantenerse el mismo rango en todas las
muestras para que las bibliotecas finales sean más
homogéneas.
3 Preparación de la libreria

Enriquecimiento Poly(A) o
La preparación de la librería implica generar eliminación del ARNr
una colección de fragmentos de ARN que sean
compatibles para secuenciación.
El proceso implica el enriquecimiento del ARN
Stranded or non-stranded
diana , la fragmentación, transcripción inversa
(ADNc) y adición de adaptadores de
secuenciación y amplificación
3 Tipo de librería

La mayor parte de ARN en la célula NO es ARNm


3 Tipo de librería

Poly-A Enrichment rRNA Depletion

Total RNA
3 Preparación de la libreria

Enriquecimiento Poly(A) o
La preparación de la librería implica generar eliminación del ARNr
una colección de fragmentos de ARN que sean
compatibles para secuenciación.
El proceso implica el enriquecimiento del ARN
Stranded or non-stranded
diana , la fragmentación, transcripción inversa
(ADNc) y adición de adaptadores de
secuenciación y amplificación
3 Tipo de librería

Stranded or non-stranded

RNA-Seq direccional o específico de cadena, le RNA-Seq standard o no direccional donde se


permite determinar la orientación del transcrito. pierde la información de la orientación del
• Introducción de dUTP transcrito

• Identificación de transcriptos antisentido • Más barata


• Anotación y descubrimiento de transcritos • Análisis de expresión génica en genomas
nuevos conocidos
4 Secuenciación

Tipo de plataforma
de secuenciación

Los parámetros para la


Paired-end o single-
secuenciación, como la longitud de end sequencing

lectura, la configuración y la salida,


dependen del objetivos de su Longitud de las
lecturas
proyecto e influirán en su elección
del instrumento y la química de
Profundidad de
secuenciación secuenciación
4 Secuenciación: Tipo de plataforma
4 Secuenciación

Single end or paired-end

• SE - Conjunto de datos de extremo único => Solo • PE - Conjunto de datos de extremo emparejado =>
lectura 1 (1x) Lectura 1 + Lectura 2 (2x)

Las lecturas cortas single-end (SE) son suficientes para los estudios de los niveles de expresión génica en
organismos bien anotados, mientras que las lecturas de paired-end (PE) son preferibles para descubrimiento de
transcripciones de novo.
4 Secuenciación
Short reads
50/75nt
Análisis de expresión génica

Long reads
Análisis de nuevos
transcriptomas y WGS para
150nt eucariotas

Long* reads
Metagenómica
300nt
4 Secuenciación
La profundidad de secuenciación o el tamaño de la biblioteca (library size) se refiere al número de lecturas
secuenciadas para una muestra determinada

• Los experimentos de perfiles de expresión génica que buscan una instantánea rápida de genes altamente
expresados ​pueden necesitar solo de 5 a 25 millones de lecturas por muestra.

• Los experimentos que buscan una visión más global de la expresión génica y alguna información sobre el
empalme alternativo, normalmente requieren de 30 a 60 millones de lecturas por muestra. Este rango abarca
la mayoría de los experimentos de RNA-Seq publicados para la secuenciación de ARNm/transcriptoma
completo.

• Los experimentos que buscan obtener una vista detallada del transcriptoma o ensamblar nuevas
transcripciones pueden requerir entre 100 y 200 millones de lecturas.
5 Analisis de los datos

La evaluación de la calidad de sus datos y


extracción información biológicamente relevante
es el paso más gratificante en un experimento de
RNA-Seq.

Es importante discutir su proyecto con un


bioinformático experimentado para encontrar y
determinar el mejor flujo de trabajo
computacional.

También podría gustarte