Está en la página 1de 37

TEMA 1.

Ingeniería genética en procariotas y análisis estructural y funcional de genomas .

0. Introducción
¿Qué es la ingeniería genética?

• La ingeniería genética o tecnología de DNA recombinante es un conjunto de técnicas moleculares que permiten
manipular el material genético modificando, introduciendo o eliminando segmentos de DNA

• El término recombinante se utiliza porque a menudo el objetivo es combinar DNA de dos orígenes distintos

¿Técnicas principales de DNA recombinante?

• Técnicas de corte del DNA en localizaciones


específicas (enzimas de restricción)

•Mapas de restricción.

• Métodos para localizar secuencias de DNA


(hibridación de ácidos nucleicos)

• Métodos para obtener numerosas copias de un


fragmento de DNA específico (clonación génica)

• La reacción en cadena de la polimerasa (PCR)

• Procedimientos para introducir secuencias de DNA en


células receptoras

• Técnicas para inducir mutaciones en secuencias de


DNA específicas

• Métodos de expresión de DNA recombinante

¿Qué es la Biotecnología?

La utilización de seres vivos para crear productos que mejoran nuestra calidad de vida

• Biotecnología tradicional:
o Surge hace miles de años.
o Productos: Pan, vino, alcohol (destilado), cerveza, yogur, plástico, enzimas…
• Biotecnología moderna:
o Surge en tiempos modernos y emplea técnicas de Ingenería Genética
o Produce Organismos Modificados Genéticamente (OMGs)
o Productos: Organismos que limpian el medio ambiente, medicinas y tratamientos, vegetales y
animales que mejoran el cultivo y ganado.

OBJETIVOS

• Repasar las técnicas de análisis de ácidos nucleicos

• Comprender cómo las características de la genética bacteriana puede ser utilizada para la clonación de un gen y/o
su expresión mediante moléculas de DNA recombinante

• Saber interpretar los resultados de esas técnicas


ÍNDICE

1. INGENIERÍA GENÉTICA EN PROCATIOTAS

1.1. MANIPULACIÓN DEL DNA Y MAPAS

1.2. CLONACIÓN Y VECTORES PLASMÍDICOS

1.3. EXPRESIÓN DE GENES CLONADOS

2. ANALISIS ESTRUCTURAL Y FUNCIONAL DE GENOMAS

2.1. GENÓMICA ESTRUCTURAL: Secuenciación

2.2. GENOMICA FUNCIONAL: Análisis de expresión

3. BIOLOGÍA DE SISTEMAS Y BIOLOGÍA SINTÉTICA

1. Ingeniería genética en procariotas. Manipulación del DNA y


mapas
Genoma Humano haploide: 3.200 millones de pares de bases

¿Cómo lo separamos?

- Enzimas de restricción: Endonucleasas de bacterias que cortan secuencias de DNA de


manera específica

- Mapas de restricción: Representación de los lugares (o dianas) de restricción contenidos en una secuencia de DNA
(LINEAL O CIRCULA)

- Hibridación de ácidos nucleicos (utilizando sondas): Técnicas clásicas pero que se siguen utilizando:

• Northen
• Sauthern

Definición: Endonucleasas de origen bacteriano. Uso en fragmentación de genomas (descubrimiento de aplicación en


los años 50)

1.1 Vídeo: ENZIMAS DE RESTRICCIÓN

Características

- Nucleasas sintetizadas por bacterias como un mecanismo de defensa natural frente a bacteriófagos

- Nucleasas capaces de reconocer y cortar un enlace fosfodiéster en una secuencia específica de nucleótidos en una
doble cadena SI NO TIENEN BASES METILADAS (solo no tienen bases no metilados el DNA exógeno, NO bacteriano, ya
que este último está
metilado)

Tipos principales

3 TIPOS BÁSICOS: Tipo


I, Tipo II y Tipo III
(denominadas así en
función del orden de
descubrimiento)
OTROS SISTEMAS → SISTEMAS DE EDICIÓN BASADOS EN :

• Meganucleasas
• Enzimas con dedos de Zinc (ZNF)
• Proteínas TALENT
• Sistema CRISPR/Cas

Endonucleasas de Tipo II

Cortan el DNA

Tienen características más útiles en el Ingeniería Genética

− Solo actividad endonucleasa


▪ Las enzimas de tipo I y III tienen también actividad metilasa
− Reconocen secuencias palindrómicas
− Reconocen y cortan en la misma secuencia (cortan en el sitio de restricción)
▪ Las enzimas de tipo I y III reconocen una secuencia y cortan hasta 1000pb corriente abajo o corriente
arriba de la diana de restricción
− Tipos de corte que producen:
▪ Simétrica: generando extremos romos
▪ Asimétrica: generando extremos cohesivos / protuberantes dejando restos monocatenarios en 3’ o en
5’ (en función de en la orientación de corte de la enzima)

− Nomenclatura con tres letras: Ej → EcoRI (E.coli)


o E: Género
o co: especie
o R: Cepa
o I: Orden
− Tamaño de la diana de restricción (4 pb, 6 pb u 8 pb)

El nº de fregmentos en genoma depende de los tamaños de la diana de restricción de la enzima que se esté utilizando.
Cuanto menor el tamaño de la diana más es probable/ más frecuentemente se da el corte

Probabilidad de corte (1/4)nº de pares de bases de la diana de restricción

4 pb. (1/4)4 = 1.2 x 106 fragmentos

6 pb. (1/4)6 = 781250 fragmentos

8 pb. (1/4)8 = 48828 fragmentos

Isoesquizómeros: Enzimas de restricción que reconocen el mismo sitio diana / de restricción y cortan en la misma
posición. Generan extremos compatibles.

Neoesquizómeros: Enzimas de restricción que reconocen el mismo sitio diana / de restricción y NO cortan en la misma
posición. NO generan extremos compatibles
IMPORTANTE: Si queremos utilizar dos enzimas que corten el mismo sitio diana debemos asegurarnos de que
ambas tienen actividad catalítica a la misma temperatura. Esta depende de cuál sea la temperatura óptima de
crecimiento del microorganismo del cual se han aislado

Isocaudámeros: Enzimas de restricción que RECONOCEN DISTINTAS secuencias pero dejan LOS MISMOS extremos
cohesivos

Aplicaciones

− Mapas de restricción con varias enzimas: Plásmidos con varios sitios de restricción.
− Búsqueda de fragmentos específicos en una muestra genómica grande mediante técnicas de hibridación de
ácidos nucleicos
o Southern Blot
o RFLPs
− Clonación de fragmentos específicos de genomas para la creación de genotecas o para expresar proteínas de
interés.
− Obtención de la secuencia del genoma humano (2000)

Vídeo 2: Aplicaciones de Enzimas de Restricción Tipo II

Mapas de restricción con una o varias enzimas

Representación lineal de dianas de restricción (o lugares) contenidos en una secuencia de DNA (lineal o circular)

Pasos para seguir cuando no conocemos la secuencia de nucleótidos del DNA con la que queremos hacer el mapa:

1. Cortar fragmentos de DNA utilizando una o varias enzimas de restricción


2. Separación de los fragmentos de DNA obtenidos mediante electroforesis (geles de agarosa)
3. Construir el mapa: unir de nuevo los fragmentos teniendo en cuenta los sitios por los que ha cortado cada
enzima de restricción, señalándolos en dicho mapa.

Programas bioinformáticos para construir un mapa de restricción cuando conocemos la secuencia de nucleótidos.

• Programa SMS (Sequence Malipulation Suite)


• Restrictionmapper: Muestra en una tabla las enzimas que encuentra que tienen sitio de restricción en la
secuencia de genoma que hemos introducido
• Rebase: Base de datos de enzimas de restricción Tipo II en la que se proporciona información sobre el tipo de
corte que realiza cada enzima (dejando extremos romos o cohesivos) y de la temperatura óptima de actividad
de las mismas in vitro.
Hibridación de ácidos nucleicos

Se utiliza para el aislamiento de fragmentos específicos de DNA, es decir, para identificar secuencias concretas de DNA
en una muestra con mezcla de fragmentos de DNA

Todas estas técnicas se basan en:

- La capacidad de desnaturalización y renaturalización que posee el DNA


- Uso de sondas marcadoras: secuencias de DNA con bases nitrogenadas fluorescentes (marcadas con P32) u con
otra técnica de marcaje

Para ello:

1. Se desnaturalizan los fragmentos de DNA de la mezcla, dejando las cadenas como monocatenarias (alta
temperatura)
2. Se hibridan los fragmentos desnaturalizados con las sondas de DNA marcadas (que son complementarias a la
secuencia que estamos buscando)
3. La hibridación debe darse UNA TEMPERATURA ADECUADA Y ESPECÍFICA y con UNA FUERZA IÓNICA DE TAMPÓN
CONCRETA, para que se una solo al fragmento de DNA para el que es totalmente complementaria. Estos son
parámetros esenciales para controlar las condiciones de astringencia de la hibridación.

Ejemplo

a. En 50% de formamida a 42ºC → La sonda se une al fragmento de


DNA para el cual es totalmente complementario, quedando una
forma híbrida totalmente estable
b. En 50% de formamida a 35ºC → La sonda se une a varios fragmentos
de DNA aunque para algunos de ellos no sea totalmente
complementaria y se formen horquillas

A. Southern Blot
TÉCNICA:

1. Digerir genoma de interés con enzimas de restricción


2. Electroforesis en gel de agarosa de los fragmentos obtenidos para separarlos en función de su tamaño
3. Fragmentos transferidos a un papel de nitrocelulosa por succión del tampón a través del gel y del papel
(~membrana de transferencia en WB, solo se transfieren las cadenas monocatenarias de DNA en el mismo
orden en el que se encuentran en el gel, es un calco del gel)
4. Membrana ahora posee los fragmentos de DNA. Estos se incuban con la sonda marcada complementaria a la
secuencia que queremos encontrar. Hibridación de la sonda marcada con el fragmento que posee la secuencia
de interés.
5. Revelado mediante métodos de detección específicos

Técnicas análogas

- Partiendo de RNA → Northern Blot

- Partiendo de proteínas y corriendo en un gel de nitrocelulosa o de Tris-Gly → Western Blot

B. RFLPs

B.1 Uso de técnica de Southern Blot para la identificación de RFLPs (Restriction Fragment Length Polymorphism)

Fragmentos de longitud polimórfica generados por enzimas de restricción. Se producen por polimorfismos genéticos
entre el genoma de diferentes individuos que hacen que aparezcan o desaparezcan dianas de restricción.
1. Uso de la enzima de restricción cuyo sitio de restricción
desaparece en uno de los genomas
2. Electroforesis en gel de agarosa
3. Diseño de sonda que hibride en la secuencia del sitio de
restricción específico para la enzima de restricción usada
a. Individuos “normales” (CON la diana de restricción en
su genoma): La sonda hibrida en dos bandas
b. Individuos “enfermos” (SIN la diana de restricción en
su genoma): La sonda hibrida en una sola banda

B.2 Uso de PCR para identificación de RFLPs

Para ello necesitamos conocer la secuencia de bases en la que se encuentra la RFLP

1. Amplificación por PCR de la zona con variación


2. Digestión del producto amplificado con la enzima de restricción en cuya diana existe un RFLP
3. Electroforesis en gel para visualizar los fragmentos generados por la digestión

a. Individuo “homocigoto sano”: Si hay un solo sitio de


restricción se verán dos bandas (ambas cadenas se cortan
por el mismo sitio, generándose 4 fragmentos, iguales en
longitud 2 a 2)
b. Individuo “heterocigoto”: En una de las cadenas
mantendrá el sitio de restricción y en otra lo habrá
perdido. Se verán tres bandas (dos pertenecientes a la
cadena que ha sido cortada porque mantiene el sitio de
restricción, y una, la que menos migra, a la cadena que ha
perdido el sitio de restricción).
c. Individuo “homocigoto enfermo”: Habrá perdido el sitio
de restricción en ambas cadenas y solo se verá una banda
(no se corta ninguna de las cadenas así que ambas migran
a la misma altura, generando una sola banda

Clonación

A. Genotecas

Pasos para la construcción de una molécula de DNA recombinante con el fin de conseguir muchas copias de un
fragmento de DNA deseado.

Podemos partir de:

- Un fragmento concreto de DNA que deseamos amplificar / clonar


- Una mezcla de fragmentos obtenidos por la digestión de un genoma con enzimas de restricción, con el fin de
generar una genoteca
- Tránscritos de RNA → transcriptasa inversa → cDNA que introduzcamos en un DNA vector = DNA recombinante
con cDNA.
En cualquiera de los casos, los pasos a seguir son:

1. Extracción del DNA


2. Digestión del DNA con enzimas de restricción
3. Ligación del DNA
4. Transformación
5. Amplificación y selección

B. Expresión de proteínas

Mayormente con fines terapéuticos (producción insulina o de


factor de crecimiento) e industriales (producción de colágeno)

1.2 CLONACIÓN Y VECTORES PLASMÍDICOS. Clonación de un fragmento de DNA

Clonación: Obtención de muchas copias idénticas de un fragmento de DNA. Se define como el proceso para aislar una
secuencia de DNA de interés, insertarla en un vector y obtener múltiples copias en un organismo hospedador eucariota
(normalmente E.coli)

Clonación: fragmento con origen de replicación y secuencias reguladoras de la replicación

Para ello debemos de CONSTRUIR UNA MOLÉCULA DE DNA RECOMBINANTE:

• Extracción del DNA y purificación

DNA de dos orígenes diferentes: DNA vector (normalmente un plásmido bacteriano) y un DNA inserto (fragmento de
genoma eucariota normalmente)

• Digestión del DNA con enzimas de restricción para generar extremos cohesivos compatibles entre las cadenas
de DNA vector y DNA inserto (para que se reconozcan e hibriden entre sí)
• Ligación del DNA con una DNA ligasa = Obtención de DNA recombinante
• Transformación de bacterias competentes con el DNA recombinante obtenido
• Amplificación del DNA recombinante (cultivo de bacterias transformadas) y selección:
a. Con antibióticos, sobreviven aquellas bacterias que hayan incorporado el plásmido vector que posee
genes de resistencia a antibióticos
b. Con genes chivatos como el de la enzima X-Gal.
1. EXTRACCIÓN DEL DNA

Obtención de INSERTOS:

A. Extraer el DNA genómico del organismo donante del inserto:


- Digestión de células con detergentes para liberar el DNA del núcleo
- Precipitación con estanoles para aislar el DNA
B. Obtener cDNA a partir de mRNA utilizando retrotranscriptasas
C. Fragmentos de DNA amplificados por PCR
D. Síntesis química de la secuencia de DNA que nos interesa

Obtención de VECTORES:

A. Normalmente comprados: plásmidos, fagos, virus…


B. DNA plasmídico: obtención mediante ultracentrifucación de extractos de bacterias en un gradiente de densidad
o KIT de columnas
C. Obtención de DNA de Fago I a partir de cultivos puros de fagos

VECTORES DE CLONACIÓN MÁS USADOS

En función del tamaño del inserto que permiten integrar:

- Plásmidos → Son los más utilizados tanto para vectores de


clonación como para vectores de expresión (Son muy
versátiles)
- Fagos
- Cósmidos
- BACs (cromosomas artificiales bacterianos)

CARACTERÍSTICAS VECTORES PLASMÍDICOS DE CLONACIÓN

Plásmidos: Moléculas circulares pequeñas extracromosómicas que presentan muchas bacterias.

Para que un plásmido sea un BUEN VECTOR DE CLONACIÓN debe tener:

- Origen de replicación autónomo, independiente del cromosoma bacteriano

-Mapas de restricción conocidos

. Sitios de restricción únicos

- Secuencias de marcadores selectivos

- Resistencia a antibióticos: El fenotipo de resistencia sirve para


seleccionar bacterias cn plásmido y bacterias con plásmido + inserto

- Genes que producen cambios de coloración como el LacZ

- Recuperación sencilla de las copias

MUCHOS TIPOS DE PLÁSMIDOS

- Los que existen de manera natural en las bacterias

Ej: pBr322: uno de los primeros plásmidos utilizados como vector de


clonación en el siglo pasado. Con genes de resistencia a ampicilina y a
tetraciclina
- El fenotipo de resistencia sirve para seleccionar las bacterias con plásmido y las bacterias con DNA
recombinante. Se hace mediante doble selección con antibióticos.

. Si se interrumpe la secuencia de resistencia a Ampicilina en el plásmido la primera selección de las


colonias se hace con Tetraciclina (solo sobreviven las colonias que hayan incorporado el plásmido, ya
sea con o sin inserto. La segunda selección se hace con Ampicilina, de tal manera que mueren aquellas
colonias que hayan incorporado el DNA recombinante (plásmido + inserto)

- Modificados genéticamente para hacerlos más útiles en ingeniería genética

Ej: pBluescript II SK (+/-): Plásmido recombinante, mejorado con ingeniería genética. De manera natural
presenta el gen de resistencia a ampicilina, pero además se le introducen cambios que permiten que su
selección sea más sencilla:

- Genes de cambio de coloración: posee el gen LacZ que codifica para la subunidad de la enzima beta-
galactosidasa (cambio de color de colonias de blanco a azul cuando la enzima beta-galactosidasa reacciona con
X-gal, un análogo de la lactosa que se vuelve de color azul cuando es procesado por dicha enzima.

. CUANDO SE INCORPORA EL PLÁSMIDO SIN EL INSERTO: El plásmido posee la secuencia que codifica
para la subunidad alfa de la beta-galactosidasa. El cromosoma bacteriano posee la secuencia que
codifica para la subunidad omega. Cuando ambas se unen formando un heterodímero, la beta-
galactosidasa está activa y es funcional. Esta entonces reacciona con el sustrato (X-gal) generando un
color azul en la colonia

. CUANDO SE INCORPORA CORRECTAMENTE EL DNA RECOMBINANTE: El MSC se encuentra en medio


de la secuencia de la unidad alfa de la beta-galactosidasa en e plásmido. Se digiere el plásmido con una
enzima de restricción con la que también haya sido digerido el inserto (extremos cohesivos que puedan
unirse). Si el inserto hibrida con el plásmido se interrumpirá la secuencia de LacZ. Si la subunidad alfa
de la beta-galactosidasa no se sintetiza, la enzima NO será funcional y las colonias se mantendrán
blancas cuando se aplique el sustrato (X-gal)

- Adición de múltiples sitios de clonaje únicos (secuencia con muchos sitios de restricción, siendo cada uno único
para una enzima de restricción). Son llamados MCS o sitios “poly-linker”

- Mutación en las secuencias de control de la replicación del origen CoE1, permitiendo que la bacteria replique
el plásmido hasta más de un total de 500 veces (más de 500 copias/célula)
2. DIGESTIÓN DEL DNA CON ER

Digestión del DNA inserto y DNA vector con las mismas enzimas de
restricción, que generen

A. Extremos cohesivos: por lo que la ligación es mucho más


sencilla, ya que los extremos del DNA inserto y del vector se
reconocen como compatibles.

B. Extremos romos: debemos tratar tanto la muestra de DNA


vector como de DNA inserto con Desoxinucleotidil tranferasas
terminales. Si en la muestra DNA vector utilizas como sustrato
de la enzima Timina, se generarán colas terminales de T, por lo
que en la muestra de DNA inserto debes utilizar como sustrato
de la enzima Adenina, para que se generen colas terminales de
A complementarias a las del DNA vector

3. LIGACIÓN DEL DNA

DNA-ligasa crea enlaces fosfodiéster entre las colas compatibles de


DNA (entre las que ya hay interacción mediante puentes de hidrógeno)

Estrategias para favorecer la formación de DNA recombinante y evitar que el


plásmido se reciruclarice:

- Defosforilar el vector digerido utilizando fosfatasa alcalina


- Utilizar dos enzimas de restricción que NO generen extremos
compatibles , cada una con sitio único de corte en el plásmido y en el
DNA origen donde se encuentra el inserto.
- Usar una proporción 3:1 (Inserto:Vector), sobre todo si los extremos
son romos

4. TRASNFORMACIÓN DE LAS BACTERIAS CON DNA


RECOMBINANTE

Generación de bacterias competentes mediante:

- Método químico: Transformación de E.coli por choque térmico (aumento de fluidez de la membrana y
generación de gradiente de temperatura) + CaCl2 (neutraliza carga negativa de la membrana plasmática,
evitando así que se repela con el DNA que es también de carga negativa, favoreciendo la entrada de dicho
DNA en el citosol)

- Método físico: Transformación de E.coli por electroporación, agujeros en la membrana producidos oír
estímulos eléctricos.
5. AMPLIFIACIÓN Y SELECCIÓN DE BACTERIAS

Depende del plásmido que hayamos utilizado

Ejemplo en selección con X-Gal (esquema dcha)

PARA VER SI HAN INCOROPORADO EL PLÁSMIDO LAS BACTERIAS


CUANDO NO HAY GEN DE COLORACIÓN

1. Southern o Northen Blot: Sonda para la identificación de


moléculas específicas de DNA en una mezcla. Plásmido de
longitud conocida

a. DNA de bacterias que solo han incorporado el


plásmido → en electroforesis tamaño plásmido.
b. DNA de bacterias con DNA recombinante → en
electroforesis tamaño DNA mayor que plásmido

2. PCR + Secuenciación: para ver si la secuencia insertada en el


vector es la adecuada.

1.3 EXPRESIÓN DE GENES CLONADOS. Clonación expresión de proteínas


recombinantes
Expresión: fragmento con promotores y secuencias reguladoras de la transcripción (enhancers)

Mayormente expresión de proteínas recombinantes en E. coli.

- La secuencia que codifica para la proteína eucariota debe ser capaz de replicarse, transcribirse y traducirse en una
célula procariota

Algunos ejemplos de proteínas recombinantes en


procariotas de uso terapéutico:

• Insulina
• Hormona del crecimiento
• Antibióticos
• Factores sanguíneos (medicina) obtenidos
por ingeniería genética → evita que
pacientes hemofílicos necesiten
transfusiones sanguíneas continuas
• Proteínas recombinantes utilizadas en
investigación
• Prácticamente cualquier proteína
codificada por un gen DE SECUENCIA
CONOCIDA

- DNA recombinante: vector + inserto que codifica para proteína de interés

1. Expresión In vivo de secuencias clonadas

PRIMERA PROTEÍNA QUE SE EXPRESÓ: Insulina humana (1982). Fue la primera proteína terapéutixa fabricada
mediante tecnología de DNA recombinante
PROCESO DE CLONACIÓN Y PRODUCCIÓN INSULINA

1. Se insertaron en la cola del gen LacZ (gen de selección por color)


los oligonucleótidos sintéticos que codifcan para las cadenas A
y B de la insulina
a. Cada cadena codificada en un inserto → creación de 2
DNA recombinantes
b. Ambos DNA recombinantes introducidos en las
bacterias
2. Los plásmidos recombinantes se introdujeron en E. coli, en las
que se sintetizaba y acumulaban las proteínas de fusión Beta-gal
/ insulina
3. Se extraían las proteínas de fusión de las dos células huésped y
se las purificaba e inducía a que formaran los puentes disulfuro
(que permiten que la proteína alcance su conformación
adecuada y que la proteína esté activa)

PROCESO DE CLONACIÓN Y PRODUCCIÓN DE PROTEÍNAS EUCARIOTAS

1. Preparar la secuencia del gen a expresar:

DNA eucariota pero Sin intrones → cDNA sacados de mRNA

- cDNAs sacados de la generación de una genoteca de cDNAs (fragmentos pequeños → vectores con capacidad
limitada de portar insertos)

- Amplificación por PCR de la secuencia del cDNA a expresar (obtenida de una genoteca ya generada)

2. Elegir el vector.

Debe de tener:

• Señales de transcripción y traducción adecuadas


o Transcripción para la RNA-pol bacteriana
o Traducción → marco de lectura (ORF) abierto en la posición adecuada, para que no cambie la secuencia
de codones (grupos de 3 nucleótidos) y por tanto no cambie la secuencia de aminoácidos que codifica.
• Sistemas inducibles para controlar la expresión (visto en genética el año pasado → inducible en tiempo / tejido
determinados)
• Facilidad para purificar la proteína
A. PREPARAR LA SECUENCIA QUE QUEREMOS EXPRESAR

Debemos conocer el gen eucariota que queremos expresar:

• Ver cuántos intrones y exones tiene


• Cuál es su CDS (región codificante): solo podemos usar
una secuencia SIN intrones

a. CUANDO NECESITAMOS CREAR UNA GENOTECA DE cDNA

- Para ello debemos:

1. Obtener transcritos de las células donde se expresa la proteína


de interés.

2. Retrotranscripción de los transcritos para obtener el cDNA de


cada uno

- Con esto obtenemos una librería o genoteca de cDNA,


que consta de una colección de clones que contienen al
menos una copia de DNA de todos los mRNAs aislados de
una célula . Estas genotecas reflejan la actividad génica de
un tipo celular en un momento particular (con el mRNA se
pueden generar microarreys)

- La cola de poli(A) facilita el aislamiento de los mRNAs y la


obtención de cDNA:

• Se empareja poli(T) con la cola de poli(A), lo cual


actúa como primer de la RTasa (retrotranscriptasa
inversa)
• Se extiende el poli(T) con la RTasa = híbrido
DNA:RNA
• Se degrada el RNA del mRNA con una RNasa
• La hebra de DNA que queda es utilizada como molde por una DNA polimerasa para la síntesis de la
doble hebra de cDNA
• DNA ligasa
3. Introducir en VECTOR nuestro cDNA a expresar

- Se añaden en los extremos del cDNA sitios ligadores (“linker”), secuencias de DNA
de 8-12 pb con un sitio de restricción. Esto se añade mediante PCR

. Añadir secuencia diana para una ER mediante la acción de una T4 DNA


ligasa

- Con esto generamos extremos pegacojos / cohesivos que me permiten la inserción


en el vector (direccional si utilizamos para cada extremo dos enzimas de restricción
diferentes)

- Inserción del inserto (cDNA que codifica para nuestra proteína de interés) en el
vector

- Transformación y amplificación (como vimos en el vídeo anterior)


- Identificación del clon de interés (doble selección, como vimos en el vídeo anterior →Southern para identificar qué
clon expresa mi proteína de interés)

b. CUANDO SÍ TENEMOS YA UNA GENOTECA DE CLONES

1. Escogemos el clon que contiene el cDNA de interés

2. Amplificamos el cDNA por PCR

. Diseño de primers forward (que


hibride con ATG) y reverse (que
contenga el TAG)

. Podemos añadir una diana de


restricción en los primers, para
que así se pueda introducir
nuestro cDNA en el vector). Tras la
amplificación obtiene nuestro de
cDNA de interés + secuencias
dianas de restricción en sus
extremos

B. VECTORES DE EXPRESIÓN

Vectores especiales para la expresión

• EL GEN SE INSERTA CORRIENTE DEBAJO DE LAS SEÑALES DE TRANSCRIPCIÓN (PROMOTOR) Y DE TRADUCCIÓN


(ATG)

Señales TRANSCRIPCIÓN

- Promotor: fuerte (secuencia parecida a la consenso), eficiente,


dotado de regiones conservadas -35 (TTGACA o parecida) y -10 (TATAAT o parecida)

- Secuencia de cDNA entre medias

- Terminador: secuencia que funciona como terminador de la transcripción ya que


su forma de ARNA constituye la típica horquilla (estructura por uniones intra-
catenarias), donde la RNA polimerasa se ve obligada a desligarse del RNA recién
formado

Señales TRADUCCIÓN

- Secuencia Sgine-Dalgarno: Secuencia de unión al ribosoma. Se


encuentra a corta distancia del promotor, que al transcribirse es
reconocida por la subunidad pequeña de los ribosomas
procariontes, a donde se unen ( es complementaria el extremo 3’
del rRNA 16S)

- Secuencia ATG: Señala el comienzo de la traducción. A unos 3-11


pb corriente debajo de la secuencia Shine-Dalgarno. Este codón lo
puede suministrar el gen a clonar o bien el vector puede disponer
de ese codón, seguido de alguna diana que permita la inserción del
gen a expresar

- Codón de terminación: UAG UGA UAA


Resumen de lo que debe tener un vector de expresión en E. coli

OJO: Todos estos sitios además de los sitios vistos en los vectores de replicación

C. SISTEMAS INDUCIBLES EN VECTORES DE EXPRESIÓN

SISTEMA INDUCIBLE MIXTO

Combina dos construcciones de DNA recombinante Operón Lac + RNA pol T7 (inducible por IPTG, expresión específica
de genes bajo promotor T7)

• ADNc de interés clonado bajo el promotor T7.

• Gen T7 RNA Pol clonado bajo el promotor lac

- DNA recombinante con nuestro DNA inserto que codifica para la proteína de interés. Este DNA inserto está bajo el
control de un promotor (en este caso, promotor del fago T7, un promotor muy fuerte que va a dar lugar a una
expresión a gran escala de los genes que controla)

- DNA recombinante con DNA inserto que codifica para la RNA polimerasa del fago
T7. DNA inserto bajo el control del promotor del gen Lac.

• Se induce la expresión de los genes que están bajo el control del


promotor lac mediante la adición de lactosa
• Síntesis de RNA polimerasa del fago T7 se une al promotor del
fago T7, induciendo su expresión
• Expresión a gran escala del medicamento de interés

SISTEMA INDUCIBLE POR IPTG

- Secuencia cDNA bajo el control del Operón Lac

- Este promotor se reprime en presencia de glucosa y se induce en presencia de


lactosa o su análogo isopropil-tiogalactosido (IPTG) → expresión cuando se añade
IPTG en el medio (inductor del Operón Lac)

SISTEMA PROMOTOR Pl- Lambda, represor ts, inducible por temperat ura.

Promotor pL (Brazo izquierdo del fago lambda): Es inducible por cambios de


temperatura, ya que

• existe un represor termolábil que a temperaturas entre 28-30 ºC se une


al promotor impidiendo la transcripción del gen.
Su utilización ha confrontado problemas en algunos hospederos, ya que ante un cambio súbito de temperatura, hasta
aproximadamente 42 ºC, el represor sufre un cambio estructural que impide su unión al promotor, permitiendo la
transcripción y la expresión de la proteína de interés (18).

Este sistema tiene dos desventajas fundamentales:

• Solamente puede ser empleado en cepas de E. coli que


contengan en su genoma el gen que codifica para el represor cI
857 del fago lambda
• Al trabajar a los niveles de temperatura de inducción es posible
la degradación de la proteína heteróloga.

Una de las alternativas para disminuir el efecto de la primera desventaja es el empleo de cepas comerciales que
contengan el gen del represor o cotransformar con un vector que lo incluya.

3. Proteínas de fusión

Vector con promotor para una secuencia que se fusiona con la secuencia de nuestro cDNA de interés (Ej: Promotor
lacZ-gen LacZ-secuencia cDNA)

IMPORTANTE:

• Las secuencias deben de estar en fase (in


frame): para que no cambie el marco de
lectura (ATG de la proteína reportera debe
estar separa por codones del ATG de
nuestro gen a expresar)

• Se sintetiza una proteína quimérica


(subunidad alfa beta-galactosidasa + proteína de interés)
• Aplicaciones:
o Identificación (WB, IP…)
▪ Identificación de proteínas añadiendo tags (aas como
Histidinas que funcionan como epítopos para anticuerpos
que me van a permitir identificar la proteína de interés en
una muestra)
o Purificación (cromatografía afinidad, pull-down…)
o Visualización (fluorescencia utilizando comp proteína de fusión GFP o luciferasa , luminiscencia…)

2. Análisis de expresión. PCR convencional vs Q-PCR

Componentes necesarios. Fundamento

La PCR nos permite obtener millones de copias de un fragmento de DNA concreto sin necesidad de introducirlo en un
vector ni de utilizar bacterias para amplificarlo.

Se basa en la REPLICACIÓN in vitro. Por ello necesitamos todo lo necesario para que se de el proceso igual que in vivo:

• Molde: DNA o RNA con la secuencia de interés


o Si es RNA necesitamos hacer una retrotranscripción para pasarlo a DNA
• Oligos / primers
• Polimerasa (con Buffer y Cl2Mg para que su actividad sea óptima)
• dNTPs
Ponemos todos estos reactivos en un Eppendorf y este a su vez lo introducimos en un termociclador, que va ir
ajustando la temperatura de reacción en función de la fase en la que se encuentra el ciclo de reacción de la PCR.

Por cada ciclo se sintetizan 2 moléculas nuevas de DNA, por ello para calcular la cantidad de moléculas de DNA
obtenidas se utiliza la fórmula:

2 nº ciclos = nº moléculas copia del DNA original

CARACTERÍSTICAS DE UN PRIMER:

Longitud. 18 y 24 pares de bases, que hacen que la temperatura de melting oscile entre 50 y 650C (temperatura
óptima para el alineamiento).

• Contenido de G-C. Para determinar este parámetro es necesario conocer el contenido de G-C de la secuencia a
amplificar, pero como regla básica se prefiere oligonucleótidos con un contenido de GC de 44 a 60%, que les da
estabilidad y una temperatura de melting apropiada.

• Se debe evitar que existan más de 3 repeticiones consecutivas de una base en su diseño (ej. AAAAA).

• La temperatura de melting debe ser lo mas parecida posible (máximo 5 grados de diferencia entre uno y otro
primer).

Tº unión promers: [(A+T)x2 + (G+C)x3]+5

• Es importante observar los extremos 5’ y 3’ de los oligonucleótidos y revisar que estos extremos no sean
complementarios, ejemplos:

ETAPAS DE PCR

3 ETAPAS EN EL CICLO

Condiciones de temperatura y de tiempo necesarias


para que se dé un ciclo.

a. Desnaturalización del DNA (94-95ºC).


Separación de las dos hebras de DNA
b. Emparejamiento de cebadores (37-65ºC).
Unión por complementariedad de los primers
a las hebras
c. Síntesis de DNA con Taq polimerasa (90-
75ºC). Temperatura óptima de elongación de
la Ta1 (aprox. 72ªC)

Tras un primer ciclo: Tenemos dos moldes. Obtención de dos dobles cadenas pero de un tamaño mayor de la que
buscamos

¿En qué ciclo aparece una doble cadena de la talla esperada?

• En el segundo ciclo ya tenemos 4 moldes. La Taq se puede unir:


o A los primer de las dos cadenas que se han sintetizado de novo en el ciclo anterior, esta va a elongar
hasta que no haya más molde, que en este caso se corresponde con el final de la secuencia que
queremos amplificar.
o A los primer de las dos cadenas parentales. La Taq va a elongar hasta que no quede molde, que será
una secuencia un poco más larga que nuestra secuencia de interés
• En el tercer ciclo ya tenemos 8 moldes. La Taq elongará 4 de ellos dando lugar cadenas de la talla esperada. Por
eso, a partir del tercer ciclo ya se aumenta exponencialmente el nº de cadenas de la talla esperada.

Comparación entre PCR convencional o real-time / q-PCR

- PCR Real: Resultado al final cuando cargamos el producto amplificado en un gel


de agarosa. En el gel la cuantificación es más difícil de hacer. Es una PCR cuyos
resultados son cualitativos

- Q-PCR: Resultado tras cada ciclo de amplificación. Vemos cuánto producto


tenemos a medida que se va amplificando en una gráfica de amplificación gracias
a que el termociclador está unido a un ordenador. En la Q-PCR podemos amplifica
mucho más

Q-PCR
- ¿Cómo cuantificamos la amplificación en tiempo real? ¿Cómo detectamos los productos amplificados?

Se usan fluróforos en la amplificación que se unen al DNA. Se miden los niveles de fluorescencia mediante un láser
acoplado al termociclador y al ordenador y eso nos permite saber cuánto DNA se ha amplificado.

Para poder comparar la cantidad de DNA en diferentes muestras debemos


establecer un umbral de fluorescencia y determinar en qué nº de ciclo se
alcanza.

Ej foto:

• Fluoróforo naranja: alcanza el umbral en el ciclo nº 22


• Fluoróforo verde: alcanza el umbral en el ciclo nº 27
• Fluoróforo azul: alcanza el umbral en el ciclo nº 37

FLUORÓFOROS QUE SE UTILIZAN

- SYBR Green: se intercalan en las dobles cadenas a


medida que se da la elongación del DNA molde. Son
fluoróforos universales

- Sondas Taqman o FRET:

• Sondas específicas para el / los fragmentos que


queremos amplificar.
• Las sondas son unas secuencias nucleotídicas de
unos 20.-30 nucleótidos que incorporan un
fluoróforo y un aceptor o “quencher” de manera
covalente en los extremos 5’ y 3’. Cuando están
unidos el fluoróforo y el quencher, este último
evita la fluorescencia del primero.
• Cuando la sonda hibrida con su secuencia blanco, y la elongación de la Taq alcanza el extremo 5’ de la sonda, el
fluoróforo es liberado por medio de la actividad 5’ exonucleasa de la DNA polimerasa, lo cual permite que su
emisión sea detectada por el termociclador.
En ambos casos, la intensidad de la fluorescencia se relaciona de manera directamente proporcional con la cantidad de
producto amplificado (DNA).

CUANTIFICACIÓN AMPLIFICACIÓN

- Comparar muestras problemas con muestras control.

- Las muestras control tienen concentraciones conocidas de DNA.

- Se cuantifica en cada muestra la fluorescencia en tiempo real cada vez que pasa un ciclo.

• La muestras con mayor concentración de DNA molde inicial, alcanzan niveles de fluorescencia mayores en el
mismo nº de ciclo que las muestras con menor concentración de molde inicial.
• Las muestras con mayor concentración de DNA molde inicial alcanzal el umbral de fluorescencia tras un nº
menor de ciclos.

- Ct: punto en el cual la fluorescencia de la reacción sobrepasa la fluorescencia basal (umbral o “threshold”, que debe
establecerse en la fase exponencial de la fluorescencia) y se considera como el punto en el cual la reacción de
amplificación da comienzo. Este punto es conocido como Cp (“Crossing point”) o Ct (“Threshold point” o ciclo umbral)

- Se han desarrollado diversos modelos matemáticos para el cálculo de la expresión relativa de un gen. Uno de los más
utilizados es el “delta delta Ct” (ΔΔCt)

En cada muestra:

Media de los Cts del gen a evaluar – Media de los Cts del gen control (GAPDH)

GAPDH: Es una enzima ubicua implicada en la glicolisis, encargada de convertir el glideraldehído-3-fosfato en 1,3-
difosfoglicerato. Se expresa en el núcleo y en el citoplasma.

- Con estas operaciones podemos saber cuántas copias de DNA tenemos en la muestra original y en las amplificadas,
gracias a las muestras control y a las medidas de fluorescencia

Aplicaciones
• Cuantificar cantidades de microorganosmos en aguas, alimentos, muestras biológicas…
• Determinar carga viral (como en el SARS-COV2)
o Diagnóstico mediante RT-qPCR

Virus de RNA:

- paso de mRNA a cDNA mediante la actividad de una retrotranscriptasa

- Incubación con primers y retrotranscripción en un solo paso: añadir molde de DNA + dNTPs + retrotranscriptasa +
Primers.

• Determinar nº de copias de un gen


• Comprobar cómo afecta un medicamento a la expresión de genes de interés: con importantes aplicaciones en
cáncer, procesos de desarrollo, etc
• Analizar las expresión diferencial de genes en cualquier organismo: procariotas, animales, plantas, hongos,
etc.
• Determinar la presencia de transgénicos en alimentos o cultivos
• Genotipado: análisis de polimorfismos en cualquier especie

Limitaciones
• Para poder amplificar una región del DNA concreta necesitamos saber su secuencia para poder diseñar
primers a partir de ella
• Cantidad de DNA que puedes amplificar es limitada
1. Análisis estructural y funcional de genomas
GENÓMICA: Caracterización molecular de genomas completos. Parte de la Genética que se ocupa del estudio y la
caracterización del genoma en su conjunto, así como de su expresión

• Genómica estructural: Caracterización de la naturaleza física de genomas completos


• Genómica comparativa: Secuenciación de genomas de diferentes especies y organismos y se comparan entre
ellos para ver qué genes comparten (homólogos) y cuáles son análogos o diferentes
• Genómica funcional: Caracterización de los transcriptoma (patrones globales de la expresión génica) y el
proteoma

GENÓMICA COMPARATIVA: Inmenso potencial de la genómica comparativa (combina los estudios de genómica
estructural + funcional) entre organismos diferentes. Estudio de:

• Filogenia y evolución
• Rastreo de genes en modelos sencillos: caracterización en levaduras y búsqueda en otros eucariotas
• Ensayo de fármacos en modelos (líneas celulares, organismos modelo)

Ej: Proyecto Genoma Humano no ha servido solo para el estudio del Homo sapiens, sino que también han servido
para estudios evolutivos (filogenia) y del genoma de otras especies que no están tan caracterizadas.

Biología de Sistemas: Utilización de los distintos niveles de estudio del DNA y el RNA para entender de manera global
el funcionamiento molecular de los sistemas biológicos (Genoma + transcriptoma + proteoma + metaboloma +
interactoma)

Ej: Proyecto Microbioma Humano. El objetivo del HMP es describir las comunidades microbianas encontradas
en diferentes partes del cuerpo humano y estudiar las correlaciones entre los cambios en el microbioma y la
salud de las personas

Necesidad de recopilar los datos en sistemas bioinformáticos para establecer las relaciones e interacciones
entre todas las ramas de la Biología de Sistemas

1.1 GENÓMICA ESTRUCTURAL:

Consiste en la caracterización de la naturaleza física de genomas completos, es decir, el establecimiento de la


secuencia completa de cualquier organismo. Ha sido posible el desarrollo tan espectacular que se ha producido en los
sistemas de secuenciación.

MÉTODOS DE SECUENCIACIÓN

- Hay varios tipos:

• De 1º generación: Secuenciación química

• De 2º generación
a. Secuenciación enzimática (de Sanger / Dedeoxi)
b. Secuenciación enzimática (Pirosecuenciación)

• De NGS (Next Generation Sequency) → Son muy caras, por lo que las de 2º generación son las que más se usan.
a. Secuenciación de 2.5ª generación: Ion Torrent, Ion Proton, SMRT…
b. Secuenciación de 3ª generación: Oxford Nanopore Technologies, GridION, MinION… (Next NGS =
NNGS)
c. Secuenciación de 4ª generación: GEM sequencing…
A. SECUENCACIÓN DE 1º GENERACIÓN. Secuenciación Automática por el método de Sanger
Técnica mediante la cual se puede determinar es el orden preciso de nucleótidos de una cadena de DNA

Fue desarrollado por Sanger y sus colegas de la Universidad de Cambridge en 1977. Hasta que se automatizó solo se
podían analizar unas 300 nucleótidos de la secuencia a la vez. A partir de los 80 se automatizó y se consiguió que fuera
posible en análisis de un genoma completo (ABIIPrism / AB, primer secuenciador automático)

Gracias a esto, al descubrimiento de que se podían hacer genotecas y al diseño de nuevas técnicas moleculares se pudo
desarrollar el Proyecto Genoma Humano. Se consiguió secuenciar el genoma humano por la combinación de dos
métodos, uno de consorcio público (método clon a clon de HGP) y otro de consorcio privado (método de la perdigonada,
Celera)

• Método clon a clon: basado en los mapas físicos y genéticos para alinear los fragmentos secuenciados
• Método de la perdigonada: basado en la secuenciación de fragmentos escogidos al azar. Utiliza secuencias
superpuestas para alinear los fragmentos

Principales características

• Implica la síntesis de DNA in vitro. Para ello necesitamos


o Cadena de DNA molde
o Primer forward: complementario al extremo 3’ de la nueva
cadena → ELEMENTO MÁS IMPORTANTE
o dNTPs y ddNTPs
o DNA-polimerasa:
▪ Lectura 3’→ 5’ de la cadena molde de DNA
▪ Síntesis 5’ → 3’ de la nueva cadena de DNA
• Se basa en los principios bioquímicos de la replicación

Los dNTPs normales son deoxis porque tienen un 2’ sin un O

Los dNTPs modificados como di-deoxi son tratados


químicamente para que tengan tanto el 3’ como el 2’ sin O (solo
con H)

- Enlace fosfodiéster normal: ataque nucleofílico entre el 3’ OH


de una cadena a un 5’ fosfato de un dNTP que se va añadir a la cadena

- Enlace fosfodiéster cuando el último dNTP que se ha incorporado es un


dideoxi: la cadena va a tener su extremo libre con 3’ H (no OH), por lo que
no se va a poder incorporar un nuevo dNTP, ya que no se va poder dar el
ataque nucleofílico del 3’OH del final de la cadena a 5’ fosfato del dNTP que
se quiere incorporar. → dNTP dideoxi es un NUCLEÓTIDO TERMINADOR

Reacciones implicadas en la secuenciación por SANGER

CUATRO REACCIONES DIFERENTES

Componentes comunes:

• Cadena de DNA molde (muchas copias)


• Primer forward de DNA (muchas copias, marcado con fluoróforos)
• DNA polimerasa
• dNTPs (alta cantidad)

Componentes diferentes

• ddNTps (poca cantidad)

PASOS DE LA METODOLOGÍA:

1. Marcaje Primer: incubación del fragmento de DNA de interés con un primer 3’ marcado (primero con isótopos
radiactivos 32P O 35S, más tarde con fluoróforos).

El primer provee el grupo 3’-OH inicial necesario para que la DNA polimerasa catalice la primera unión mediante enlace
fosfodiéster entre el último nucleótido del primer (3’) y el primer nucleótido colocado ahí por la DNA polimerasa
(complementario al nucleótido en la misma posición en la cadena molde)

2. Preparación de 4 reacciones, cada una con adición de 4 tipos de dNTPs y de 1 dideoxidi NTP + DNA polimerasa
a. Primera reacción con ddATP
b. Segunda reacción ddTTP
c. Tercera reacción ddCTP
d. Cuarta reacción con ddGTP

3. En cada una de las reacciones, la polimerización 3’→


5’ de la cadena parará en un punto distinto
a. En la primera reacción parará cuando toque
añadir una Adenina
b. En la segunda reacción parará cuando toque
añadir una Timina
c. En la tercera reacción parará cuando toque
añadir una Citosina
d. En la cuarta reacción parará cuando toque
añadir una Guanina

4. Obtención de fragmentos de DNA de TODOS los tamaños

5. Análisis con electroforesis en gel de acrilamida (NO de agarosa, la acrilamida nos permite tener mucha
resolución, es decir, distinguir entre cadenas de tamaño muy parecido, aunque solo se diferencien en una base,
que salen en cada reacción (productos de cada reacción en un carril) → Análisis como en el caso de la
SECUENCIACIÓN QUÍMICA

6. Repetir el proceso en la cadena 3’ → 5’ para comprobar que la secuenciación es correcta y son dan los mismos
resultados que en la cadena 5’ → 3’

OJO: MUY IMPORTANTE que haya un balance adecuado entre los ddATPs y dNTPs para que:

• polimerasa pueda sintetizar la secuencia completa del DNA de interés que queremos secuenciar (no adición de
ddNTPs todo el rato
• que también haya casos en los que se la polimerasa utilice ddNTPs y se pare la síntesis de la secuencia.
• A partir de 900 pares de bases la polimerasa para de sintetizar.
PROYECTO GENOMA HUMANO

Recordar… método robotizado / automatizado de SECUENCIACIÓN MEDIANTE EL MÉTODO DIDEOXI / MÉTODO DE


SANGER → Tipo de secuenciación que se utilizó para el PROYECTO GENOMA HUMANO, junto con otros métodos
técnicos y bioinformáticos. Para ello se apoyó en dos consorcios que trabajaron al principio de manera independiente,
pero luego se unieron para trabajar en paralelo:

• Consorcio público: NIH (dirigido por Francis Collins) → Utilizó al principio una secuenciación basada en el mapa,
jerarquizada. implica la construcción previa de mapas genéticos y mapas físicos; primero ordenar, después
secuenciar.
• Consorcio privado: Celera (dirigido por Craig Venter)→ Utilizó al principio una secuenciación basada shotgun
(fragmentos escogidos al azar), NO jerarquizada. Basada en primero secuenciar, después ordenar.

ESTRATEGIA DE SECUENCIACIÓN BASADA EN EL MAPA (Método clon a clon)

Básicamente trataron primero de ordenar los genes y después secuenciarlos.

1. Tomaron el genoma del ser humano y lo digirieron generando grandes fragmentos de DNA con los cuales
crearon grandes bibliotecas genómicas basadas en BACS (clones de cada gran fragmento)
2. Hicieron mapas físicos (orden de clones) utilizando para ello técnicas de RFPs, FISH, FC…
3. Una vez ordenados, ensamblaban genes contiguos, generando un Coting (ensamblaje solapando los distintos
fragmentos clonados)
4. Digestión de cada uno de los grandes fragmentos y secuenciación de los pequeños resultantes. Clonación de
los pequeños fragmentos y secuenciación de estos

ESTRATEGIA DE SECUENCIACIÓN BASADA EN SHOTGUN (Método de la perdigonada)

trataron primero de secuenciar los genes y luego ordenarlos.

1. Digestión del genoma en pequeños fragmentos y secuenciación de los mismos


2. Orden de los fragmentos secuenciados, lo cual implicaba un esfuerzo bioinformático muy grande.
PUESTA EN COMÚN DE RESULTADOS

- Pactaron la publicación en 2001 (primer borrador)


- En 2004: secuencia de referencia completada

Se sacaron conclusiones NO esperadas

➢ 30.000 - 40.000 genes. Nº de genes era menor que el esperado


➢ Algunos clusters, pero casi 50% de genes dispersos. Algunos de los genes forman agrupaciones / clusters pero
la mitad o más se encuentran dispersas (diferencia con genes procariotas)
➢ 75% genoma es intergénico. 1% son exones, 24% son intrones. La mayor parte del genoma NO eran secuencias
codificantes (regiones intergénicas + intrones)
➢ Genes complejos → splicing alternativo →gran número de proteínas. Complejidad biológica de nuestros genes
es muy alta: se sintetizan un montón de proteínas a partir de muy pocos genes. A raíz de aquí se comenzó a
estudiar el splicing alternativo
➢ 1.4 - 2.1 x 106 SNPs. MUY alta cantidad de SNPs en nuestros genomas

Manejo de la información mediante el NCBI (National Center of Biotechnology Information), un programa público
bioinformático que contiene una base de datos con TODA la información obtenida de los resultados de PROYECTO
GENOMA HUMANO.

B. Secuenciación de 2º / 3º / 4º generación

2º GENERACIÓN. Next Generation Sequencing = NGS.

Introducción

TÉCNICAS:

• Illumina (Solexa) sequencing


• Roche 454 sequencing (piro)
• Ion torrent: Proton / PGM
sequencing
• SOLiD sequencing

FUNDAMENTO EN EL QUE ESTÁN BASADAS:

1. Fragmentación del ADN en


pequeños trozos

2. Fijación de secuencia corta de ADN a una superficie.


Marcaje del ADN por medio de primers o adaptadores que indican el punto de partida para la replicación. Estos
adaptadores moleculares son específicos para la plataforma que estemos utilizando (diferente en cada sistema que
utilicemos: diferente en Illumina e Ion Torrent) , los cuales son de secuencia conocida y colocan los nucleótidos a los
que se unen en lugares concretos de la superficie.

3. Amplificación de esa secuencia (PCR) → IMPRESCINDIBLE


4. Secuenciación de esa secuencia (diferente en cada tipo de NGS)
5. Tratamiento bioinformático → ensamblaje de secuencias solapantes. Reconstrucción de la secuencia completa
por medio de secuencias de referencia y exportación a ficheros de almacenamiento de datos

DEMÁS GENERACIONES:

TERCERA GENERACIÓN:

. NO necesitan amplificación de las secuencias.

. Se pueden secuenciar moléculas únicas (pocos fragmentos), lo que permite lectura más largas que facilitan el
posterior ensamblado

CUARTA GENERACIÓN: Secuenciación in situ, célula única / aislada (muy cara, no se hace en todos lados)

FLUJO DE TRABAJO:

1. Fase de laboratorio:

1.1 Muestreo y extracción del material a secuenciar: DNA o RNA


1.2 Fragmentar el DNA para crear las librerías de DNA (genotecas)
1.3 Decidir qué tipo de técnica de secuenciación vamos a utilizar

- 2º generación:

. Lecturas cortas: Illumina (Solexa) sequencing,

. Lecturas largas: Ion torrent: Proton

- 3º generación: Oxford Nanopore Technologies, GridION, MinION…

2. Fase bioinformática:

2.1 Pre-procesado de lecturas: análisis de las secuencias obtenidas, eliminando las secuencias de los
adaptadores, de las secuencias defectuosas (corrección de errores) y de las lecturas redundantes,
2.2 Mapeo a genoma de referencia y ensamblaje de novo de las secuencias
2.3 Análisis de los resultados: Estudio funcional de las secuencias y sus variantes
2.4 Interpretación de los resultados.

A. ILLUMINA

Características

• Hasta 6.000 millones de secuencias por carrera (1.8 Tb totales secuenciadas)


• Tipos y longitud secuencias analizadas
o Sencillas (1x35 nt, 1x50 nt, 1x300 nt…)
o Paired-end (2x35 nt, 2x50 nt, 2x300 nt…)
• Muy bajo coste por nucleótido secuenciado
• Extremadamente versátil (muchas aplicaciones)
• Secuencias analizadas CORTAS
• Productividad total variable según el equipo
La secuenciación por medio de Illumina se caracteriza básicamente por la ejecución de los siguientes procesos:

a. La amplificación de los fragmentos de ADN para la generación del clúster (colonias del mismo fragmento)
se realiza mediante el método de PCR en puente.
b. La detección de bases en la secuenciación se hace a través de etiquetas fluorescentes.

Generación del clúster

Este proceso se logra mediante el método de amplificación en puente (ver esquema dcha).

• Los fragmentos de ADN se colocan sobre una superficie sólida de vidrio separada por carriles.
• Cada carril está completamente recubierto por oligonucleótidos complementarios a los adaptadores de cada
fragmento que se va a secuenciar, por lo que permiten que cada fragmento se pueda anclar a la celda de flujo.

Una vez anclados los segmentos, la polimerasa inicia el proceso de copia en la hebra de ADN y genera una hebra reversa
complementaria.

• La hebra original es entonces retirada


• La hebra reversa, a través de una secuencia terminal, se pliega y se ancla a su respectiva secuencia
complementaria de oligonucleótido, y así queda en forma de puente.
• Posteriormente, la polimerasa genera una hebra complementaria idéntica a la original, que resulta en dos
hebras clonadas del segmento inicial.

Este proceso se repite masivamente hasta formar millones de copias de cada fragmento

Figura 2. Generación de hebras mediante PCR en


puente.

a)El fragmento de ADN se ancla a la celda de flujo


por medio de la unión de sus adaptadores a los
oligonucleótidos complementarios. b) La
polimerasa genera una hebra reversa
complementaria y la hebra original es retirada. c) La
hebra reversa se pliega y queda en forma de
puente, donde la polimerasa genera una hebra
complementaria idéntica a la original. d) El proceso
se repite masivamente.

Secuenciación

Al finalizar la amplificación clonal, se retiran todas las hebras reversas y quedan únicamente las hebras idénticas a las
originales. En este punto:

• En la placa se introducen nucleótidos modificados con etiquetas fluorescentes específicas para cada tipo. Los
nucleótidos utilizados presentan una modificación química (terminadores reversibles) que evita la unión de más
de un nucleótido marcado en cada sitio de reacción, de tal manera que se puede ubicar el que corresponde a
cada punto en la secuencia y se disminuye el riesgo de errores en la secuenciación.
• Cada vez que una base se adhiere emite una fluorescencia propia que permite su identificación. La etiqueta
debe ser removida antes de la colocación del siguiente nucleótido para evitar que dos bases emitan señal a la
vez.
• Al finalizar la primera lectura, el fragmento resultante es retirado. Este paso se repite simultáneamente con
todas las hebras del mismo clúster de forma paralela hasta completar la secuenciación
B. SECUENCIADOR ION TORRENT DE THERMO FISHER

Características

• Hasta 80 millones de secuencias por carrera (máximo de 4,6 Gb por carrera)


• Longitud secuencias analizadas: 200 – 600 nt
• Tecnología sencilla y efectiva
• Usa nucleótidos NO marcados
• Secuencias analizadas CORTAS
• Productividad total LIMITADA

La secuenciación en Ion Torrent se lleva a cabo en un chip semiconductor, y se diferencia de Illumina en los siguientes
aspectos:

• La amplificación de los fragmentos de ADN se realiza utilizando la técnica de PCR de emulsión.


• La detección de las bases en la secuenciación se da por medio de la detección de un ion semiconductor.

Reacción en cadena de la polimerasa en emulsión

Cada fragmento de ADN se deposita en micromicelas ubicadas en una emulsión de aceite en agua, donde, además, se
deposita una microesfera que está recubierta de adaptadores complementarios a los adaptadores del fragmento, y una
polimerasa que iniciará la PCR

• Para ser copiada la hebra original se hibrida con los adaptadores ubicados en la microesfera.
• Después de la amplificación, se retiran todas las hebras complementarias y se dejan solo las hebras con los
adaptadores ligados a la microesfera, y finalmente quedan miles de copias de un mismo fragmento de ADN

Este paso se repite en millones de esferas que posteriormente se colocan cada una por separado en micropocillos que
contienen todos los componentes necesarios para iniciar la secuenciación

Figura 3. Generación de hebras mediante PCR en


emulsión.

a) Los fragmentos de ADN están en la emulsión junto


con las microesferas recubiertas con adaptadores. b)
El fragmento de ADN hibrida con los adaptadores de la
microesfera para ser amplificado.

Secuenciación mediante ion semiconductor

Cuando un nucleótido es ligado a la hebra que se va a secuenciar, se forma un enlace covalente y se libera un ion de
hidrógeno cargado positivamente. Cada vez que se libera un ion de hidrógeno, se da un cambio en el pH de la
solución del pocillo y se genera una corriente eléctrica.

• Este método se basa en la detección del cambio de voltaje por medio un sensor llamado ISFET (Ion-Sensitive
Field-Effect Transistor), que indica que el nucleótido se ha incorporado correctamente
• Para la identificación del tipo de nucleótido agregado, inicialmente se inserta solo un tipo de base en el pocillo
y el sensor ISFET detectará o no el voltaje dependiendo de la complementariedad de la base. Si esta no es
complementaria, se agrega otro nucleótido hasta que se detecte voltaje.

En esta técnica, los nucleótidos no están modificados con terminadores reversibles, por lo que en caso de que haya
homopolímeros (dos o más nucleótidos iguales que se repiten), el pH disminuirá en mayor proporción y la diferencia
de voltaje aumentará proporcionalmente al número de bases añadidas.

Este proceso ocurre de forma paralela en todos los pocillos del chip y alcanza una longitud de lectura de hasta 400
pares de bases
SECUENCIACIÓN DE TERCERA GENERACIÓN

Las técnicas de Segunda Generación (NGS), todavía, son plataformas relativamente caras y que precisan de unas
necesidades específicas. Por ello, la idea de buscar un alternativa más sencilla, rápida y eficaz, y al menor coste
posible. Con este fin, nace lo que se conoce como SECUENCIACIÓN DE TERCERA GENERACIÓN.

Todas las estrategias se fundamentan en:

• Eliminar la etapa de PCR, y tratar de realizar la propia secuenciación a partir de UNA ÚNICA molécula de ADN.
• Trata de abaratar los costes
• Conseguir ofrecer LECTURAS MÁS LARGAS que faciliten el posterior ensamblado
• Ampliar el abanico de aplicaciones, como la detección de grandes variaciones en la estructura de los
cromosomas o caracterización de haplotipos, entre otras.

COMPARACIÓN ENTRE PLATAFORMAS NGS

APLICACIONES

PROYECTOS

- Proyectos METAGENÓMICA: Obtener secuencia de genomas de diferentes microorganismos, bacterias en este caso,
que componen una comunidad, extrayendo y analizando su ADN de forma global

- Proyecto EARTH BIOGENOME: Secuenciar todas las especies eucariotas existentes.

Se estima que en la Tierra hay entre 10 y 15 millones de especies eucariotas de plantas, animales y hongos,
pero la mayoría son un misterio. Solo 2,3 millones de especies son realmente conocidas.

Se han invertido 3.800 millones de euros en 10 años para secuenciar 1,5·106 genomas

El objetivo principal es comprender la evolución y organización de la vida mediante la secuenciación de los genomas
de los eucariotas.

- Base de datos Gisaid: plataforma creada para compartir datos genómicos de virus como el de la gripe o el de la
COVID-19 (detección de variantes y lugares de procedencia)
2.5 GENÓMICA FUNCIONAL:

Caracterización molecular de genomas completos. Parte de la Genética que se ocupa del estudio y la caracterizacióndel
genoma en su conjunto, así como de su expresión

ESTUDIO FUNCIONAL DEL GENOMA Y SUS ELEMENTOS

Los datos de la secuenciación a gran escala son el punto de partida de la genómica funcional:

• Rastreo de ORFs (marcos de lectura DNA → transcripción) con herramientas bioinformáticas


• Identificación de función mediante dominios o comparando con otras especies
• Generación de Knock-Out y Knock-In para el estudio de fenotipos
• Generación de transgénicos para ver la función del gen inserto
• Inmunoprecipitación de cromatina (ChiP). Estudios de epigenética y su implicación en la transcripción.
• Transgénicos
• RT-PCR (análisis cuantitativo DNA)

TÉCNICAS MASIVAS DE ESTUDIO DE PROTEOMA Y TRANCRIPTOMA: LA GENÓMICA FUNCIONAL Aborda los aspectos
del significado biológica del genoma: la expresión génica a nivel de TRANSCRIPTOMA, INTERACTOMA Y PROTEOMA

Transcritoma:

• Northen-Blot

• Q-PCR

• Microarrays: Comparación de cDNAs o proteínas entre tejidos/órganos/momento del desarrollo/respuesta a distintos


agentes/distintos fenotipos/síndromes, etc

• RNA-seq: Secuenciación de todos los transcritos

• Secuenciación in situ y en célula única. 4ª generación.

Proteoma

• ESPECTROMETIA DE MASAS para identificar las proteínas

• CITE-SEQ

A. TRANSCRIPTOMA

Conjunto de moléculas de ARNm que hay en una célula concreta en un momento concreto (NO ES UNIVERSAL NI
CONSTANTE, a diferencia del GENOMA). Esto es lo que permite que haya diferencias entre tejidos y entre individuos.

Constituye < 4% del ARN total en la célula. El ARNm un conjunto de moléculas MUY relevante desde el punto de vista
funcional, pero no desde el punto de vista cuantitativo, muchos otros tipos de RNA son más abundantes.

• Muy variable en el tiempo, espacio, ambiente.


• Gran variedad de RNAs

TÉCNICAS / SISTEMAS DE DETECCIÓN DE LA EXPRESIÓN GÉNICA:

• -Técnicas tradicionales para medir la expresión génica (permite el análisis de pocos genes), como:
o Northern-Blot
o Real Time-PCR.
• Nuevas técnicas. Desarrollo tecnológico (medir muchos genes):
o Expressed Sequenced Tags (ESTs).
o Serial analysis gene expression (SAGE).
o Suppression substractive hybridization (SSH).
o Microarrays
o RNA-Seq

- Microarreys

El estudio del TRANSCRIPTOMA se hace mediante una serie de tecnologías: matrices = biochips = arreys, etc (todos
sinónimos). Estudio del cDNA que nos van a permitir hacer estudios exhaustivos de todo el perfil transcripcional de
una muestra biológica

Los microarrays de DNA permiten la medida simultánea de los niveles de expresión de miles de genes (sondas) en un
solo experimento de hibridación con una mezcla compleja de DNA o RNA (dianas). Constan de miles de conjuntos
ordenados de moléculas de DNA de secuencia conocida depositados en un soporte sólido (~ 2 cm2) como cristal, nylon
o silicio.

• Sondas: secuencias de DNA conocidas (oligonucleótidos o productos de PCR) inmovilizadas ordenadamente sobre
una superficie sólida.

• Dianas: muestra problema de DNA o RNA marcada cuya abundancia será determinada por hibridación.

En un chip puede haber miles de muestras (cDNA de genes conocidos) : Los chips se exponen a muestras de mRNA
marcados procedentes de distintos tejidos (distinta fase de desarrollo, tumoral vs normal, etc.)

- Se hibridan las sondas y dianas en chips con muestras de cDNA que representan el transcriptoma de células
diferentes

- Se comparan midiendo la intensidad de la fluorescencia, que indican las variaciones en la expresión de los
tejidos

TIPOS DE APARATOS (ARREYS)

Se pueden clasificar en función de:

• Su densidad: diferencia en el nº de elementos / cm2 (nº de moléculas de mRNA que puedo estudiar / cm2)
o Macroarreys / macro-matrices = < 1000 elementos / cm2 (menos detalle)
o Microarreys / micro-matrices = > 1000 elementos / cm2 (más detalle)

• Tipo de sonda / elemento que se utiliza:

o Sondas inmovilizadas: fragmentos relativamente grandes de cDNA (100-500 nucleótidos), aunque


podría ser de gDNA también → permite hacer un estudio de los patrones de expresión génica de una
muestra biológica y comparar patrones de expresión (transcriptoma).
o Oligonucleótidos sintetizados in situ: síntesis in situ de fragmentos pequeños (de 20-25 nucleótidos).
de DNA genómico (gDNA), aunque también se puede utilizar cDNA → permite hacer un estudio más
bien a nivel de la GENÓMICA ESTRCUTURAL (para detectar polimorfismos, mutaciones, etc)

IMAGEN: Microarrey de sonda inmovilizada (de cDNA) denominado Gene Chip:

• 6’5 M de localizaciones (de dimensiones 1’28 x 1’28 cm en este caso) distintas en cada microarrey
• En cada localización hay muchas copias de un ÚNICO tipo de sonda / elemento: muchas copias de una pequeña
secuencia representativa del cDNA de un gen.
Lo que se pretende con el uso de estos arreys es obtener una muestra representativa del transcriptoma de una muestra
biológica. No es creada por biólogos, sino por técnicos ingenieros, informáticos, etc

Una vez tenemos el microarrey del tipo celular de nuestra muestra biológica, añadimos sobre ella los fragmentos de
mRNA, extraídos de la muestra biológica que queremos estudiar (hibridación), marcados con un fluoróforo.

Los mensajeros se podrán unir por complementariedad a los cDNA del arrey, si es que están presentes (señal
fluorescente en las localizaciones cuyo cDNA ha hibridado con el mRNA marcado).

Si alguno de los genes no se está expresando no habrá mRNA para este gen y por tanto dicho mRNA no se une
a su secuencia de cDNA correspondiente (no señal fluorescente en la localización de dicho cDNA)

Microarrey basados oligonucleótidos sintetizados in situ

Se basan en unidades con el grupo OH bloqueado: una base de soporte de la


matriz formada por moléculas con grupos OH libres + una sustancia bloqueante
de grupos hidroxilo

Ronda 1:

1. El robot añade una plantilla sobre la matriz de grupos hidroxilos


bloqueados, esta plantilla se coloca solo sobre algunas moléculas
bloqueantes, dejando espacios sin cubrir
2. Se ilumina el arrey: la luz eliminará aquellas moléculas bloqueantes
NO cubiertas por la plantilla, dejando los grupos OH de la matriz libres
3. Esto permite que añadamos dNTPs unidos a la molécula bloqueante
de OH (dATPs por ejemplo). Dichos nucleótidos se unirán a los OH
libres

Ronda 2:

4. Se elimina la plantilla colocada anteriormente, se coloca otra que dejará otros


espacios espacios libres
5. Se ilumina el arrey: luz eliminará aquellas moléculas bloqueantes NO cubiertas
por la plantilla, dejando los grupos OH de la matriz libres
6. Adición de un dNTP diferente unido a molécula bloqueante (dTTPs por ejemplo)

Así sucesivamente hasta que conseguimos un arrey completo

APLICACIONES MICROARREYS cDNA:

1. PERFILES DE EXPRESIÓN GÉNICA

Tienen muchas aplicaciones, pero básicamente se van a utilizar para crear perfiles de expresión génica.

Interpretación de las señales fluorescentes del microarrey hibridado mRNA de muestra biológica, mediante un
software que traduce dicha información en una descripción de qué genes se están expresando.
2. COMPARACIÓN DE PERFILES

SE PUEDEN UTILIZAR DOS MUESTRAS BIOLÓGICAS DE PARTIDA (UNA CONTROL Y OTRA DE ESTUDIO). Se marca una
de las muestras con un fluoróforos y la otra con otro fluoróforo. Se hibridan las dos a la vez con el arrey y se compara
el patrón de expresión génica de cada una de las muestras (tanto a nivel de qué genes se expresan como a nivel de
cuánto se expresan)

Ejemplo: estudio para predecir la recaída del cáncer de mama

1. Se utilizan dos fluoróforos distintos para marcar los dos tipos de muestras (una control y otra de una célula
cancerosa)
2. Análisis de la hibridación simultánea de los mRNA de ambas muestras biológicas con el microarrey
a. Señal amarilla: Se unen mRNAs de ambas muestras
b. Señal roja: Se unen mRNAs de célula cancerosas (mujeres CON recaída)
c. Señal verde: se unen mRNAs de célula control (mujeres SIN recaída)

3. INTERPRETACIÓN DE LOS RESULTADOS

a. Patrón de expresión de la mitad de arriba del microarrey contrario al de la mitad de abajo (clustering)
b. Muestra de arriba: muestras de mujeres que habían tenido cáncer de mama y no habían recaído tras
5 años de finalizar el tratamiento
c. Muestra de abajo: muestra de mujeres que habían tenido cáncer de mama y SÍ habían recaído tras 5
años de finalizar el tratamiento

4. APLICACIÓN: Estudio del parón de expresión de células de las mamas de una mujer que ha sufrido cáncer de
mama para ver si tiene más o menos posibilidades de recaer, en función de si el patrón de expresión génica se
parece más a al grupo de células de mujeres SIN recaída o al de mujeres CON recaída
- RNA-seq

Permite descubrir todo el transcriptoma en cualquier organismo.

El RNA-seq es un tipo especial de secuenciación cuyo objetivo es ver los patrones de expresión de los genes. En vez de
leerse y secuenciarse todo el genoma u exoma, se centra en secuenciar el contenido celular total de RNA, incluidos
mRNA, rRNA y tRNA (diferentes tipos de RNA seq: mRNA seq, targeted RNA seq, Total RNA Seq…)

Estas técnicas basadas en secuenciación masiva eliminan el ruido introducido por la correcta hibridación de sondas
dependiente del diseño empleado, ofrecen un mayor rango dinámico de detección al evitar la saturación por señales
de fluorescencia y permiten obtener un panorama más global de los genes activados y/o reprimidos sin restringirse a
genes previamente caracterizados

Con esta técnica se pueden detectar:

• Transcritos raros sin conocer el gen previamente


• Splicing alternativo → análisis de mRNA diferentes codificados por el mismo gen
• Variación de secuencia → análisis polimorfismos de mRNAs que codifican para las mismas proteínas

PASOS RNA-Seq:

1. Convertir la población de ARN que se va a


secuenciar en fragmentos de ADNc una biblioteca
de ADNc. La amplificación del ADN implica una
síntesis de la primera hebra mediada por
transcriptasa inversa seguida de una síntesis de la
segunda hebra mediada por la polimerasa de ADN.
Se utilizará un tipo de biblioteca de cDNA u otro en
función del RNA que queramos identificar.

2. Se agregan adaptadores (primers) que se unen a cada extremo de los


fragmentos. Contienen elementos funcionales que permiten la
secuenciación (si es un primer puede utilizarse para amplificación por PCR
del fragmento que voy a secuenciar)

3. La biblioteca de ADNc es luego analizada por NGS (Next Generation


Sequencing) produciendo secuencias cortas que corresponden a uno o
ambos extremos del fragmentos. La secuenciación RNA-Seq de las
muestras puede realizarse mediante cuatro tipos diferentes de
plataforma: Illumina, SOLiD, 454 y Ion Torrent. Sin embargo, para términos
prácticos de este documento se asume que los datos fueron obtenidos a
través de la plataforma de secuenciación Illumina,

Las secuencias cortas generadas se solapan unas con otras. Aquellas


secuencias solapantes se alinearán (si se alienan significa que tienen
partes comunes y que por tanto una va a continuación de la otra).

4. Después de la etapa de alineación, puede concentrarse en analizar sus


datos. Herramientas como Sailfish, RSEM y BitSeq lo ayudará a cuantificar
sus niveles de expresión.

5. Contando el nº de lecturas que hay de cada gen en toda la biblioteca de


cDNA podemos hacer un análisis cuantitativo de la expresión de ese gen.
Con esto podemos comparar el grado de expresión en dos células / tejidos diferentes
https://www.redalyc.org/pdf/2091/209126216009.pdf

- SECUENCIACIÓN DE 4º GENERACIÓN: Secuenciación in situ / de célula única

Se basa en secuenciar los ácidos nucleicos directamente en


las células o en las muestras de estudio. Con ello podemos
saber qué genes se expresa más o menos en cada línea
celular, en un contexto histológico natural. Consigue
separar las poblaciones celulares heterogéneas e identificar
subpoblaciones de interés utilizando herramientas de
visualización de datos y los perfiles de expresión genética.

Para poder acceder al ARN de la célula, y a partir de él hacer


una biblioteca de cDNA debemos llevar a cabo una serie de pasos experimentales previos:

1. Disociación del órgano


2. Captura unicelular (utilizando o bien micro-manipulación con fórceps para aislar células de secciones histológicas
o bien micro-disección de captura con láser que recorta células de un tejido congelado)
3. Lisis de la célula

Una vez hecho esto, los pasos son los mismos que en el resto de NGSs: amplificación, preparación de la biblioteca de
cDNA, ordenado, análisis.

Hay muchos usos para scRNA-seq, que ofrece la información sobre las células y enfermedades. La ejecución scRNA-seq
en las células de un tumor puede habilitar la separación de fibroblastos del y de las células cancerosas, basándose
solamente en sus firmas de la expresión génica.

El reto principal con estudios unicelulares es la pequeña cantidad de material con la cual está disponible para trabajar.
Cada célula contiene solamente ~0,1 picogramos de mRNA. Ésta es la razón que cada tecnología scRNA-seq requiere un
paso de la amplificación proveer de más material al trabajo.
DROP-SEQ (Illumina)

Analiza transcritos de células individuales de manera paralela. Esta técnica utiliza un dispositivo de microfluido para
compartimentalizar gotas que contienen una sola célula, buffer de lisis y una amplia gama de beads (con primers) que
se unirán a las secuencias de mRNA de la célula.

Cada bead posee:

• 30 pares de bas de oligo(dT) que se unirán a mRNA (a su cola de poliA)


• Un índice molecular de 8 pb que identificará cada cadena de mRNA de manera individual
• Una secuencia de 12pb única para cada célula
• Una secuencia universal que llevarán todos los primers de todas las gotas con células.

Una vez las células han sido compartimentalizadas, el buufer de lisis rompe la célula y el mRNA liberado hibrida con las
30 pb de oligo(dT) de los primer (cada mRNA se une a un bead). A continuación, las gotas son rotas para que liberen
beads asociados a mRNA que contenían. Estos beads son aislados y tratadas con una RTasa, con lo que se generará una
biblioteca de cDNA (gracias a las secuencias universales primer asociados a las cadenas de mRNA → amplificación por
PCR). Por último, se añaden adaptadores moleculares para la secuenciación utilizando el Nextera XT Library Preparation
Kit.

PROTEOMA

La PROTEÓMICA es el estudio del PROTEOMA, el conjunto de las proteínas que están presentes en una determinada
muestra biológica en un determinado momento (depende de tejido, órgano y momento). Niveles de expresión varían
con el desarrollo, entre tipos celulares, en los distintos compartimentos subcelulares…

Dificultades adicionales en su estudio: presencia de modificaciones post-traduccionales + NO se puede amplificar (a


diferencia del TRANSCRIPTOMA y del GENOMA

IMPORTANTE: en la amplificación del TRANSCRIPTOMA debemos mantener la proporcionalidad de la


expresión original del gen

Es una extensión de la genómica, y su objetivo es el estudio de las proteínas presentes en una célula en un momento
dado y bajo unas condiciones determinadas.

• Identificación de todas las proteínas expresadas (40-60% de los genes humanos producen mas de una
proteína por procesamiento alternativo)
• La naturaleza y alcance de las modificaciones postraduccionales (más de 100 mecanismos de modificación
postraduccional)
• Las interacciones proteína- proteína
• La localización de las proteínas en diversos compartimentos celulares

TÉCNICAS ANÁLISIS PROTEOMA

1) Separación → electroforesis bidimensional.


2) Identificación → espectrometría de masas.

Aplicaciones:

• Identificación de proteínas.
• Secuenciación de péptidos.
• Secuenciación masiva de proteínas.
ELECTROFORESIS BIDIMENSIONAL

Separación de las proteínas en 2D:

• En función de su carga (depende de su secuencia de aminoácidos):


a través de un capilar que en un extremo tiene pH báscio y el otro
tiene un pH ácido + aplicación de carga eléctrica: proteínas más
acidas se encuentran más hacia el extremo acido y las más básicas
hacia las zonas el extremo básico

• En función de su dimensión: se tratan con SDS para que todas las


moléculas tengan carga negativa de manera proporcional a su
tamaño. Se las somete a electroforesis y las proteínas migran del
polo – al polo + en función de su tamaño (las más pequeñas
migrarán más)

Resultado: patrón 2D de la matriz de electroforesis para una muestra biológica concreta (se pueden comparar entre
células de tejidos diferentes para ver patrones comunes y diferentes de proteínas)

ESPECTROMETRÍA DE MASAS

MALDI-TOF = matrix assisted laser desorption ionization time-of-flight,

Permite separación e IDENTIFICACIÓN y CUANTIFICACIÓN de proteínas

1. ELECTROFORESIS: Separación de las proteínas por su tamaño


2. DIGESTIÓN DE PROTEÍNAS CON TRIPSINA: Fragmentación de la proteína en oligopéptidos
3. EXCITACIÓN CON LÁSER: identificación de patrón de masas de cada oligopéptido

CADA proteína tiene un conjunto de patrón de masas (huella peptídida) concreto

PROYECTOS RELACIONADOS:

• “The Human Protein Atlas”: Programa sueco iniciado en 2003 con el objetivo de mapear todas las proteínas
humanas en células, tejidos y órganos mediante la integración de varias tecnologías ómicas: proteómica,
transcriptómica, etc
o Atlas tisular : distribución de proteínas en todos los tejidos y órganos principales
o Atlas celular: localización subcelular de proteínas en células individuales
o Atlas patológico: muestra el impacto de los niveles de proteínas para la supervivencia de pacientes
con cáncer
• Proyecto ENCODE: (ENCcyclopedia Of DNA Elements): se trata de un proyecto de análisis exhaustivo del
genoma humano, que muestra:
o todos los transcritos primarios y maduros
o la localización de las principales modificaciones de histonas
o los sitios de unión de factores de transcripción
o sitios de inicio de la transcripción, sitios hipersensibles a DNAsa,

GEN: “la unión de las secuencias genómicas que codifican un conjunto coherente de productos funcionales,
potencialmente solapantes”.
• Proyecto Genotype-Tissue Expression (GTEx): Cómo influye la variación del genoma en la expresión de los
genes en los distintos tejidos y células del cuerpo humano. Estudiar la expresión y regulación génica específica
de tejido.
o La versión actual es V7, que incluye 11.688 muestras RNAseq, 53 tejidos y 714 donantes
o La última versión del incluye 17 382 muestras de 54 tejidos diferentes, obtenidas de 948 personas
donantes

Se encontraron diferencias relacionadas con ser hombre o mujer en más de 750 genes, la mayoría en el tejido
mamario. Y hasta 2.000 genes (un 10% del total) modificaban sus niveles de actividad con la edad.

La información generada en el proyecto GTEx proporciona un mapa exhaustivo de cómo influye la variación
genética en la regulación y expresión génica en los diferentes tejidos y células del cuerpo humano y cuál es su
contribución a la salud humana. Combinando sus resultados con datos epigenéticos obtenidos en otros grandes
proyectos, los investigadores están más cerca de descifrar cómo actúa el genoma de cada persona en sus células
y tejidos y cómo opera para influir en su desarrollo, características y estado de salud. El proyecto GTEx finaliza,
pero sus los datos obtenidos serán utilizados en múltiples estudios futuros.

También podría gustarte