Documentos de Académico
Documentos de Profesional
Documentos de Cultura
0. Introducción
¿Qué es la ingeniería genética?
• La ingeniería genética o tecnología de DNA recombinante es un conjunto de técnicas moleculares que permiten
manipular el material genético modificando, introduciendo o eliminando segmentos de DNA
• El término recombinante se utiliza porque a menudo el objetivo es combinar DNA de dos orígenes distintos
•Mapas de restricción.
¿Qué es la Biotecnología?
La utilización de seres vivos para crear productos que mejoran nuestra calidad de vida
• Biotecnología tradicional:
o Surge hace miles de años.
o Productos: Pan, vino, alcohol (destilado), cerveza, yogur, plástico, enzimas…
• Biotecnología moderna:
o Surge en tiempos modernos y emplea técnicas de Ingenería Genética
o Produce Organismos Modificados Genéticamente (OMGs)
o Productos: Organismos que limpian el medio ambiente, medicinas y tratamientos, vegetales y
animales que mejoran el cultivo y ganado.
OBJETIVOS
• Comprender cómo las características de la genética bacteriana puede ser utilizada para la clonación de un gen y/o
su expresión mediante moléculas de DNA recombinante
¿Cómo lo separamos?
- Mapas de restricción: Representación de los lugares (o dianas) de restricción contenidos en una secuencia de DNA
(LINEAL O CIRCULA)
- Hibridación de ácidos nucleicos (utilizando sondas): Técnicas clásicas pero que se siguen utilizando:
• Northen
• Sauthern
Características
- Nucleasas sintetizadas por bacterias como un mecanismo de defensa natural frente a bacteriófagos
- Nucleasas capaces de reconocer y cortar un enlace fosfodiéster en una secuencia específica de nucleótidos en una
doble cadena SI NO TIENEN BASES METILADAS (solo no tienen bases no metilados el DNA exógeno, NO bacteriano, ya
que este último está
metilado)
Tipos principales
• Meganucleasas
• Enzimas con dedos de Zinc (ZNF)
• Proteínas TALENT
• Sistema CRISPR/Cas
Endonucleasas de Tipo II
Cortan el DNA
El nº de fregmentos en genoma depende de los tamaños de la diana de restricción de la enzima que se esté utilizando.
Cuanto menor el tamaño de la diana más es probable/ más frecuentemente se da el corte
Isoesquizómeros: Enzimas de restricción que reconocen el mismo sitio diana / de restricción y cortan en la misma
posición. Generan extremos compatibles.
Neoesquizómeros: Enzimas de restricción que reconocen el mismo sitio diana / de restricción y NO cortan en la misma
posición. NO generan extremos compatibles
IMPORTANTE: Si queremos utilizar dos enzimas que corten el mismo sitio diana debemos asegurarnos de que
ambas tienen actividad catalítica a la misma temperatura. Esta depende de cuál sea la temperatura óptima de
crecimiento del microorganismo del cual se han aislado
Isocaudámeros: Enzimas de restricción que RECONOCEN DISTINTAS secuencias pero dejan LOS MISMOS extremos
cohesivos
Aplicaciones
− Mapas de restricción con varias enzimas: Plásmidos con varios sitios de restricción.
− Búsqueda de fragmentos específicos en una muestra genómica grande mediante técnicas de hibridación de
ácidos nucleicos
o Southern Blot
o RFLPs
− Clonación de fragmentos específicos de genomas para la creación de genotecas o para expresar proteínas de
interés.
− Obtención de la secuencia del genoma humano (2000)
Representación lineal de dianas de restricción (o lugares) contenidos en una secuencia de DNA (lineal o circular)
Pasos para seguir cuando no conocemos la secuencia de nucleótidos del DNA con la que queremos hacer el mapa:
Programas bioinformáticos para construir un mapa de restricción cuando conocemos la secuencia de nucleótidos.
Se utiliza para el aislamiento de fragmentos específicos de DNA, es decir, para identificar secuencias concretas de DNA
en una muestra con mezcla de fragmentos de DNA
Para ello:
1. Se desnaturalizan los fragmentos de DNA de la mezcla, dejando las cadenas como monocatenarias (alta
temperatura)
2. Se hibridan los fragmentos desnaturalizados con las sondas de DNA marcadas (que son complementarias a la
secuencia que estamos buscando)
3. La hibridación debe darse UNA TEMPERATURA ADECUADA Y ESPECÍFICA y con UNA FUERZA IÓNICA DE TAMPÓN
CONCRETA, para que se una solo al fragmento de DNA para el que es totalmente complementaria. Estos son
parámetros esenciales para controlar las condiciones de astringencia de la hibridación.
Ejemplo
A. Southern Blot
TÉCNICA:
Técnicas análogas
B. RFLPs
B.1 Uso de técnica de Southern Blot para la identificación de RFLPs (Restriction Fragment Length Polymorphism)
Fragmentos de longitud polimórfica generados por enzimas de restricción. Se producen por polimorfismos genéticos
entre el genoma de diferentes individuos que hacen que aparezcan o desaparezcan dianas de restricción.
1. Uso de la enzima de restricción cuyo sitio de restricción
desaparece en uno de los genomas
2. Electroforesis en gel de agarosa
3. Diseño de sonda que hibride en la secuencia del sitio de
restricción específico para la enzima de restricción usada
a. Individuos “normales” (CON la diana de restricción en
su genoma): La sonda hibrida en dos bandas
b. Individuos “enfermos” (SIN la diana de restricción en
su genoma): La sonda hibrida en una sola banda
Clonación
A. Genotecas
Pasos para la construcción de una molécula de DNA recombinante con el fin de conseguir muchas copias de un
fragmento de DNA deseado.
B. Expresión de proteínas
Clonación: Obtención de muchas copias idénticas de un fragmento de DNA. Se define como el proceso para aislar una
secuencia de DNA de interés, insertarla en un vector y obtener múltiples copias en un organismo hospedador eucariota
(normalmente E.coli)
DNA de dos orígenes diferentes: DNA vector (normalmente un plásmido bacteriano) y un DNA inserto (fragmento de
genoma eucariota normalmente)
• Digestión del DNA con enzimas de restricción para generar extremos cohesivos compatibles entre las cadenas
de DNA vector y DNA inserto (para que se reconozcan e hibriden entre sí)
• Ligación del DNA con una DNA ligasa = Obtención de DNA recombinante
• Transformación de bacterias competentes con el DNA recombinante obtenido
• Amplificación del DNA recombinante (cultivo de bacterias transformadas) y selección:
a. Con antibióticos, sobreviven aquellas bacterias que hayan incorporado el plásmido vector que posee
genes de resistencia a antibióticos
b. Con genes chivatos como el de la enzima X-Gal.
1. EXTRACCIÓN DEL DNA
Obtención de INSERTOS:
Obtención de VECTORES:
Ej: pBluescript II SK (+/-): Plásmido recombinante, mejorado con ingeniería genética. De manera natural
presenta el gen de resistencia a ampicilina, pero además se le introducen cambios que permiten que su
selección sea más sencilla:
- Genes de cambio de coloración: posee el gen LacZ que codifica para la subunidad de la enzima beta-
galactosidasa (cambio de color de colonias de blanco a azul cuando la enzima beta-galactosidasa reacciona con
X-gal, un análogo de la lactosa que se vuelve de color azul cuando es procesado por dicha enzima.
. CUANDO SE INCORPORA EL PLÁSMIDO SIN EL INSERTO: El plásmido posee la secuencia que codifica
para la subunidad alfa de la beta-galactosidasa. El cromosoma bacteriano posee la secuencia que
codifica para la subunidad omega. Cuando ambas se unen formando un heterodímero, la beta-
galactosidasa está activa y es funcional. Esta entonces reacciona con el sustrato (X-gal) generando un
color azul en la colonia
- Adición de múltiples sitios de clonaje únicos (secuencia con muchos sitios de restricción, siendo cada uno único
para una enzima de restricción). Son llamados MCS o sitios “poly-linker”
- Mutación en las secuencias de control de la replicación del origen CoE1, permitiendo que la bacteria replique
el plásmido hasta más de un total de 500 veces (más de 500 copias/célula)
2. DIGESTIÓN DEL DNA CON ER
Digestión del DNA inserto y DNA vector con las mismas enzimas de
restricción, que generen
- Método químico: Transformación de E.coli por choque térmico (aumento de fluidez de la membrana y
generación de gradiente de temperatura) + CaCl2 (neutraliza carga negativa de la membrana plasmática,
evitando así que se repela con el DNA que es también de carga negativa, favoreciendo la entrada de dicho
DNA en el citosol)
- Método físico: Transformación de E.coli por electroporación, agujeros en la membrana producidos oír
estímulos eléctricos.
5. AMPLIFIACIÓN Y SELECCIÓN DE BACTERIAS
- La secuencia que codifica para la proteína eucariota debe ser capaz de replicarse, transcribirse y traducirse en una
célula procariota
• Insulina
• Hormona del crecimiento
• Antibióticos
• Factores sanguíneos (medicina) obtenidos
por ingeniería genética → evita que
pacientes hemofílicos necesiten
transfusiones sanguíneas continuas
• Proteínas recombinantes utilizadas en
investigación
• Prácticamente cualquier proteína
codificada por un gen DE SECUENCIA
CONOCIDA
PRIMERA PROTEÍNA QUE SE EXPRESÓ: Insulina humana (1982). Fue la primera proteína terapéutixa fabricada
mediante tecnología de DNA recombinante
PROCESO DE CLONACIÓN Y PRODUCCIÓN INSULINA
- cDNAs sacados de la generación de una genoteca de cDNAs (fragmentos pequeños → vectores con capacidad
limitada de portar insertos)
- Amplificación por PCR de la secuencia del cDNA a expresar (obtenida de una genoteca ya generada)
2. Elegir el vector.
Debe de tener:
- Se añaden en los extremos del cDNA sitios ligadores (“linker”), secuencias de DNA
de 8-12 pb con un sitio de restricción. Esto se añade mediante PCR
- Inserción del inserto (cDNA que codifica para nuestra proteína de interés) en el
vector
B. VECTORES DE EXPRESIÓN
Señales TRANSCRIPCIÓN
Señales TRADUCCIÓN
OJO: Todos estos sitios además de los sitios vistos en los vectores de replicación
Combina dos construcciones de DNA recombinante Operón Lac + RNA pol T7 (inducible por IPTG, expresión específica
de genes bajo promotor T7)
- DNA recombinante con nuestro DNA inserto que codifica para la proteína de interés. Este DNA inserto está bajo el
control de un promotor (en este caso, promotor del fago T7, un promotor muy fuerte que va a dar lugar a una
expresión a gran escala de los genes que controla)
- DNA recombinante con DNA inserto que codifica para la RNA polimerasa del fago
T7. DNA inserto bajo el control del promotor del gen Lac.
SISTEMA PROMOTOR Pl- Lambda, represor ts, inducible por temperat ura.
Una de las alternativas para disminuir el efecto de la primera desventaja es el empleo de cepas comerciales que
contengan el gen del represor o cotransformar con un vector que lo incluya.
3. Proteínas de fusión
Vector con promotor para una secuencia que se fusiona con la secuencia de nuestro cDNA de interés (Ej: Promotor
lacZ-gen LacZ-secuencia cDNA)
IMPORTANTE:
La PCR nos permite obtener millones de copias de un fragmento de DNA concreto sin necesidad de introducirlo en un
vector ni de utilizar bacterias para amplificarlo.
Se basa en la REPLICACIÓN in vitro. Por ello necesitamos todo lo necesario para que se de el proceso igual que in vivo:
Por cada ciclo se sintetizan 2 moléculas nuevas de DNA, por ello para calcular la cantidad de moléculas de DNA
obtenidas se utiliza la fórmula:
CARACTERÍSTICAS DE UN PRIMER:
Longitud. 18 y 24 pares de bases, que hacen que la temperatura de melting oscile entre 50 y 650C (temperatura
óptima para el alineamiento).
• Contenido de G-C. Para determinar este parámetro es necesario conocer el contenido de G-C de la secuencia a
amplificar, pero como regla básica se prefiere oligonucleótidos con un contenido de GC de 44 a 60%, que les da
estabilidad y una temperatura de melting apropiada.
• Se debe evitar que existan más de 3 repeticiones consecutivas de una base en su diseño (ej. AAAAA).
• La temperatura de melting debe ser lo mas parecida posible (máximo 5 grados de diferencia entre uno y otro
primer).
• Es importante observar los extremos 5’ y 3’ de los oligonucleótidos y revisar que estos extremos no sean
complementarios, ejemplos:
ETAPAS DE PCR
3 ETAPAS EN EL CICLO
Tras un primer ciclo: Tenemos dos moldes. Obtención de dos dobles cadenas pero de un tamaño mayor de la que
buscamos
Q-PCR
- ¿Cómo cuantificamos la amplificación en tiempo real? ¿Cómo detectamos los productos amplificados?
Se usan fluróforos en la amplificación que se unen al DNA. Se miden los niveles de fluorescencia mediante un láser
acoplado al termociclador y al ordenador y eso nos permite saber cuánto DNA se ha amplificado.
Ej foto:
CUANTIFICACIÓN AMPLIFICACIÓN
- Se cuantifica en cada muestra la fluorescencia en tiempo real cada vez que pasa un ciclo.
• La muestras con mayor concentración de DNA molde inicial, alcanzan niveles de fluorescencia mayores en el
mismo nº de ciclo que las muestras con menor concentración de molde inicial.
• Las muestras con mayor concentración de DNA molde inicial alcanzal el umbral de fluorescencia tras un nº
menor de ciclos.
- Ct: punto en el cual la fluorescencia de la reacción sobrepasa la fluorescencia basal (umbral o “threshold”, que debe
establecerse en la fase exponencial de la fluorescencia) y se considera como el punto en el cual la reacción de
amplificación da comienzo. Este punto es conocido como Cp (“Crossing point”) o Ct (“Threshold point” o ciclo umbral)
- Se han desarrollado diversos modelos matemáticos para el cálculo de la expresión relativa de un gen. Uno de los más
utilizados es el “delta delta Ct” (ΔΔCt)
En cada muestra:
Media de los Cts del gen a evaluar – Media de los Cts del gen control (GAPDH)
GAPDH: Es una enzima ubicua implicada en la glicolisis, encargada de convertir el glideraldehído-3-fosfato en 1,3-
difosfoglicerato. Se expresa en el núcleo y en el citoplasma.
- Con estas operaciones podemos saber cuántas copias de DNA tenemos en la muestra original y en las amplificadas,
gracias a las muestras control y a las medidas de fluorescencia
Aplicaciones
• Cuantificar cantidades de microorganosmos en aguas, alimentos, muestras biológicas…
• Determinar carga viral (como en el SARS-COV2)
o Diagnóstico mediante RT-qPCR
Virus de RNA:
- Incubación con primers y retrotranscripción en un solo paso: añadir molde de DNA + dNTPs + retrotranscriptasa +
Primers.
Limitaciones
• Para poder amplificar una región del DNA concreta necesitamos saber su secuencia para poder diseñar
primers a partir de ella
• Cantidad de DNA que puedes amplificar es limitada
1. Análisis estructural y funcional de genomas
GENÓMICA: Caracterización molecular de genomas completos. Parte de la Genética que se ocupa del estudio y la
caracterización del genoma en su conjunto, así como de su expresión
GENÓMICA COMPARATIVA: Inmenso potencial de la genómica comparativa (combina los estudios de genómica
estructural + funcional) entre organismos diferentes. Estudio de:
• Filogenia y evolución
• Rastreo de genes en modelos sencillos: caracterización en levaduras y búsqueda en otros eucariotas
• Ensayo de fármacos en modelos (líneas celulares, organismos modelo)
Ej: Proyecto Genoma Humano no ha servido solo para el estudio del Homo sapiens, sino que también han servido
para estudios evolutivos (filogenia) y del genoma de otras especies que no están tan caracterizadas.
Biología de Sistemas: Utilización de los distintos niveles de estudio del DNA y el RNA para entender de manera global
el funcionamiento molecular de los sistemas biológicos (Genoma + transcriptoma + proteoma + metaboloma +
interactoma)
Ej: Proyecto Microbioma Humano. El objetivo del HMP es describir las comunidades microbianas encontradas
en diferentes partes del cuerpo humano y estudiar las correlaciones entre los cambios en el microbioma y la
salud de las personas
Necesidad de recopilar los datos en sistemas bioinformáticos para establecer las relaciones e interacciones
entre todas las ramas de la Biología de Sistemas
MÉTODOS DE SECUENCIACIÓN
• De 2º generación
a. Secuenciación enzimática (de Sanger / Dedeoxi)
b. Secuenciación enzimática (Pirosecuenciación)
• De NGS (Next Generation Sequency) → Son muy caras, por lo que las de 2º generación son las que más se usan.
a. Secuenciación de 2.5ª generación: Ion Torrent, Ion Proton, SMRT…
b. Secuenciación de 3ª generación: Oxford Nanopore Technologies, GridION, MinION… (Next NGS =
NNGS)
c. Secuenciación de 4ª generación: GEM sequencing…
A. SECUENCACIÓN DE 1º GENERACIÓN. Secuenciación Automática por el método de Sanger
Técnica mediante la cual se puede determinar es el orden preciso de nucleótidos de una cadena de DNA
Fue desarrollado por Sanger y sus colegas de la Universidad de Cambridge en 1977. Hasta que se automatizó solo se
podían analizar unas 300 nucleótidos de la secuencia a la vez. A partir de los 80 se automatizó y se consiguió que fuera
posible en análisis de un genoma completo (ABIIPrism / AB, primer secuenciador automático)
Gracias a esto, al descubrimiento de que se podían hacer genotecas y al diseño de nuevas técnicas moleculares se pudo
desarrollar el Proyecto Genoma Humano. Se consiguió secuenciar el genoma humano por la combinación de dos
métodos, uno de consorcio público (método clon a clon de HGP) y otro de consorcio privado (método de la perdigonada,
Celera)
• Método clon a clon: basado en los mapas físicos y genéticos para alinear los fragmentos secuenciados
• Método de la perdigonada: basado en la secuenciación de fragmentos escogidos al azar. Utiliza secuencias
superpuestas para alinear los fragmentos
Principales características
Componentes comunes:
Componentes diferentes
PASOS DE LA METODOLOGÍA:
1. Marcaje Primer: incubación del fragmento de DNA de interés con un primer 3’ marcado (primero con isótopos
radiactivos 32P O 35S, más tarde con fluoróforos).
El primer provee el grupo 3’-OH inicial necesario para que la DNA polimerasa catalice la primera unión mediante enlace
fosfodiéster entre el último nucleótido del primer (3’) y el primer nucleótido colocado ahí por la DNA polimerasa
(complementario al nucleótido en la misma posición en la cadena molde)
2. Preparación de 4 reacciones, cada una con adición de 4 tipos de dNTPs y de 1 dideoxidi NTP + DNA polimerasa
a. Primera reacción con ddATP
b. Segunda reacción ddTTP
c. Tercera reacción ddCTP
d. Cuarta reacción con ddGTP
5. Análisis con electroforesis en gel de acrilamida (NO de agarosa, la acrilamida nos permite tener mucha
resolución, es decir, distinguir entre cadenas de tamaño muy parecido, aunque solo se diferencien en una base,
que salen en cada reacción (productos de cada reacción en un carril) → Análisis como en el caso de la
SECUENCIACIÓN QUÍMICA
6. Repetir el proceso en la cadena 3’ → 5’ para comprobar que la secuenciación es correcta y son dan los mismos
resultados que en la cadena 5’ → 3’
OJO: MUY IMPORTANTE que haya un balance adecuado entre los ddATPs y dNTPs para que:
• polimerasa pueda sintetizar la secuencia completa del DNA de interés que queremos secuenciar (no adición de
ddNTPs todo el rato
• que también haya casos en los que se la polimerasa utilice ddNTPs y se pare la síntesis de la secuencia.
• A partir de 900 pares de bases la polimerasa para de sintetizar.
PROYECTO GENOMA HUMANO
• Consorcio público: NIH (dirigido por Francis Collins) → Utilizó al principio una secuenciación basada en el mapa,
jerarquizada. implica la construcción previa de mapas genéticos y mapas físicos; primero ordenar, después
secuenciar.
• Consorcio privado: Celera (dirigido por Craig Venter)→ Utilizó al principio una secuenciación basada shotgun
(fragmentos escogidos al azar), NO jerarquizada. Basada en primero secuenciar, después ordenar.
1. Tomaron el genoma del ser humano y lo digirieron generando grandes fragmentos de DNA con los cuales
crearon grandes bibliotecas genómicas basadas en BACS (clones de cada gran fragmento)
2. Hicieron mapas físicos (orden de clones) utilizando para ello técnicas de RFPs, FISH, FC…
3. Una vez ordenados, ensamblaban genes contiguos, generando un Coting (ensamblaje solapando los distintos
fragmentos clonados)
4. Digestión de cada uno de los grandes fragmentos y secuenciación de los pequeños resultantes. Clonación de
los pequeños fragmentos y secuenciación de estos
Manejo de la información mediante el NCBI (National Center of Biotechnology Information), un programa público
bioinformático que contiene una base de datos con TODA la información obtenida de los resultados de PROYECTO
GENOMA HUMANO.
B. Secuenciación de 2º / 3º / 4º generación
Introducción
TÉCNICAS:
DEMÁS GENERACIONES:
TERCERA GENERACIÓN:
. Se pueden secuenciar moléculas únicas (pocos fragmentos), lo que permite lectura más largas que facilitan el
posterior ensamblado
CUARTA GENERACIÓN: Secuenciación in situ, célula única / aislada (muy cara, no se hace en todos lados)
FLUJO DE TRABAJO:
1. Fase de laboratorio:
- 2º generación:
2. Fase bioinformática:
2.1 Pre-procesado de lecturas: análisis de las secuencias obtenidas, eliminando las secuencias de los
adaptadores, de las secuencias defectuosas (corrección de errores) y de las lecturas redundantes,
2.2 Mapeo a genoma de referencia y ensamblaje de novo de las secuencias
2.3 Análisis de los resultados: Estudio funcional de las secuencias y sus variantes
2.4 Interpretación de los resultados.
A. ILLUMINA
Características
a. La amplificación de los fragmentos de ADN para la generación del clúster (colonias del mismo fragmento)
se realiza mediante el método de PCR en puente.
b. La detección de bases en la secuenciación se hace a través de etiquetas fluorescentes.
Este proceso se logra mediante el método de amplificación en puente (ver esquema dcha).
• Los fragmentos de ADN se colocan sobre una superficie sólida de vidrio separada por carriles.
• Cada carril está completamente recubierto por oligonucleótidos complementarios a los adaptadores de cada
fragmento que se va a secuenciar, por lo que permiten que cada fragmento se pueda anclar a la celda de flujo.
Una vez anclados los segmentos, la polimerasa inicia el proceso de copia en la hebra de ADN y genera una hebra reversa
complementaria.
Este proceso se repite masivamente hasta formar millones de copias de cada fragmento
Secuenciación
Al finalizar la amplificación clonal, se retiran todas las hebras reversas y quedan únicamente las hebras idénticas a las
originales. En este punto:
• En la placa se introducen nucleótidos modificados con etiquetas fluorescentes específicas para cada tipo. Los
nucleótidos utilizados presentan una modificación química (terminadores reversibles) que evita la unión de más
de un nucleótido marcado en cada sitio de reacción, de tal manera que se puede ubicar el que corresponde a
cada punto en la secuencia y se disminuye el riesgo de errores en la secuenciación.
• Cada vez que una base se adhiere emite una fluorescencia propia que permite su identificación. La etiqueta
debe ser removida antes de la colocación del siguiente nucleótido para evitar que dos bases emitan señal a la
vez.
• Al finalizar la primera lectura, el fragmento resultante es retirado. Este paso se repite simultáneamente con
todas las hebras del mismo clúster de forma paralela hasta completar la secuenciación
B. SECUENCIADOR ION TORRENT DE THERMO FISHER
Características
La secuenciación en Ion Torrent se lleva a cabo en un chip semiconductor, y se diferencia de Illumina en los siguientes
aspectos:
Cada fragmento de ADN se deposita en micromicelas ubicadas en una emulsión de aceite en agua, donde, además, se
deposita una microesfera que está recubierta de adaptadores complementarios a los adaptadores del fragmento, y una
polimerasa que iniciará la PCR
• Para ser copiada la hebra original se hibrida con los adaptadores ubicados en la microesfera.
• Después de la amplificación, se retiran todas las hebras complementarias y se dejan solo las hebras con los
adaptadores ligados a la microesfera, y finalmente quedan miles de copias de un mismo fragmento de ADN
Este paso se repite en millones de esferas que posteriormente se colocan cada una por separado en micropocillos que
contienen todos los componentes necesarios para iniciar la secuenciación
Cuando un nucleótido es ligado a la hebra que se va a secuenciar, se forma un enlace covalente y se libera un ion de
hidrógeno cargado positivamente. Cada vez que se libera un ion de hidrógeno, se da un cambio en el pH de la
solución del pocillo y se genera una corriente eléctrica.
• Este método se basa en la detección del cambio de voltaje por medio un sensor llamado ISFET (Ion-Sensitive
Field-Effect Transistor), que indica que el nucleótido se ha incorporado correctamente
• Para la identificación del tipo de nucleótido agregado, inicialmente se inserta solo un tipo de base en el pocillo
y el sensor ISFET detectará o no el voltaje dependiendo de la complementariedad de la base. Si esta no es
complementaria, se agrega otro nucleótido hasta que se detecte voltaje.
En esta técnica, los nucleótidos no están modificados con terminadores reversibles, por lo que en caso de que haya
homopolímeros (dos o más nucleótidos iguales que se repiten), el pH disminuirá en mayor proporción y la diferencia
de voltaje aumentará proporcionalmente al número de bases añadidas.
Este proceso ocurre de forma paralela en todos los pocillos del chip y alcanza una longitud de lectura de hasta 400
pares de bases
SECUENCIACIÓN DE TERCERA GENERACIÓN
Las técnicas de Segunda Generación (NGS), todavía, son plataformas relativamente caras y que precisan de unas
necesidades específicas. Por ello, la idea de buscar un alternativa más sencilla, rápida y eficaz, y al menor coste
posible. Con este fin, nace lo que se conoce como SECUENCIACIÓN DE TERCERA GENERACIÓN.
• Eliminar la etapa de PCR, y tratar de realizar la propia secuenciación a partir de UNA ÚNICA molécula de ADN.
• Trata de abaratar los costes
• Conseguir ofrecer LECTURAS MÁS LARGAS que faciliten el posterior ensamblado
• Ampliar el abanico de aplicaciones, como la detección de grandes variaciones en la estructura de los
cromosomas o caracterización de haplotipos, entre otras.
APLICACIONES
PROYECTOS
- Proyectos METAGENÓMICA: Obtener secuencia de genomas de diferentes microorganismos, bacterias en este caso,
que componen una comunidad, extrayendo y analizando su ADN de forma global
Se estima que en la Tierra hay entre 10 y 15 millones de especies eucariotas de plantas, animales y hongos,
pero la mayoría son un misterio. Solo 2,3 millones de especies son realmente conocidas.
Se han invertido 3.800 millones de euros en 10 años para secuenciar 1,5·106 genomas
El objetivo principal es comprender la evolución y organización de la vida mediante la secuenciación de los genomas
de los eucariotas.
- Base de datos Gisaid: plataforma creada para compartir datos genómicos de virus como el de la gripe o el de la
COVID-19 (detección de variantes y lugares de procedencia)
2.5 GENÓMICA FUNCIONAL:
Caracterización molecular de genomas completos. Parte de la Genética que se ocupa del estudio y la caracterizacióndel
genoma en su conjunto, así como de su expresión
Los datos de la secuenciación a gran escala son el punto de partida de la genómica funcional:
TÉCNICAS MASIVAS DE ESTUDIO DE PROTEOMA Y TRANCRIPTOMA: LA GENÓMICA FUNCIONAL Aborda los aspectos
del significado biológica del genoma: la expresión génica a nivel de TRANSCRIPTOMA, INTERACTOMA Y PROTEOMA
Transcritoma:
• Northen-Blot
• Q-PCR
Proteoma
• CITE-SEQ
A. TRANSCRIPTOMA
Conjunto de moléculas de ARNm que hay en una célula concreta en un momento concreto (NO ES UNIVERSAL NI
CONSTANTE, a diferencia del GENOMA). Esto es lo que permite que haya diferencias entre tejidos y entre individuos.
Constituye < 4% del ARN total en la célula. El ARNm un conjunto de moléculas MUY relevante desde el punto de vista
funcional, pero no desde el punto de vista cuantitativo, muchos otros tipos de RNA son más abundantes.
• -Técnicas tradicionales para medir la expresión génica (permite el análisis de pocos genes), como:
o Northern-Blot
o Real Time-PCR.
• Nuevas técnicas. Desarrollo tecnológico (medir muchos genes):
o Expressed Sequenced Tags (ESTs).
o Serial analysis gene expression (SAGE).
o Suppression substractive hybridization (SSH).
o Microarrays
o RNA-Seq
- Microarreys
El estudio del TRANSCRIPTOMA se hace mediante una serie de tecnologías: matrices = biochips = arreys, etc (todos
sinónimos). Estudio del cDNA que nos van a permitir hacer estudios exhaustivos de todo el perfil transcripcional de
una muestra biológica
Los microarrays de DNA permiten la medida simultánea de los niveles de expresión de miles de genes (sondas) en un
solo experimento de hibridación con una mezcla compleja de DNA o RNA (dianas). Constan de miles de conjuntos
ordenados de moléculas de DNA de secuencia conocida depositados en un soporte sólido (~ 2 cm2) como cristal, nylon
o silicio.
• Sondas: secuencias de DNA conocidas (oligonucleótidos o productos de PCR) inmovilizadas ordenadamente sobre
una superficie sólida.
• Dianas: muestra problema de DNA o RNA marcada cuya abundancia será determinada por hibridación.
En un chip puede haber miles de muestras (cDNA de genes conocidos) : Los chips se exponen a muestras de mRNA
marcados procedentes de distintos tejidos (distinta fase de desarrollo, tumoral vs normal, etc.)
- Se hibridan las sondas y dianas en chips con muestras de cDNA que representan el transcriptoma de células
diferentes
- Se comparan midiendo la intensidad de la fluorescencia, que indican las variaciones en la expresión de los
tejidos
• Su densidad: diferencia en el nº de elementos / cm2 (nº de moléculas de mRNA que puedo estudiar / cm2)
o Macroarreys / macro-matrices = < 1000 elementos / cm2 (menos detalle)
o Microarreys / micro-matrices = > 1000 elementos / cm2 (más detalle)
• 6’5 M de localizaciones (de dimensiones 1’28 x 1’28 cm en este caso) distintas en cada microarrey
• En cada localización hay muchas copias de un ÚNICO tipo de sonda / elemento: muchas copias de una pequeña
secuencia representativa del cDNA de un gen.
Lo que se pretende con el uso de estos arreys es obtener una muestra representativa del transcriptoma de una muestra
biológica. No es creada por biólogos, sino por técnicos ingenieros, informáticos, etc
Una vez tenemos el microarrey del tipo celular de nuestra muestra biológica, añadimos sobre ella los fragmentos de
mRNA, extraídos de la muestra biológica que queremos estudiar (hibridación), marcados con un fluoróforo.
Los mensajeros se podrán unir por complementariedad a los cDNA del arrey, si es que están presentes (señal
fluorescente en las localizaciones cuyo cDNA ha hibridado con el mRNA marcado).
Si alguno de los genes no se está expresando no habrá mRNA para este gen y por tanto dicho mRNA no se une
a su secuencia de cDNA correspondiente (no señal fluorescente en la localización de dicho cDNA)
Ronda 1:
Ronda 2:
Tienen muchas aplicaciones, pero básicamente se van a utilizar para crear perfiles de expresión génica.
Interpretación de las señales fluorescentes del microarrey hibridado mRNA de muestra biológica, mediante un
software que traduce dicha información en una descripción de qué genes se están expresando.
2. COMPARACIÓN DE PERFILES
SE PUEDEN UTILIZAR DOS MUESTRAS BIOLÓGICAS DE PARTIDA (UNA CONTROL Y OTRA DE ESTUDIO). Se marca una
de las muestras con un fluoróforos y la otra con otro fluoróforo. Se hibridan las dos a la vez con el arrey y se compara
el patrón de expresión génica de cada una de las muestras (tanto a nivel de qué genes se expresan como a nivel de
cuánto se expresan)
1. Se utilizan dos fluoróforos distintos para marcar los dos tipos de muestras (una control y otra de una célula
cancerosa)
2. Análisis de la hibridación simultánea de los mRNA de ambas muestras biológicas con el microarrey
a. Señal amarilla: Se unen mRNAs de ambas muestras
b. Señal roja: Se unen mRNAs de célula cancerosas (mujeres CON recaída)
c. Señal verde: se unen mRNAs de célula control (mujeres SIN recaída)
a. Patrón de expresión de la mitad de arriba del microarrey contrario al de la mitad de abajo (clustering)
b. Muestra de arriba: muestras de mujeres que habían tenido cáncer de mama y no habían recaído tras
5 años de finalizar el tratamiento
c. Muestra de abajo: muestra de mujeres que habían tenido cáncer de mama y SÍ habían recaído tras 5
años de finalizar el tratamiento
4. APLICACIÓN: Estudio del parón de expresión de células de las mamas de una mujer que ha sufrido cáncer de
mama para ver si tiene más o menos posibilidades de recaer, en función de si el patrón de expresión génica se
parece más a al grupo de células de mujeres SIN recaída o al de mujeres CON recaída
- RNA-seq
El RNA-seq es un tipo especial de secuenciación cuyo objetivo es ver los patrones de expresión de los genes. En vez de
leerse y secuenciarse todo el genoma u exoma, se centra en secuenciar el contenido celular total de RNA, incluidos
mRNA, rRNA y tRNA (diferentes tipos de RNA seq: mRNA seq, targeted RNA seq, Total RNA Seq…)
Estas técnicas basadas en secuenciación masiva eliminan el ruido introducido por la correcta hibridación de sondas
dependiente del diseño empleado, ofrecen un mayor rango dinámico de detección al evitar la saturación por señales
de fluorescencia y permiten obtener un panorama más global de los genes activados y/o reprimidos sin restringirse a
genes previamente caracterizados
PASOS RNA-Seq:
Una vez hecho esto, los pasos son los mismos que en el resto de NGSs: amplificación, preparación de la biblioteca de
cDNA, ordenado, análisis.
Hay muchos usos para scRNA-seq, que ofrece la información sobre las células y enfermedades. La ejecución scRNA-seq
en las células de un tumor puede habilitar la separación de fibroblastos del y de las células cancerosas, basándose
solamente en sus firmas de la expresión génica.
El reto principal con estudios unicelulares es la pequeña cantidad de material con la cual está disponible para trabajar.
Cada célula contiene solamente ~0,1 picogramos de mRNA. Ésta es la razón que cada tecnología scRNA-seq requiere un
paso de la amplificación proveer de más material al trabajo.
DROP-SEQ (Illumina)
Analiza transcritos de células individuales de manera paralela. Esta técnica utiliza un dispositivo de microfluido para
compartimentalizar gotas que contienen una sola célula, buffer de lisis y una amplia gama de beads (con primers) que
se unirán a las secuencias de mRNA de la célula.
Una vez las células han sido compartimentalizadas, el buufer de lisis rompe la célula y el mRNA liberado hibrida con las
30 pb de oligo(dT) de los primer (cada mRNA se une a un bead). A continuación, las gotas son rotas para que liberen
beads asociados a mRNA que contenían. Estos beads son aislados y tratadas con una RTasa, con lo que se generará una
biblioteca de cDNA (gracias a las secuencias universales primer asociados a las cadenas de mRNA → amplificación por
PCR). Por último, se añaden adaptadores moleculares para la secuenciación utilizando el Nextera XT Library Preparation
Kit.
PROTEOMA
La PROTEÓMICA es el estudio del PROTEOMA, el conjunto de las proteínas que están presentes en una determinada
muestra biológica en un determinado momento (depende de tejido, órgano y momento). Niveles de expresión varían
con el desarrollo, entre tipos celulares, en los distintos compartimentos subcelulares…
Es una extensión de la genómica, y su objetivo es el estudio de las proteínas presentes en una célula en un momento
dado y bajo unas condiciones determinadas.
• Identificación de todas las proteínas expresadas (40-60% de los genes humanos producen mas de una
proteína por procesamiento alternativo)
• La naturaleza y alcance de las modificaciones postraduccionales (más de 100 mecanismos de modificación
postraduccional)
• Las interacciones proteína- proteína
• La localización de las proteínas en diversos compartimentos celulares
Aplicaciones:
• Identificación de proteínas.
• Secuenciación de péptidos.
• Secuenciación masiva de proteínas.
ELECTROFORESIS BIDIMENSIONAL
Resultado: patrón 2D de la matriz de electroforesis para una muestra biológica concreta (se pueden comparar entre
células de tejidos diferentes para ver patrones comunes y diferentes de proteínas)
ESPECTROMETRÍA DE MASAS
PROYECTOS RELACIONADOS:
• “The Human Protein Atlas”: Programa sueco iniciado en 2003 con el objetivo de mapear todas las proteínas
humanas en células, tejidos y órganos mediante la integración de varias tecnologías ómicas: proteómica,
transcriptómica, etc
o Atlas tisular : distribución de proteínas en todos los tejidos y órganos principales
o Atlas celular: localización subcelular de proteínas en células individuales
o Atlas patológico: muestra el impacto de los niveles de proteínas para la supervivencia de pacientes
con cáncer
• Proyecto ENCODE: (ENCcyclopedia Of DNA Elements): se trata de un proyecto de análisis exhaustivo del
genoma humano, que muestra:
o todos los transcritos primarios y maduros
o la localización de las principales modificaciones de histonas
o los sitios de unión de factores de transcripción
o sitios de inicio de la transcripción, sitios hipersensibles a DNAsa,
GEN: “la unión de las secuencias genómicas que codifican un conjunto coherente de productos funcionales,
potencialmente solapantes”.
• Proyecto Genotype-Tissue Expression (GTEx): Cómo influye la variación del genoma en la expresión de los
genes en los distintos tejidos y células del cuerpo humano. Estudiar la expresión y regulación génica específica
de tejido.
o La versión actual es V7, que incluye 11.688 muestras RNAseq, 53 tejidos y 714 donantes
o La última versión del incluye 17 382 muestras de 54 tejidos diferentes, obtenidas de 948 personas
donantes
Se encontraron diferencias relacionadas con ser hombre o mujer en más de 750 genes, la mayoría en el tejido
mamario. Y hasta 2.000 genes (un 10% del total) modificaban sus niveles de actividad con la edad.
La información generada en el proyecto GTEx proporciona un mapa exhaustivo de cómo influye la variación
genética en la regulación y expresión génica en los diferentes tejidos y células del cuerpo humano y cuál es su
contribución a la salud humana. Combinando sus resultados con datos epigenéticos obtenidos en otros grandes
proyectos, los investigadores están más cerca de descifrar cómo actúa el genoma de cada persona en sus células
y tejidos y cómo opera para influir en su desarrollo, características y estado de salud. El proyecto GTEx finaliza,
pero sus los datos obtenidos serán utilizados en múltiples estudios futuros.