2.2 Técnicas de Diagnóstico Genómico 2019

TÉCNICAS DE DIAGNÓSTICO
GENÓMICO
MÓDULO 2: TÉCNICAS DE DIAGNÓSTICO GENÉTICO Y GENÓMICO
TÍTULO DE EXPERTO UNIVERSITARIO EN MEDICINA GENÉTICA Y GENÓMICA 2019

Material didáctico: Módulo 2 – Clase 2
Material didáctico creado por Mar Benito, MSc https://www.linkedin.com/in/marbenito/

TÉCNICAS DE DIAGNÓSTICO GENÓMICO
MÓDULO 2: TÉCNICAS DE DIAGNÓSTICO GENÉTICO Y GENÓMICO

2.2.- TÉCNICAS DE DIAGNÓSTICO GENÓMICO
Dra. María García Hoyos
1.-INTRODUCCIÓN AL DIAGNÓSTICO GENÉTICO.......................................................................... 1

2.- DETECCIÓN DE REORDENAMIENTOS CROMOSÓMICOS. CGH ARRAY...................................... 2
3.- INDICACIONES DEL CGH ARRAY.................................................................................................3
4.-DIAGNÓSTICO PRENATAL MEDIANTE CGH ARRAY.....................................................................4
5.-DETECCIÓN DE MUTACIONES PUNTUALES. SANGER VS SECUENCIACIÓN MASIVA...................5
6.- NEXT GENERATION SEQUENCING (NGS).................................................................................. 6

6.1.- Preparación y amplificación de librerías........................................................................... 6
6.2.- Amplificación del cluster...................................................................................................6
6.3.- Aparatos de Thermo Fisher...............................................................................................7
6.4.- Aparatos de Illumina......................................................................................................... 8
6.5.- Análisis e interpretación de los resultados........................................................................8
6.6.- Análisis terciario.................................................................................................................9
6.7.- Estrategias derivadas del NGS..........................................................................................10
Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 0

1.-INTRODUCCIÓN AL DIAGNÓSTICO GENÉTICO
El término diagnóstico genético hace referencia a todas aquellas acciones que se llevan a
cabo para detectar o determinar las causas genéticas de una enfermedad.
El diagnóstico genético es un diagnóstico muy complejo y esto es debido a:
 La gran complejidad intrínseca que presenta nuestro propio genoma humano:

o 2,85 billones de bases (genoma humano haploide).
o Entre 22.000 genes (muchos de ellos todavía con función desconocida).
o El 98% del genoma no es codificante, no da lugar a proteínas. En principio
se le denominó ADN basura aunque hoy en día se sabe que tiene funciones.
o Hay un 99% de identidad entre dos individuos. El 1% de nuestro genoma
es lo que hace que haya diferencias entre nosotros.
o Se calcula que hay unos 10 millones de SNPs (cambios de nucleótidos no
asociados a ninguna patología) por genoma.
 Hay más de 6000 enfermedades de las que se conoce el origen genético. Este
número aumenta cada día casi exponencialmente. Todas estas enfermedades están
recogidas en la base de datos OMIM.
 Estas enfermedades están causadas por distintos mecanismos, y se debe por tanto
utilizar distintos abordajes, distintas técnicas para su diagnóstico.
Contamos con unas series de bases de datos que nos permiten ver a qué región genómica o
a qué gen está asociada cada una de las enfermedades, y qué daño está asociado con esa
región de ADN.
Esta complejidad nos lleva a que el diagnóstico genético sea un proceso que debe
comenzar y terminar con una consulta de consejo genético. En esta consulta el facultativo
recoge toda la información tanto clínica como familiar del paciente, para intentar
determinar el patrón hereditario de la enfermedad, y si esa enfermedad es conocida. A
partir de aquí se decide cómo hay que abordar el análisis genético. Por tanto a la hora de
plantearnos un estudio genómico tenemos que responde a estas 3 preguntas:
1. ¿Qué busco? Qué enfermedad tenemos delante y cuál es el patrón de

herencia en esta familia
2. ¿Dónde lo busco? En qué región del genoma tengo que ir a buscar la
mutación causante de la enfermedad.
3. ¿Cómo la busco? Qué técnica tengo que emplear, de todas las que conozco,
para ser capaz de diagnosticar genéticamente esa enfermedad.
Un genetista es aquel qué sabe aplicar correctamente cada una de las técnicas cuando
corresponde. No hay ninguna técnica universal que pueda aplicarse para todo. La técnica a
utilizar variará en función del tipo de mutación que se asocia a la enfermedad (mutaciones
puntuales, reordenamientos cromosómicos, mutaciones dinámicas, mutaciones del
imprinting).
Cuando hablamos de análisis genómico nos referimos a que en vez de buscar la causa de
una enfermedad en un gen o en una región concreta, la vamos a buscar en todo el genoma
a la vez. Para ello existen dos técnicas que ya están implantadas en el diagnóstico clínico.
Cuando se quieren buscar reordenamientos cromosómicos (deleciones/duplicaciones)

utilizaremos el CGH array, mientras que para detectar mutaciones puntuales se utiliza la
secuenciación masiva (NGS).
DIAPOSITIVAS 2-9
2. DETECCIÓN DE REORDENAMIENTOS CROMOSÓMICOS. CGH ARRAY
Para la detección de reordenamientos cromosómicos, tenemos varias técnicas a nuestro

alcance. Si estamos mirando regiones concretas podemos utilizar las técnicas de FISH
(citogenética) o MLPA (molecular), mientras que si queremos buscar en todo el genoma
podemos utilizar el cariotipo (citogenético) o el CGH array (molecular).
La ventaja del CGH array frente al cariotipo convencional es la mayor capacidad de

resolución, que permite detectar deleciones y duplicaciones más pequeñas. Con el
cariotipo se pueden ver deleciones y duplicaciones de 10-5 Mb, mientras que con el CGH
array se detectan duplicaciones y deleciones de 200-50 Kb.
El CGH array consiste en hibridar de forma competitiva sobre una plataforma, el ADN del
paciente y un ADN de referencia comercial, del mismo sexo del paciente, y que sabemos
exactamente que polimorfismos tiene. Cada tipo de ADN se marca con un fluorocromo
diferente y se hibridan de forma competitiva sobre una plataforma de array. Si
consideramos que nuestro genoma es como una gran enciclopedia, en esas plataformas de
array estarían impresas diferentes páginas de esa enciclopedia. Los arrays de diagnóstico
genético tienen más páginas de regiones asociadas a síndromes ya conocidos o de regiones
donde se localizan genes importantes (target regions). Hay que establecer un equilibrio
entre la cobertura de las target regions y de las otras regiones. Si encontramos
duplicaciones o deleciones en estas otras regiones no sabríamos cuál es su significado
(hallazgos de significado clínico incierto). Las distintas plataformas de array se diferencian
en las “páginas” que tienen impresas.
Al hibridar el ADN del paciente y el de referencia en una array, la diferencia de la señal

percibida en cada punto del array nos indica si el paciente tiene una duplicación o una
deleción. Por ejemplo, si el ADN del paciente está marcado con un fluorocromo verde y el
control con un fluorocromo rojo, y no hay deleción ni duplicación en un punto, veremos la
hibridación de los dos ADN con un color intermedio entre el rojo y el verde (amarillo). Si
hay una deleción, el ADN control va a hibridar más que el del paciente, por tanto se verá de
color rojo. Si lo que tiene el paciente es una duplicación, el ADN de este hibridará más que
el control, y el punto se verá de color verde (ver diapositiva 14). Estas diferencias no las
puede percibir el ojo humano, para ello hay unos scanners de array. Después, mediante
programas bioinformáticos que saben cada punto a qué región de nuestro genoma
corresponde, y mirando la intensidad, nos darán un idiograma en el que se puede ver si el
paciente tiene una deleción o una duplicación (ver diapositiva 15).

Una vez que sabemos las duplicaciones y deleciones que tiene nuestro paciente, las
tenemos que clasificar en patológicas, benignas o de significado clínico incierto, y
nombrarlas siguiendo las recomendaciones ISCN (International System for Human
Cytogenetic Nomenclature).
DIAPOSITIVAS 9-16
3. INDICACIONES DEL CGH ARRAY
Las principales indicaciones clínicas del CGH array son:
1) Retraso mental o discapacidad intelectual. Ya en el 2002 se describió que de los

pacientes con retraso mental, un 4,7% tenían alteraciones citogenéticas, un 5-7,5% tenían
reordenamientos subteloméricos y un 10% presentaban reordenamientos
submicroscópicos, y todas estas alteraciones se pueden detectar mediante CGH array. Por
tanto, esta es la primera técnica que se tiene que llevar a cabo en un paciente con retraso
mental.
2) Autismo. Hay muchísimas publicaciones que avalan el uso del CGH array en los
trastornos del espectro autista (ver diapositiva 18). Se considera que el 1-3% de los
pacientes con autismo tienen deleciones o duplicaciones detectables con el CGH array. Se
han descrito más de 150 regiones en el genoma asociadas con el autismo o trastornos del
espectro autista. Hay una web http://projects.tcag.ca/autism/ donde se recogen todas las
variaciones en el número de copias asociadas a este trastorno (diapositiva 19).
DIAPOSITIVAS 17-19
3) Síndromes de genes contiguos. Estos síndromes son debidos a alteraciones en más de

un gen. En la diapositiva 20 se muestran todos los síndromes de genes contiguos descritos
antes de la aparición del CGH array, los que están en rojo corresponden a deleciones y los
que están en azul a duplicaciones. Mediante el CGH array se han detectado nuevos
síndromes de microduplicación y microdeleción, que no se podían ver mediante un
cariotipo convencional (diapositiva 21).
4) Cariotipos alterados. Si por ejemplo, en un cariotipo encontramos la presencia de un

cromosoma marcador, tenemos que saber cuál es su origen. La mayoría de cromosomas
marcadores provienen del cromosoma 15 y casi siempre son polimorfismos benignos. Si
descartamos mediante un FISH que se trate del cromosoma 15, tenemos que ver de que
cromosoma procede el marcador. Esto se puede hacer mediante CGH array. En la

diapositiva 22 se muestra un ejemplo en el que el cromosoma marcador era una

duplicación del brazo largo del cromosoma 22, asociada con el síndrome de Cat-Eye.
También se puede utilizar el CGH array cuando encontramos alteraciones estructurales de

los cromosomas. En la diapositiva 23 se muestra un ejemplo en el que mediante el
cariotipo se veía una deleción del brazo corto del cromosoma 18, y se quería saber cuál era
el tamaño de esa deleción. Mediante el CGH array se vio que el paciente tenía una deleción
de todo el brazo corto del cromosoma 18 y que además presentaba una duplicación en la
región terminal del brazo largo del cromosma 16. En realidad lo que se había dado era una
translocación entre el cromosoma 16 y el 18. Esto tiene consecuencias clínicas totalmente
diferentes de que sea solo portador de una deleción. Se detectó que uno de los
progenitores de este niño presentaba una translocación equilibrada entre los cromosomas
18 y 16, por tanto tiene un riesgo bastante alto de pasárselo a otro hijo.
DIAPOSITIVAS 20-23
4. DIAGNÓSTICO PRENATAL MEDIANTE CGH ARRAY
Desde 2012 hay numerosas publicaciones que avalan el uso del CGH array en embarazdas
cuando el screening bioquímico esté alterado, o se detecten anomalías ecográficas. En la
publicación de la diapositiva 24 se observó que:
 Un 6% de casos con anomalías ecográficas y cariotipo normal tenía alteración

submicroscópica patogénica detectable usando array-CGH.
 Un 1.7% de casos con edad materna incrementada o screening positivo y cariotipo
normal, tenía alteración submicroscópica patogénica usando array-CGH.
 El array-CGH corroboró todas las alteraciones relacionadas con número de copia
(aneuploidías, estructurales) detectadas o intuidas previamente en cariotipo (se
recomienda realizar cariotipo para detectar triploidías).
 Se recomienda el uso del array-CGH en TODOS los casos con anomalías ecográficas
o screening alterado.
En las plataformas de GCH array prenatal se tiene que intentar reducir al máximo la
incertidumbre diagnóstica, y evitar resultados de significado clínico incierto. Por ello, solo
tienen impresas regiones que sabemos que están relacionadas con patologías.
En la diapositiva 26 se muestra una publicación del Colegio Americano de Ginecología y

Obstetricia del 2013 en la que se dice que el CGH array debería realizarse antes del
cariotipo en los casos de fetos con anomalías ecográficas.
DIAPOSITIVAS 24-26

5.- DETECCIÓN DE MUTACIONES PUNTUALES. SANGER VS SECUENCIACIÓN MASIVA
Las mutaciones puntuales son las más frecuentes asociadas a enfermedades de origen
genético. Se estima que un 80% de las enfermedades genéticas están asociadas a este tipo
de mutaciones en las regiones codificantes de los genes.
Hasta hace pocos años la única técnica que existía para detectar mutaciones puntuales era
la Secuenciación Sanger. Es considerada la técnica Gold Estándar puesto que tiene una
sensibilidad y especificidad cercana al 99% para detectar éste tipo de mutaciones (cambio
de un nucleótido por otro o pequeñas deleciones e inserciones). Sin embargo esta técnica
presenta limitaciones cuando la región a secuenciar es grande, ya que resulta
extremadamente cara. También ocurre esto cuando lo que se tiene que abordar es una
enfermedad muy heterogénea genéticamente (enfermedad asociada a mutaciones en
muchos genes distintos).
En los últimos años el desarrollo tecnológico ha derivado en la técnica alternativa

denominada Secuenciación Masiva o Next Generation Sequencing (NGS), que permite
secuenciar en paralelo millones de secuencias de entre 35 y 250 pb, dependiendo del tipo
de secuenciador. En la técnica tradicional Sanger sólo se pueden secuenciar de 1 a 96
secuencias en paralelo, de 650-800 pb. Hoy en día existen multitud de aparatos nuevos de
secuenciación masiva y todos ellos suponen un coste mucho inferior al coste por
secuenciación Sanger. Se puede decir que ésta es una de las mayores diferencias y más
relevantes que encontramos entre Sanger y la Secuenciación Masiva. El coste de secuenciar
1Mb en Sanger es de aproximadamente 1500$, mientras que en NGS es de 0,74$.
Una premisa importante a la hora de aplicar las técnicas de diagnóstico genómico es tener
en cuenta que para que la nueva técnica de NGS reemplace a la técnica Sanger, debe poseer
al menos la misma especificidad y sensibilidad que ésta. Para secuencias cortas de ADN
todavía es más barato utilizar la secuenciación Sanger que la NGS. La NGS está indicada
para secuenciar todo el genoma o grandes cantidades de este.
A pesar de las citadas diferencias, si comparamos el flujo de trabajo entre la secuenciación

Sanger y NGS, podemos establecer un paralelismo:
En la secuenciación Sanger el paso más importante es el de la amplificación de ADN

mediante PCR, que en el caso de la Secuenciación Masiva se conoce como “Preparación y
amplificación de la librería”. Mediante este paso no sólo se selecciona una región del
genoma que queremos secuenciar, sino que se seleccionan las regiones del genoma que se
quieren secuenciar todas juntas.
Existen distintos métodos para crear estas librerías. Dependiendo del método las regiones
de interés tendrán distinta cobertura. Cada método tiene una sensibilidad, una
especificidad y una reproducibilidad diferentes.
DIAPOSITIVAS 28-35

6.- NEXT GENERATION SEQUENCING (NGS)
6.1 Preparación y amplificación de librerías
Se trata de la selección de las regiones del genoma que queremos secuenciar a la vez.
Existen distintos métodos para la creación de librerías que nos dan distinta cobertura,
sensibilidad, especificidad y reproducibilidad.
Básicamente podemos distinguir dos formas de preparación de las librerías:
1.- Captura por hibridación: El ADN del paciente se digiere aleatoriamente con enzimas de
restricción y se capturan los fragmentos digeridos que nos interesan para secuenciar. La
captura se realiza mediante sondas complementarias a las regiones de interés, que pueden
encontrarse en una solución líquida marcadas con biotina, lo que permite la captura por
imantación, o estar sobre una superficie sólida en un porta.
2 . - Captura por PCR: haciendo múltiples PCRs a la vez se amplifican las regiones del
genoma que queremos secuenciar.
En ambos casos, los fragmentos que se obtienen terminan en dos extremos comunes para
todos los fragmentos. Esto permite la posterior amplificación de los mismos utilizando
unos cebadores comunes, en cualquier sistema/aparato de NGS.
Estos cebadores tienen además una característica importante: después de la zona

complementaria a los extremos 3’ y 5’, disponen de una zona denominada “INDEX” que es
como un código de barras para identificar de que paciente es cada muestra . También
disponen de otra región denominada “ADAPTADORES” que son importantes para el
proceso posterior a la amplificación y durante la secuenciación, y estos sí son específicos
del sistema de secuenciación masiva a utilizar.
DIAPOSITIVAS 36-39
6.2. Amplificación del cluster
Los pasos de amplificación del cluster y de secuenciación son distintos dependiendo del
sistema que es use. Los dos sistemas de secuenciación masiva más utilizados hoy en día
para hacer el diagnóstico genético y en los que basaremos este tema son:
a) Sistema Illumina: existen varios aparatos distintos dependiendo del número de

secuencias que pueden generar, desde 0.5 Gb hasta 1800 Gb. La amplificación de
los clusters se da mediante PCR en puente y la secuenciación por síntesis de
nucleótidos fluorescentes y terminadores reversibles.

b) Sistema Thermo Fisher: dos aparatos PGM y S5. El PGM es más pequeño y tienen
una capacidad de secuenciación de 30 Mb-2Gb, el S5 llega hasta 15 Gb. La
amplifiación de los clusters se da por PCR en emulsión y la secuenciación por
semiconducción.
DIAPOSITIVAS 40-43
6.3 Aparatos de Thermo Fisher
PCR en emulsión. En esta PCR, se mezclan en unas microgotas los siguientes elementos:
unas partículas microesféricas recubiertas de cebadores, la pareja de cebadores
específicos y los fragmentos generados previamente en la librería.
Dentro de las microgotas se dan dos procesos:
El fragmento de ADN de la librería se va a amplificar con los cebadores específicos, que

introducen una región complementaria a los cebadores de la microesfera. Por
complementariedad, nuestra librería hibrida con los cebadores de la microesfera y se da
una segunda amplificación clonal. Al final del proceso tendremos la microesfera con todos
los fragmentos amplificados unidos a ella.
Puede ocurrir que en una gota haya dos fragmentos distintos de nuestra librería, por lo
que tendremos un amplificado policlonal. También puede ocurrir que ningún fragmento se
haya incluido en la microgota (diapositiva 43). Por tanto hay que cuidar bien las
concentraciones para intentar que la amplificación sea lo más homogénea (monoclonal)
posible.
Secuenciación
Se parte de las microesferas rodeadas de los amplificados clonales, que se cargan en un

microchip formado por una superficie porosa, una microesfera en cada poro. En cada ciclo
se van añadiendo los 4 nucleótidos. Primero se añaden las timinas, que si se adhieren por
complementariedad se libera un protón. El aparato detecta este protón y lo convierte en
una diferencia de potencial. Luego se añaden secuencialmente los nucleótidos (G, C, A)
restantes, y se va detectando ese cambio de potencial debido a la cantidad de protones
liberados. Si por ejemplo, hay dos timinas seguidas, el aparato detecta una diferencia de
potencial mayor que cuando solo se incorpora una.
DIAPOSITIVAS 42-45

6.4 Aparatos de Illumina
PCR en puente
La librería se añade a un microarray en el que en su superficie hay cebadores

complementarios a los cebadores utilizados para amplificar la librería. Todos los
fragmentos de nuestra librería se pegarán por complementariedad a esos cebadores,
entonces se inicia la amplificación de los mismos hasta formar clones de un solo
fragmento. Ésta PCR en puente ya se realiza dentro del aparato de secuenciación masiva.
Secuenciación
Una vez se termina la amplificación, comienza la secuenciación que se hace con

nucleótidos marcados con diferentes fluorocromos (terminadores fluorescentes
reversibles). En cada ciclo se envían los cuatro nucleótidos, y se detecta la diferente
emisión de fluorescencia de estos fluorocromos. Cada nucléotido tiene una substancia en
el extremo 3' que hace que no se le pueda “pegar” otro nucleótido, y que se elimina con un
lavado al final de cada ciclo. De esta manera solo se incorpora un nucleótido en cada ciclo.
El secuenciador hace una foto cada vez para ver los nucleótidos que se han incorporado.
DIAPOSITIVAS 46-49
6.5 Análisis e interpretación de los resultados
Después del proceso de secuenciación, el análisis de los resultados vuelve a ser común
para todos los sistemas de NGS.
Se generan una gran cantidad de datos que hay que saber gestionar. Se sigue normalmente
este esquema:
1- Análisis primario: el aparto nos dice qué nucleótido se ha ido uniendo y cuál es la
calidad del mismo. Esto nos da la secuencia de nucleótidos en un archivo FASTQ.
2- Análisis secundario: se alinean cada una de las secuencias obtenidas contra el
genoma humano (actualmente la versión HG19) y se buscan las diferencias entre
ambos. En secuenciación masiva el archivo donde se alinean las secuencias contra
el genoma de referencia se llama BAM, y el archivo donde se listan cada una de las
diferencias encontradas entre nuestra secuencia y la secuencia de referencia se
llama VCF. Haciendo una comparativa con Sanger, podemos decir que el archivo
BAM es similar al electroferograma que se obtiene en Sanger.
3- Análisis terciario: consiste en determinar qué significado clínico tienen esas
diferencias/variaciones. La forma de realizar este análisis terciario va a diferenciar
entre investigación o diagnóstico.

En la observación de los resultados tenemos que tener en cuenta que:
- Archivos BAM obtenidos con dos formas diferentes de crear las librerías: captura
por PCR y captura por hibridación. En la diapositiva 55, NextGenDx es un sistema
de captura por PCR desarrollado en Imegen y HaloPlex, es un sistema de captura
por hibridación comercial. Debemos escoger aquellas librerías que nos dan picos
más homogéneos, los picos nos indican el número de secuencias que hay en cada
uno de los puntos.
- Las regiones de interés deben estar totalmente cubiertas. En la diapositiva 55, con
HaloPlex se queda una región importante del exón 10 del gen FGFR3 sin cubrir, en
esta región hay dos mutaciones asociadas con acondroplasia en el 99% de los
casos e hipoacondroplasia en el 90% de los casos.
- Debemos disponer de secuencias tanto el sentido Fw como en sentido Rv. En la
diapositiva 55 las secuencias Fw son las de color salmón y las Rv son las azules.
Vemos que con la captura HaloPlex, no todas las secuencias tienen Fw y Rv, y con
NextGenDx sí.
Por tanto es muy importante en NGS para dar un diagnóstico disponer de una COBERTURA
HORIZONTAL, en la que todas las regiones de nuestro interés están cubiertas y no existe
ningún GAP, o si lo hay tenerlo bien identificado e informar. También es importante la
COBERTURA VERTICAL o PROFUNDIDAD, en la que debemos saber cuántas secuencias
tenemos para cada una de nuestras regiones de interés. Dado que la sensibilidad de la
tecnología de NGS es menor que la de Sanger es necesario “leer” más veces la misma
región. En Sanger con las secuencias el Fw y el Rv es suficiente porque se comete un error
cada millón de bases. En NGS se estima que se comete un error cada 10000 pb, por lo que
para detectar heterocigotos, la profundidad mínima debe ser de entre 20x y 40x (en cada
punto debe haber entre 20 y 40 lecturas). Para detectar una mutación en mosaico, la
cobertura en cada punto tendría que ser alrededor de 1000X.
Muchas veces se da una cobertura media de todo el gen, pero hay que ir a mirar cuál es la
cobertura específica en cada zona de interés. Para diagnóstico debemos garantizar el
análisis de todas las regiones de interés. Si hay gaps (por diseño, secuenciación,
alineamiento, etc.) debemos informar de ello pre y post test, ya que de ello depende la
especificidad (valor predictivo negativo) del test.
DIAPOSITIVAS 52-55
6.6 Análisis terciario
La secuenciación masiva es una técnica potente que puede ser utilizada tanto para
investigación como para clínica. Una vez detectadas las mutaciones se tienen que nombrar
según las normas de la Human Genome Variation Society. Según las recomendaciones del
American College of Medical Genetics and Genomics (ACMG), los cambios detectados se
tienen que clasificar en: patogénicos, probablemente patogénicos, de significado clínico

incierto, probablemente benignos o benignos. Para poder clasificarlos, los tenemos que
comparar con diferentes bases de datos poblacionales que nos dan la frecuencia de
determinados cambios en la población general. Si un cambio es muy frecuente en la
población general, es un polimorfismo que lo más probable es que sea benigno. En la
diapositiva 57 se muestran las 4 principales bases de datos poblacionales. Los cambios
también se comparan con bases de datos clínicas, donde se encuentran clasificados
según la clasificación del ACMG. Estas bases de datos clínicas pueden contener errores, hay
que utilizarlas solo como referencia. Por último se realiza un análisis in silico con
programas de predicción del efecto funcional del cambio sobre la proteína. En la
diapositiva 58 se muestran los programas de predicción más relevantes hoy en día.
DIAPOSITIVAS 56-58
6.7 Estrategias derivadas de NGS
Se han desarrollado diferentes estrategias basadas en NGS para resolver distintas

cuestiones clínicas. Como se puede ver en la diapositiva 59, cuanta más cantidad de
genoma secuenciado, menor será la precisión diagnóstica del test pero se detectarán un
mayor número de variantes.
En IMEGEN SL se han desarrollado 4 estratégias de diagnóstico que nos dan diferente

cantidad de datos, así como una diferente precisión diagnóstica:
1) NextGenDx®: Estrategia con mayor precisión diagnóstica, basada en la creación de

librerías mediante captura por PCR. Ésta estrategia, desarrollada internamente en IMEGEN
SL, nos permite pasar fácilmente de la secuenciación Sanger a la NGS porque para crear las
librerías se utilizan los mismos cebadores que los usados para la secuenciación Sanger.
Esto nos va a asegurar que todas nuestras librerías van a ser específicas de las regiones
que queremos analizar, ya que todos los diseños van a estar validados previamente por
Sanger.
Los diseños son específicos, dirigidos a un problema clínico concreto y con la máxima
calidad diagnóstica, porque todas nuestras regiones de interés van a estar representadas y
con una cobertura mínima de 100X. Esta estrategia tiene pues una sensibilidad y
especificidad comparable a Sanger. Nos va a dar un número de cambios reducido que
podremos manejar bien, y no vamos a encontrar variantes de significado incierto.
Además se ha desarrollado un análisis informático adaptado a esta estrategia que nos
permite ver y controlar la calidad del proceso y de los parámetros mínimos establecidos
(por ejemplo cobertura mínima de 100X). El análisis bioinformático lleva acoplado
distintas bases de datos para la interpretación de variantes detectadas. Este análisis nos
permite además asegurar la calidad del proceso y alertar si no hay una secuencia de
interés cubierta.
La estrategia está validada en 48 muestras en las que se secuenciaron en total más de 96
genes, que tenían en su conjunto más de 9.000 cambios previamente identificados por
Sanger. Se analizan todo tipo de cambios puntuales. No se han detectado por el momento
falsos negativos ni falsos positivos, por lo que podemos decir que tiene misma sensibilidad
y especificidad que la técnica de Sanger. Pero en realidad, cuando tenemos una
profundidad grande mediante esta técnica podemos detectar mutaciones en mosaico que
se encuentren en un porcentaje bajo, se ha llegado al 8%, mientras que con Sanger solo
podemos detectar mutaciones en mosaico por encima del 30%.
Esta estrategia está dirigida a enfermedades monogénicas asociadas a genes muy grandes,
que por Sanger sería muy costoso de secuenciar, y también a enfermedades multigénicas
asociadas a un número finito de genes. Con esta técnica, en IMEGEN se han analizado 385
genes distintos, de 4067 pacientes que tenían 134 enfermedades distintas. También se
aplicó la técnica para el diagnóstico prenatal en 9 fetos con distintas indicaciones
ecográficas y se hizo el diagnóstico rápido en 5 gestantes con antecedentes familiares.
Se ha establecido que la secuenciación por Sanger sale rentable si no se superan las 30
secuencias de Sanger, si se tiene que analizar una región mayor se tiene que utilizar
NextGenDx®.
En la diapositiva 65 se muestra el rendimiento diagnóstico de NextGenDx® en el último

año. Se ha podido diagnosticar al 30% de los pacientes. El rendimiento varía según el gen
que se esté analizando, pero es siempre comparable al que se obtiene mediante la
secuenciación de Sanger. La ventaja es que este método es mucho más rápido, se pueden
dar los resultados en 30 días laborables y a precios mucho más reducidos que con Sanger.
En la diapositiva 65 se muestra el ejemplo de la detección de la poliquistosis renal
autosómica dominante. Esta es una de las enfermedades nefrológicas más frecuentes,
1/800 en la población general. En la mayoría de los casos está asociada a mutaciones en el
gen PKD1 (85%) o en el gen PKD2 (15%). El problema que existía hasta que llegaron las
aproximaciones de NGS era que PKD1 es un gen muy difícil de analizar mediante
secuenciación de Sanger, es muy grande y tiene muchos pseudogenes homólogos con los
que comparte secuencias. Desde el 2010 hasta el 2016 en Imegen solo se habían analizado
100 pacientes susceptibles de sufrir esta patología, mediante secuenciación de Sanger. Se
pudo detectar la causa de la enfermedad en aproximadamente el 80% de los pacientes.
Con el NextGenDx, desde mediados de 2016 hasta mediados del 2017 se pudieron analizar
148 pacientes susceptibles de padecer poliquistosis renal AD. El rendimiento diagnóstico
que se obtuvo con este método es similar al obtenido por Sanger.
Las limitaciones de la técnica son que requiere del diseño de PCRs y su validación previa
por Sanger para cada enfermedad. Cuando la enfermedad implica gran número de genes o
exones, ésta estrategia deja de ser competitiva en cuanto al precio. Como IMEGEN tiene
una larga experiencia, existe un catálogo con más de 2000 enfermedades y 7000 genes,
que ya están validados y que se pueden utilizar para la NGS.
DIAPOSITIVAS 59-68
2) Exoma dirigido (o exoma Ad Hoc): la librería se crea mediante captura por hibridación.
Esta estrategia consiste en la secuenciación y análisis de las regiones codificantes de un

grupo de genes específicos o asociados a un fenotipo clínico concreto. El número de

variantes que se van a obtener va a ser mucho menor que si se analizara el exoma
completo. Esto facilita la interpretación de los resultados y disminuye los hallazgos
incidentales no solicitados.
Hay que tener en cuenta que como la librería se realiza por captura por hibridación, puede
ocurrir que no se alcance un mínimo de 20X de representación en el 100% de las regiones
de interés. Aún así, se está utilizando un sistema de captura que se ha comprobado que es
bastante homogéneo entre distintas muestras y ensayos. También se ha desarrollado
internamente en IMEGEN un sistema informático que permite conocer qué regiones de
interés no están cubiertas al menos en un 20X, e informar sobre ellas. También se han
desarrollado distintas herramientas de análisis e interpretación de resultados adaptados
al exoma dirigido, que permiten analizar y categorizar los cambios d e t e c t a d o s , p a r a
poder finalmente dar un informe clínico de los resultados.
El exoma dirigido esta indicado en los casos que se pretenda analizar el mayor numero
posible de genes asociados a un fenotipo clínico concreto, aunque ello implique la perdida
de un pequeño porcentaje de información génica en algunas ROI (regiones de interés).
Esto se da en enfermedades con una heterogeneidad genética media o alta, y en
enfermedades con difícil diagnóstico diferencial o con características clínicas solapantes.
En el último año y medio se han analizado más de 1600 pacientes con más de 200
patologías distintas. Las enfermedades más estudiadas mediante este método han sido la
epilepsia, la discapacidad intelectual, miocardiopatía, etc. (diapositiva 72).
En la web de Imegen se encuentran paneles prediseñados para más de 200 patologías. Se
pueden buscar los paneles por especialidad médica o por tipo de enfermedad
El rendimiento diagnóstico que se ha obtenido en los 1600 pacientes es el siguiente: en un

24% de los casos se ha conseguido determinar cuál es la causa de la enfermedad y en un
35% de los casos se tienen que seguir haciendo estudios de segregación, etc. En este caso
el rendimiento diagnóstico también depende de la enfermedad que se esté analizando
(diapositiva 76). Estas enfermedades eran inabordables por la secuenciación con Sanger.
DIAPOSITIVAS 70-76
Esta estrategia se ha utilizado en pacientes con discapacidad intelectual. Como hemos

dicho, en esta patología la primera opción diagnóstica es el CGH array. Se ha visto que hay
muchos de estos pacientes que lo que tienen son mutaciones puntuales, pero hay tantos
genes implicados en esta patología que hasta ahora no era viable detectar estas
mutaciones. Mediante la estrategia de exoma dirigido se puede abordar la detección de las
mutaciones puntuales en estos pacientes. En Imegen tienen un panel diseñado para la
discapacidad intelectual con 701 genes. Durante este año se han analizado más de 100
pacientes con este panel, en el 39% de los casos se ha conseguido determinar cuál es la

causa genética de la patología. Este rendimiento diagnóstico es mucho mayor que el que se
obtiene mediante CGH array.
Aunque en un principio la NGS estaba diseñada para detectar mutaciones puntuales,
gracias a los avances tecnológicos ya nos permite detectar también deleciones y
duplicaciones. Esto es lo que vemos en el caso del paciente de la diapositiva 80. A este
paciente se le había realizado un panel de discapacidad intelectual porque presentaba
retraso global del desarrollo, epilepsia, encefalopatía, etc. Mediante NGS se vio que el
paciente tenía una deleción de varios exones de un gen, que después se confirmó mediante
un CGH array.
Otro ejemplo del uso de esta estrategia es el de los pacientes con epilepsia. En Imegen
tenían un panel diseñado para la epilepsia de 118 genes, con el que se obtenía un buen
rendimiento diagnóstico (diapositiva 81), se podía determinar la causa genética de la
enfermedad en un 18% de los casos. Una vez al año se revisan todos los paneles
prediseñados para añadir todos los nuevos genes que se han descrito como asociados con
cada patología. En este caso se añadieron 53 nuevos genes. Se reanalizaron 50 pacientes
con epilepsia que habían dado negativo en el primer panel, y en 12 de ellos se pudo
encontrar la causa genética de la enfermedad. La tasa diagnóstica aumentó en un 12%.
DIAPOSITIVAS 77-82
3) Exoma clínico: a veces la clínica es tan compleja que no se puede asociar a un fenotipo o
a un grupo de genes completo, o puede ser que después de hacer un exoma dirigido no se
haya encontrado la causa de la enfermedad, en estos casos se puede hacer un exoma
clínico.
En este caso la librería también se crea mediante captura por hibridación. Consiste en
secuenciar la región codificante de todos los genes descritos previamente en el OMIM, que
tienen alguna asociación con enfermedades genéticas. Esto supone secuenciar unas 12Mb
del genoma humano, correspondientes a 4813 genes con más de 62.000 exones. El exoma
clínico tiene un alto porcentaje de regiones cubiertas a más de un 20X y lo importante es
que todas las variaciones detectadas pueden asociarse a un significado clínico, puesto que
conocemos la función de los genes de estudio. Se obtiene menos cantidad de datos que con
un exoma completo, pero con más utilidad clínica.
Esta técnica es laboriosa, porque para cada paciente se obtienen unos 200 cambios
patogénicos, posiblemente patogénicos o de significado incierto, y se tiene que ir mirando
uno a uno para ver si pueden estar relacionados con la clínica que presenta el paciente.
El exoma clínico esta indicado en los casos clínicamente inespecíficos que no pueden
asociarse a un fenotipo, patología o genes concretos y de los cuales se tratan de obtener
resultados que permitan llegar a conclusiones clínicas.
DIAPOSITIVA 83

4) Exoma completo: la librería también se obtiene por captura por hibridación, pero aquí
no sólo se incluyen los genes que se sabe que tienen alguna implicación clínica, sino que
también se incluyen los cerca de 20.000 genes de los que consta el genoma humano. El
problema lo encontramos en la interpretación, ya que resulta muy compleja debido a la
gran cantidad de variantes que se obtienen, y que además estas variantes están en genes
de los que se desconoce su función. Por eso es recomendable al realizar un estudio de
exoma completo, hacerlo en el propio paciente pero también en sus progenitores, porque
así se pueden descartar muchos cambios. Si encontramos un cambio para un enfermedad
dominante en los padres, y no presentan el fenotipo, ya se puede descartar como
patológico en el hijo. Si es una enfermedad recesiva, el paciente tiene que tener dos
cambios en un gen determinado y cada cambio debe provenir de un progenitor.
Esta estrategia está indicada como última opción, cuando todas las anteriores no han dado
resultado. Las conclusiones clínicas solo se van a poder tomar en genes conocidos.
El exoma completo está dirigido a casos de interés científico cuyo objetivo es obtener la
mayor cantidad de información posible, tanto de genes con asociación clínica conocida
como de aquellos de los que no se dispone aún de esa información. También cuando se
desea alcanzar una gran capacidad de “descubrir” variantes nuevas.
El exoma completo esta indicado cuando el principal objetivo sea descubrir variantes
nuevas que puedan tener utilidad científica, aunque los resultados pueden proporcionar
también datos de utilidad clínica.
DIAPOSITIVAS 84
La estrategia que elijamos va a depender de la patología que presente el paciente, tenemos

que intentar tener siempre la máxima precisión diagnóstica. Hay casos como la epilepsia,
que está asociada a 106 genes, en este caso lo mejor es hacer un exoma dirigido a esos
genes. Hay otras enfermedades que presentan un cuadro clínico tan heterogéneo que no
somos capaces de definir que genes tenemos que analizar, aquí tendremos que utilizar un
exoma clínico. En última instancia, si no hemos encontrado nada podemos llevar a cabo un
exoma trio completo.

2.2 Técnicas de Diagnóstico Genómico 2019

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

2.2 Técnicas de Diagnóstico Genómico 2019

Cargado por

Copyright:

Formatos disponibles

TÉCNICAS DE DIAGNÓSTICO

TÍTULO DE EXPERTO UNIVERSITARIO EN MEDICINA GENÉTICA Y GENÓMICA 2019

Material didáctico creado por Mar Benito, MSc https://www.linkedin.com/in/marbenito/

MÓDULO 2: TÉCNICAS DE DIAGNÓSTICO GENÉTICO Y GENÓMICO

Dra. María García Hoyos

1.-INTRODUCCIÓN AL DIAGNÓSTICO GENÉTICO.......................................................................... 1

4.-DIAGNÓSTICO PRENATAL MEDIANTE CGH ARRAY.....................................................................4

5.-DETECCIÓN DE MUTACIONES PUNTUALES. SANGER VS SECUENCIACIÓN MASIVA...................5

6.- NEXT GENERATION SEQUENCING (NGS).................................................................................. 6

6.6.- Análisis terciario.................................................................................................................9

6.7.- Estrategias derivadas del NGS..........................................................................................10

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 0

1.-INTRODUCCIÓN AL DIAGNÓSTICO GENÉTICO

El diagnóstico genético es un diagnóstico muy complejo y esto es debido a:

 La gran complejidad intrínseca que presenta nuestro propio genoma humano:

1. ¿Qué busco? Qué enfermedad tenemos delante y cuál es el patrón de

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 1

2. DETECCIÓN DE REORDENAMIENTOS CROMOSÓMICOS. CGH ARRAY

Para la detección de reordenamientos cromosómicos, tenemos varias técnicas a nuestro

La ventaja del CGH array frente al cariotipo convencional es la mayor capacidad de

Al hibridar el ADN del paciente y el de referencia en una array, la diferencia de la señal

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 2

3. INDICACIONES DEL CGH ARRAY

Las principales indicaciones clínicas del CGH array son:

1) Retraso mental o discapacidad intelectual. Ya en el 2002 se describió que de los

3) Síndromes de genes contiguos. Estos síndromes son debidos a alteraciones en más de

4) Cariotipos alterados. Si por ejemplo, en un cariotipo encontramos la presencia de un

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 3

diapositiva 22 se muestra un ejemplo en el que el cromosoma marcador era una

También se puede utilizar el CGH array cuando encontramos alteraciones estructurales de

4. DIAGNÓSTICO PRENATAL MEDIANTE CGH ARRAY

 Un 6% de casos con anomalías ecográficas y cariotipo normal tenía alteración

En la diapositiva 26 se muestra una publicación del Colegio Americano de Ginecología y

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 4

5.- DETECCIÓN DE MUTACIONES PUNTUALES. SANGER VS SECUENCIACIÓN MASIVA

En los últimos años el desarrollo tecnológico ha derivado en la técnica alternativa

A pesar de las citadas diferencias, si comparamos el flujo de trabajo entre la secuenciación

En la secuenciación Sanger el paso más importante es el de la amplificación de ADN

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 5

6.- NEXT GENERATION SEQUENCING (NGS)

6.1 Preparación y amplificación de librerías

Básicamente podemos distinguir dos formas de preparación de las librerías:

Estos cebadores tienen además una característica importante: después de la zona

6.2. Amplificación del cluster

a) Sistema Illumina: existen varios aparatos distintos dependiendo del número de

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 6

6.3 Aparatos de Thermo Fisher

Dentro de las microgotas se dan dos procesos:

El fragmento de ADN de la librería se va a amplificar con los cebadores específicos, que

Se parte de las microesferas rodeadas de los amplificados clonales, que se cargan en un

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 7

6.4 Aparatos de Illumina

La librería se añade a un microarray en el que en su superficie hay cebadores

Una vez se termina la amplificación, comienza la secuenciación que se hace con

6.5 Análisis e interpretación de los resultados

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 8

En la observación de los resultados tenemos que tener en cuenta que:

6.6 Análisis terciario

Título de Experto Universitario en Medicina Genética y Genómica 2019 Página 9

6.7 Estrategias derivadas de NGS

Se han desarrollado diferentes estrategias basadas en NGS para resolver distintas

En IMEGEN SL se han desarrollado 4 estratégias de diagnóstico que nos dan diferente

1) NextGenDx®: Estrategia con mayor precisión diagnóstica, basada en la creación de