Documentos de Académico
Documentos de Profesional
Documentos de Cultura
GENÓMICO
MÓDULO 2: TÉCNICAS DE DIAGNÓSTICO GENÉTICO Y GENÓMICO
El término diagnóstico genético hace referencia a todas aquellas acciones que se llevan a
cabo para detectar o determinar las causas genéticas de una enfermedad.
Contamos con unas series de bases de datos que nos permiten ver a qué región genómica o
a qué gen está asociada cada una de las enfermedades, y qué daño está asociado con esa
región de ADN.
Esta complejidad nos lleva a que el diagnóstico genético sea un proceso que debe
comenzar y terminar con una consulta de consejo genético. En esta consulta el facultativo
recoge toda la información tanto clínica como familiar del paciente, para intentar
determinar el patrón hereditario de la enfermedad, y si esa enfermedad es conocida. A
partir de aquí se decide cómo hay que abordar el análisis genético. Por tanto a la hora de
plantearnos un estudio genómico tenemos que responde a estas 3 preguntas:
Un genetista es aquel qué sabe aplicar correctamente cada una de las técnicas cuando
corresponde. No hay ninguna técnica universal que pueda aplicarse para todo. La técnica a
utilizar variará en función del tipo de mutación que se asocia a la enfermedad (mutaciones
puntuales, reordenamientos cromosómicos, mutaciones dinámicas, mutaciones del
imprinting).
Cuando hablamos de análisis genómico nos referimos a que en vez de buscar la causa de
una enfermedad en un gen o en una región concreta, la vamos a buscar en todo el genoma
a la vez. Para ello existen dos técnicas que ya están implantadas en el diagnóstico clínico.
Cuando se quieren buscar reordenamientos cromosómicos (deleciones/duplicaciones)
utilizaremos el CGH array, mientras que para detectar mutaciones puntuales se utiliza la
secuenciación masiva (NGS).
DIAPOSITIVAS 2-9
El CGH array consiste en hibridar de forma competitiva sobre una plataforma, el ADN del
paciente y un ADN de referencia comercial, del mismo sexo del paciente, y que sabemos
exactamente que polimorfismos tiene. Cada tipo de ADN se marca con un fluorocromo
diferente y se hibridan de forma competitiva sobre una plataforma de array. Si
consideramos que nuestro genoma es como una gran enciclopedia, en esas plataformas de
array estarían impresas diferentes páginas de esa enciclopedia. Los arrays de diagnóstico
genético tienen más páginas de regiones asociadas a síndromes ya conocidos o de regiones
donde se localizan genes importantes (target regions). Hay que establecer un equilibrio
entre la cobertura de las target regions y de las otras regiones. Si encontramos
duplicaciones o deleciones en estas otras regiones no sabríamos cuál es su significado
(hallazgos de significado clínico incierto). Las distintas plataformas de array se diferencian
en las “páginas” que tienen impresas.
Una vez que sabemos las duplicaciones y deleciones que tiene nuestro paciente, las
tenemos que clasificar en patológicas, benignas o de significado clínico incierto, y
nombrarlas siguiendo las recomendaciones ISCN (International System for Human
Cytogenetic Nomenclature).
DIAPOSITIVAS 9-16
2) Autismo. Hay muchísimas publicaciones que avalan el uso del CGH array en los
trastornos del espectro autista (ver diapositiva 18). Se considera que el 1-3% de los
pacientes con autismo tienen deleciones o duplicaciones detectables con el CGH array. Se
han descrito más de 150 regiones en el genoma asociadas con el autismo o trastornos del
espectro autista. Hay una web http://projects.tcag.ca/autism/ donde se recogen todas las
variaciones en el número de copias asociadas a este trastorno (diapositiva 19).
DIAPOSITIVAS 17-19
DIAPOSITIVAS 20-23
Desde 2012 hay numerosas publicaciones que avalan el uso del CGH array en embarazdas
cuando el screening bioquímico esté alterado, o se detecten anomalías ecográficas. En la
publicación de la diapositiva 24 se observó que:
En las plataformas de GCH array prenatal se tiene que intentar reducir al máximo la
incertidumbre diagnóstica, y evitar resultados de significado clínico incierto. Por ello, solo
tienen impresas regiones que sabemos que están relacionadas con patologías.
DIAPOSITIVAS 24-26
Las mutaciones puntuales son las más frecuentes asociadas a enfermedades de origen
genético. Se estima que un 80% de las enfermedades genéticas están asociadas a este tipo
de mutaciones en las regiones codificantes de los genes.
Hasta hace pocos años la única técnica que existía para detectar mutaciones puntuales era
la Secuenciación Sanger. Es considerada la técnica Gold Estándar puesto que tiene una
sensibilidad y especificidad cercana al 99% para detectar éste tipo de mutaciones (cambio
de un nucleótido por otro o pequeñas deleciones e inserciones). Sin embargo esta técnica
presenta limitaciones cuando la región a secuenciar es grande, ya que resulta
extremadamente cara. También ocurre esto cuando lo que se tiene que abordar es una
enfermedad muy heterogénea genéticamente (enfermedad asociada a mutaciones en
muchos genes distintos).
Existen distintos métodos para crear estas librerías. Dependiendo del método las regiones
de interés tendrán distinta cobertura. Cada método tiene una sensibilidad, una
especificidad y una reproducibilidad diferentes.
DIAPOSITIVAS 28-35
Se trata de la selección de las regiones del genoma que queremos secuenciar a la vez.
Existen distintos métodos para la creación de librerías que nos dan distinta cobertura,
sensibilidad, especificidad y reproducibilidad.
1.- Captura por hibridación: El ADN del paciente se digiere aleatoriamente con enzimas de
restricción y se capturan los fragmentos digeridos que nos interesan para secuenciar. La
captura se realiza mediante sondas complementarias a las regiones de interés, que pueden
encontrarse en una solución líquida marcadas con biotina, lo que permite la captura por
imantación, o estar sobre una superficie sólida en un porta.
2 . - Captura por PCR: haciendo múltiples PCRs a la vez se amplifican las regiones del
genoma que queremos secuenciar.
En ambos casos, los fragmentos que se obtienen terminan en dos extremos comunes para
todos los fragmentos. Esto permite la posterior amplificación de los mismos utilizando
unos cebadores comunes, en cualquier sistema/aparato de NGS.
DIAPOSITIVAS 36-39
Los pasos de amplificación del cluster y de secuenciación son distintos dependiendo del
sistema que es use. Los dos sistemas de secuenciación masiva más utilizados hoy en día
para hacer el diagnóstico genético y en los que basaremos este tema son:
b) Sistema Thermo Fisher: dos aparatos PGM y S5. El PGM es más pequeño y tienen
una capacidad de secuenciación de 30 Mb-2Gb, el S5 llega hasta 15 Gb. La
amplifiación de los clusters se da por PCR en emulsión y la secuenciación por
semiconducción.
DIAPOSITIVAS 40-43
PCR en emulsión. En esta PCR, se mezclan en unas microgotas los siguientes elementos:
unas partículas microesféricas recubiertas de cebadores, la pareja de cebadores
específicos y los fragmentos generados previamente en la librería.
Puede ocurrir que en una gota haya dos fragmentos distintos de nuestra librería, por lo
que tendremos un amplificado policlonal. También puede ocurrir que ningún fragmento se
haya incluido en la microgota (diapositiva 43). Por tanto hay que cuidar bien las
concentraciones para intentar que la amplificación sea lo más homogénea (monoclonal)
posible.
Secuenciación
DIAPOSITIVAS 42-45
PCR en puente
Secuenciación
DIAPOSITIVAS 46-49
Después del proceso de secuenciación, el análisis de los resultados vuelve a ser común
para todos los sistemas de NGS.
Se generan una gran cantidad de datos que hay que saber gestionar. Se sigue normalmente
este esquema:
1- Análisis primario: el aparto nos dice qué nucleótido se ha ido uniendo y cuál es la
calidad del mismo. Esto nos da la secuencia de nucleótidos en un archivo FASTQ.
2- Análisis secundario: se alinean cada una de las secuencias obtenidas contra el
genoma humano (actualmente la versión HG19) y se buscan las diferencias entre
ambos. En secuenciación masiva el archivo donde se alinean las secuencias contra
el genoma de referencia se llama BAM, y el archivo donde se listan cada una de las
diferencias encontradas entre nuestra secuencia y la secuencia de referencia se
llama VCF. Haciendo una comparativa con Sanger, podemos decir que el archivo
BAM es similar al electroferograma que se obtiene en Sanger.
3- Análisis terciario: consiste en determinar qué significado clínico tienen esas
diferencias/variaciones. La forma de realizar este análisis terciario va a diferenciar
entre investigación o diagnóstico.
- Archivos BAM obtenidos con dos formas diferentes de crear las librerías: captura
por PCR y captura por hibridación. En la diapositiva 55, NextGenDx es un sistema
de captura por PCR desarrollado en Imegen y HaloPlex, es un sistema de captura
por hibridación comercial. Debemos escoger aquellas librerías que nos dan picos
más homogéneos, los picos nos indican el número de secuencias que hay en cada
uno de los puntos.
- Las regiones de interés deben estar totalmente cubiertas. En la diapositiva 55, con
HaloPlex se queda una región importante del exón 10 del gen FGFR3 sin cubrir, en
esta región hay dos mutaciones asociadas con acondroplasia en el 99% de los
casos e hipoacondroplasia en el 90% de los casos.
- Debemos disponer de secuencias tanto el sentido Fw como en sentido Rv. En la
diapositiva 55 las secuencias Fw son las de color salmón y las Rv son las azules.
Vemos que con la captura HaloPlex, no todas las secuencias tienen Fw y Rv, y con
NextGenDx sí.
Por tanto es muy importante en NGS para dar un diagnóstico disponer de una COBERTURA
HORIZONTAL, en la que todas las regiones de nuestro interés están cubiertas y no existe
ningún GAP, o si lo hay tenerlo bien identificado e informar. También es importante la
COBERTURA VERTICAL o PROFUNDIDAD, en la que debemos saber cuántas secuencias
tenemos para cada una de nuestras regiones de interés. Dado que la sensibilidad de la
tecnología de NGS es menor que la de Sanger es necesario “leer” más veces la misma
región. En Sanger con las secuencias el Fw y el Rv es suficiente porque se comete un error
cada millón de bases. En NGS se estima que se comete un error cada 10000 pb, por lo que
para detectar heterocigotos, la profundidad mínima debe ser de entre 20x y 40x (en cada
punto debe haber entre 20 y 40 lecturas). Para detectar una mutación en mosaico, la
cobertura en cada punto tendría que ser alrededor de 1000X.
Muchas veces se da una cobertura media de todo el gen, pero hay que ir a mirar cuál es la
cobertura específica en cada zona de interés. Para diagnóstico debemos garantizar el
análisis de todas las regiones de interés. Si hay gaps (por diseño, secuenciación,
alineamiento, etc.) debemos informar de ello pre y post test, ya que de ello depende la
especificidad (valor predictivo negativo) del test.
DIAPOSITIVAS 52-55
La secuenciación masiva es una técnica potente que puede ser utilizada tanto para
investigación como para clínica. Una vez detectadas las mutaciones se tienen que nombrar
según las normas de la Human Genome Variation Society. Según las recomendaciones del
American College of Medical Genetics and Genomics (ACMG), los cambios detectados se
tienen que clasificar en: patogénicos, probablemente patogénicos, de significado clínico
incierto, probablemente benignos o benignos. Para poder clasificarlos, los tenemos que
comparar con diferentes bases de datos poblacionales que nos dan la frecuencia de
determinados cambios en la población general. Si un cambio es muy frecuente en la
población general, es un polimorfismo que lo más probable es que sea benigno. En la
diapositiva 57 se muestran las 4 principales bases de datos poblacionales. Los cambios
también se comparan con bases de datos clínicas, donde se encuentran clasificados
según la clasificación del ACMG. Estas bases de datos clínicas pueden contener errores, hay
que utilizarlas solo como referencia. Por último se realiza un análisis in silico con
programas de predicción del efecto funcional del cambio sobre la proteína. En la
diapositiva 58 se muestran los programas de predicción más relevantes hoy en día.
DIAPOSITIVAS 56-58
falsos negativos ni falsos positivos, por lo que podemos decir que tiene misma sensibilidad
y especificidad que la técnica de Sanger. Pero en realidad, cuando tenemos una
profundidad grande mediante esta técnica podemos detectar mutaciones en mosaico que
se encuentren en un porcentaje bajo, se ha llegado al 8%, mientras que con Sanger solo
podemos detectar mutaciones en mosaico por encima del 30%.
Esta estrategia está dirigida a enfermedades monogénicas asociadas a genes muy grandes,
que por Sanger sería muy costoso de secuenciar, y también a enfermedades multigénicas
asociadas a un número finito de genes. Con esta técnica, en IMEGEN se han analizado 385
genes distintos, de 4067 pacientes que tenían 134 enfermedades distintas. También se
aplicó la técnica para el diagnóstico prenatal en 9 fetos con distintas indicaciones
ecográficas y se hizo el diagnóstico rápido en 5 gestantes con antecedentes familiares.
Se ha establecido que la secuenciación por Sanger sale rentable si no se superan las 30
secuencias de Sanger, si se tiene que analizar una región mayor se tiene que utilizar
NextGenDx®.
DIAPOSITIVAS 59-68
2) Exoma dirigido (o exoma Ad Hoc): la librería se crea mediante captura por hibridación.
Esta estrategia consiste en la secuenciación y análisis de las regiones codificantes de un
Hay que tener en cuenta que como la librería se realiza por captura por hibridación, puede
ocurrir que no se alcance un mínimo de 20X de representación en el 100% de las regiones
de interés. Aún así, se está utilizando un sistema de captura que se ha comprobado que es
bastante homogéneo entre distintas muestras y ensayos. También se ha desarrollado
internamente en IMEGEN un sistema informático que permite conocer qué regiones de
interés no están cubiertas al menos en un 20X, e informar sobre ellas. También se han
desarrollado distintas herramientas de análisis e interpretación de resultados adaptados
al exoma dirigido, que permiten analizar y categorizar los cambios d e t e c t a d o s , p a r a
poder finalmente dar un informe clínico de los resultados.
El exoma dirigido esta indicado en los casos que se pretenda analizar el mayor numero
posible de genes asociados a un fenotipo clínico concreto, aunque ello implique la perdida
de un pequeño porcentaje de información génica en algunas ROI (regiones de interés).
Esto se da en enfermedades con una heterogeneidad genética media o alta, y en
enfermedades con difícil diagnóstico diferencial o con características clínicas solapantes.
En el último año y medio se han analizado más de 1600 pacientes con más de 200
patologías distintas. Las enfermedades más estudiadas mediante este método han sido la
epilepsia, la discapacidad intelectual, miocardiopatía, etc. (diapositiva 72).
En la web de Imegen se encuentran paneles prediseñados para más de 200 patologías. Se
pueden buscar los paneles por especialidad médica o por tipo de enfermedad
DIAPOSITIVAS 70-76
causa genética de la patología. Este rendimiento diagnóstico es mucho mayor que el que se
obtiene mediante CGH array.
Aunque en un principio la NGS estaba diseñada para detectar mutaciones puntuales,
gracias a los avances tecnológicos ya nos permite detectar también deleciones y
duplicaciones. Esto es lo que vemos en el caso del paciente de la diapositiva 80. A este
paciente se le había realizado un panel de discapacidad intelectual porque presentaba
retraso global del desarrollo, epilepsia, encefalopatía, etc. Mediante NGS se vio que el
paciente tenía una deleción de varios exones de un gen, que después se confirmó mediante
un CGH array.
Otro ejemplo del uso de esta estrategia es el de los pacientes con epilepsia. En Imegen
tenían un panel diseñado para la epilepsia de 118 genes, con el que se obtenía un buen
rendimiento diagnóstico (diapositiva 81), se podía determinar la causa genética de la
enfermedad en un 18% de los casos. Una vez al año se revisan todos los paneles
prediseñados para añadir todos los nuevos genes que se han descrito como asociados con
cada patología. En este caso se añadieron 53 nuevos genes. Se reanalizaron 50 pacientes
con epilepsia que habían dado negativo en el primer panel, y en 12 de ellos se pudo
encontrar la causa genética de la enfermedad. La tasa diagnóstica aumentó en un 12%.
DIAPOSITIVAS 77-82
3) Exoma clínico: a veces la clínica es tan compleja que no se puede asociar a un fenotipo o
a un grupo de genes completo, o puede ser que después de hacer un exoma dirigido no se
haya encontrado la causa de la enfermedad, en estos casos se puede hacer un exoma
clínico.
En este caso la librería también se crea mediante captura por hibridación. Consiste en
secuenciar la región codificante de todos los genes descritos previamente en el OMIM, que
tienen alguna asociación con enfermedades genéticas. Esto supone secuenciar unas 12Mb
del genoma humano, correspondientes a 4813 genes con más de 62.000 exones. El exoma
clínico tiene un alto porcentaje de regiones cubiertas a más de un 20X y lo importante es
que todas las variaciones detectadas pueden asociarse a un significado clínico, puesto que
conocemos la función de los genes de estudio. Se obtiene menos cantidad de datos que con
un exoma completo, pero con más utilidad clínica.
Esta técnica es laboriosa, porque para cada paciente se obtienen unos 200 cambios
patogénicos, posiblemente patogénicos o de significado incierto, y se tiene que ir mirando
uno a uno para ver si pueden estar relacionados con la clínica que presenta el paciente.
El exoma clínico esta indicado en los casos clínicamente inespecíficos que no pueden
asociarse a un fenotipo, patología o genes concretos y de los cuales se tratan de obtener
resultados que permitan llegar a conclusiones clínicas.
DIAPOSITIVA 83
4) Exoma completo: la librería también se obtiene por captura por hibridación, pero aquí
no sólo se incluyen los genes que se sabe que tienen alguna implicación clínica, sino que
también se incluyen los cerca de 20.000 genes de los que consta el genoma humano. El
problema lo encontramos en la interpretación, ya que resulta muy compleja debido a la
gran cantidad de variantes que se obtienen, y que además estas variantes están en genes
de los que se desconoce su función. Por eso es recomendable al realizar un estudio de
exoma completo, hacerlo en el propio paciente pero también en sus progenitores, porque
así se pueden descartar muchos cambios. Si encontramos un cambio para un enfermedad
dominante en los padres, y no presentan el fenotipo, ya se puede descartar como
patológico en el hijo. Si es una enfermedad recesiva, el paciente tiene que tener dos
cambios en un gen determinado y cada cambio debe provenir de un progenitor.
Esta estrategia está indicada como última opción, cuando todas las anteriores no han dado
resultado. Las conclusiones clínicas solo se van a poder tomar en genes conocidos.
El exoma completo está dirigido a casos de interés científico cuyo objetivo es obtener la
mayor cantidad de información posible, tanto de genes con asociación clínica conocida
como de aquellos de los que no se dispone aún de esa información. También cuando se
desea alcanzar una gran capacidad de “descubrir” variantes nuevas.
El exoma completo esta indicado cuando el principal objetivo sea descubrir variantes
nuevas que puedan tener utilidad científica, aunque los resultados pueden proporcionar
también datos de utilidad clínica.
DIAPOSITIVAS 84