Está en la página 1de 227

19 OFICINA ESPAÑOLA DE

PATENTES Y MARCAS

ESPAÑA
11 Número de publicación: 2 906 023
51Int. CI.:
C12Q 1/68 (2008.01)

12 TRADUCCIÓN DE PATENTE EUROPEA T3

86 Fecha de presentación y número de la solicitud internacional: 10.04.2013 PCT/EP2013/057516


87 Fecha y número de publicación internacional: 17.10.2013 WO13153130
96 Fecha de presentación y número de la solicitud europea: 10.04.2013 E 13717473 (6)
97 Fecha y número de publicación de la concesión europea: 29.12.2021 EP 2836606

54 Título: Nuevos marcadores para detectar inestabilidad microsatelital en cáncer y determinar la


letalidad sintética con inhibición de la vía de reparación por escisión de bases de ADN

30 Prioridad: 73 Titular/es:
10.04.2012 US 201261622383 P VIB VZW (50.0%)
26.04.2012 US 201261638955 P Rijvisschestraat 120
27.03.2013 EP 13161395 9052 Gent, BE y
45
LIFE SCIENCES RESEARCH PARTNERS VZW
Fecha de publicación y mención en BOPI de la (50.0%)
traducción de la patente:
72 Inventor/es:
12.04.2022
LAMBRECHTS, DIETHER
74 Agente/Representante:
LEHMANN NOVO, María Isabel
ES 2 906 023 T3

Aviso:En el plazo de nueve meses a contar desde la fecha de publicación en el Boletín Europeo de Patentes, de
la mención de concesión de la patente europea, cualquier persona podrá oponerse ante la Oficina Europea
de Patentes a la patente concedida. La oposición deberá formularse por escrito y estar motivada; sólo se
considerará como formulada una vez que se haya realizado el pago de la tasa de oposición (art. 99.1 del
Convenio sobre Concesión de Patentes Europeas).
E13717473
ES 2 906 023 T3 11-02-2022

DESCRIPCIÓN

Nuevos marcadores para detectar inestabilidad microsatelital en cáncer y determinar la letalidad sintética con inhibición
de la vía de reparación por escisión de bases de ADN
5
Campo de la invención

La presente solicitud se refiere al campo del cáncer, en particular a tumores deficientes en la reparación de errores de
apareamiento (MMR). En el presente documento se presentan nuevos marcadores que tienen una alta sensibilidad para
10 detectar si un tumor es deficiente en la reparación de errores de apareamiento o no. Los marcadores son, en particular,
mutaciones en regiones de microsatélites. En consecuencia, se proporcionan procedimientos para diagnosticar la
inestabilidad microsatelital de un tumor, que comprenden determinar la presencia de estos marcadores. Además, se
proporcionan kits para detectar la presencia de estos marcadores (o subconjuntos de los mismos) en una muestra.

15 Es interesante señalar que las mutaciones afectan preferentemente a la vía de reparación de roturas de doble hebra
(DSB) mediante recombinación homóloga (HR), y la reparación de DSB está funcionalmente alterada en los tumores
deficientes en MMR. En el presente documento se muestra que estos tumores son sensibles a la inducción de roturas
monocatenarias por inhibición farmacológica de la enzima poli ADP ribosa polimerasa (inhibición de PARP). En
consecuencia, se proporcionan nuevas modalidades de tratamiento para tumores deficientes en MMR, basadas en la
20 interacción letal sintética entre MMR y PARP.

Antecedentes

La forma de inestabilidad genómica asociada con la reparación defectuosa de errores de apareamiento del ADN en
25 tumores se denomina inestabilidad microsatelital (MSI). La inestabilidad microsatelital (MSI) es un cambio clonal en el
número de unidades de nucleótidos de ADN repetidas en microsatélites. Aparece generalmente en tumores con genes
de reparación de errores de apareamiento (MMR) defectuosos: el fallo del sistema MMR de ADN para reparar los errores
que se producen durante la replicación del ADN da como resultado una acumulación acelerada de mutaciones de un
solo nucleótido y alteraciones en la longitud de secuencias de microsatélites repetitivas simples que se producen de
30 forma ubicua a lo largo del genoma. La deficiencia en MMR representa una causa bien establecida del síndrome de
Lynch, que es un trastorno hereditario autosómico dominante de susceptibilidad al cáncer que es responsable del 2% al
5% de los cánceres endometriales (EM) o colorrectales (CCR). El síndrome de Lynch está provocado por mutaciones o
deleciones en los genes de la vía MMR (MLH1, MSH2, MSH3, MSH6 o PMS2) (Jiricny, 2006). Además, el silenciamiento
epigenético de MLH1, a menudo denominado síndrome de Lynch "esporádico", contribuye a otro 15% de estos tumores
35 (Kuismanen et al., 2002). Una mutación en la 3' UTR de MLH1 parece conferir una deficiencia en la reparación de errores
de apareamiento en un subconjunto de pacientes con leucemia (Mao et al. 2008, J Biol Chem 283: 3211-3216). La
deficiencia en MMR también se ha descrito en una minoría de cánceres de ovario, páncreas, gástricos, leucémicos y
varios otros cánceres. La deficiencia en la maquinaria MMR da lugar a errores de replicación del ADN en el tejido
tumoral, pero no en el tejido circundante normal. En particular, los errores somáticos se acumulan como mutaciones de
40 inserción/deleción en repeticiones mononucleotídicas y dinucleotídicas, un fenómeno conocido como inestabilidad
microsatelital (MSI) (Pinol et al., 2005).

Los tumores deficientes en MMR muestran un pronóstico y un resultado terapéutico diferente después de una
quimioterapia estándar (de la Chapelle y Hampel, 2010), tal como 5-fluoracilo y los agentes alquilantes tales como la
45 temozolomida. Los pacientes con CCR no tratados con tumores deficientes en MMR tienen un pronóstico
moderadamente mejor, pero no parecen beneficiarse de la quimioterapia adyuvante basada en 5-fluorouracilo, que es la
quimioterapia de primera elección para el CCR. En particular, en los tumores deficientes en MMR se toleran los errores
de apareamiento inducidos por el 5-fluorouracilo, lo que da lugar a incapacidad para inducir la muerte celular (Hewish et
al., 2010). Los tumores deficientes en MMR también son resistentes al cisplatino y al carboplatino, que son
50 quimioterapias de uso frecuente en EM (Hewish et al., 2010). Además, los tumores deficientes en MMR pueden ser
resistentes a las terapias dirigidas, incluidas las terapias anti-EGFR y anti-VEGF, porque adquieren mutaciones
secundarias en genes que activan vías de señalización alternativas o posteriores. Por ejemplo, los tumores MMR pueden
adquirir mutaciones en genes de reparación de rotura de doble hebra (por ejemplo, MRE11, ATR y RAD50), oncogenes
o supresores de tumores conocidos (por ejemplo, PIK3CA o PTEN). Otra posibilidad es que el silenciamiento epigenético
55 de MLH1 coincida con mutaciones particulares, tales como la mutación BRAF V600E (Ogino et al., 2012), que representa
un predictor negativo establecido de respuesta a terapias dirigidas anti-EGFR en CCR avanzado (De Roock et al., 2010).

Los esfuerzos para individualizar el tratamiento de tumores deficientes en MMR se han centrado en identificar
interacciones letales sintéticas con la vía MMR. En particular, los estudios revelaron que un aumento del daño oxidativo
60 (por exposición a metotrexato o silenciamiento de PINK1 (Martin et al., 2011)) y la interferencia con la vía de reparación
por escisión de bases (BER) (por inhibición de la ADN polimerasa γ o β (Martin et al., 2010)) sensibilizan tumores
deficientes en MMR. En particular, en los tumores MMR, el daño oxidativo induce lesiones en el ADN de 8-oxoguanina
(8-oxoG), que no se reparan de forma suficiente ni por la vía BER ni por la vía MMR, lo que genera principalmente
transversiones de dinucleótidos GC a TA a nivel del ADN, lo que da lugar a la muerte celular. Además, se ha planteado
65 la hipótesis de que existe una frecuencia de mutaciones máxima que un tumor puede tolerar, por encima de la cual un
aumento adicional de mutaciones sería perjudicial. Por lo tanto, se ha propuesto tratar adicionalmente los tumores MMR-
2
E13717473
ES 2 906 023 T3 11-02-2022

con análogos de nucleósidos mutagénicos hasta que se obtenga un nivel crítico de mutaciones que dé como resultado
una ablación del tumor similar a una catástrofe por error. Sin embargo, hasta la fecha, estos esfuerzos no se han
traducido en opciones de tratamiento clínicamente eficaces. Alternativamente, las mutaciones secundarias que se
producen como resultado de la deficiencia en MMR también pueden ser un objetivo (Dorard et al., 2011). No obstante,
5 los estudios que caracterizan los espectros de mutación secundaria de tumores deficientes en MMR se han limitado a
observaciones en uno o unos pocos loci informadores, o se han centrado exclusivamente en mutaciones en secuencias
de punto caliente conocidas. Aunque fueron capaces de establecer que las mutaciones afectan con mayor frecuencia a
las repeticiones mononocleotídicas y dinucleotídicas, el espectro de mutaciones somáticas que se produce en estos
tumores sigue estando caracterizado deficientemente.
10
Dado que la presencia de deficiencia en MMR principalmente en tumores colorrectales y endometriales representa una
forma familiar de cáncer, y dado que los tumores presentan espectros de mutación característicos de deficiencia en
MMR, se utilizan generalmente pruebas diagnósticas que evalúan la deficiencia en MMR.

15 Con mucho, el procedimiento más común para detectar MSI es medir la longitud de un amplicón de reacción en cadena
de la polimerasa que contiene el microsatélite completo. Esto requiere ADN, un par de cebadores de los cuales uno a
menudo está marcado de forma fluorescente en los extremos, un secuenciador y un programa informático adecuado.
Alternativamente, si el amplicón está secuenciado, se puede contar sencillamente el número de unidades de repetición.
La MSI también puede diagnosticarse indirectamente mediante la detección de la pérdida de tinción por
20 inmunohistoquímica (IHC) de uno de los genes de reparación de errores de apareamiento, dado que esto también
apunta a una anomalía en la reparación de errores de apareamiento. Los procedimientos inmunohistoquímicos y
genéticos se caracterizan por un número considerable de falsos negativos y, por este motivo, las evaluaciones
combinadas a nivel inmunohistoquímico y genético se realizan en un entorno de diagnóstico de rutina.

25 Existen al menos 500.000 microsatélites en el genoma humano y, dado que una MMR defectuosa no afecta a todos los
microsatélites de un tumor determinado, es importante estudiar más de un microsatélite y estudiar los microsatélites que
se ven afectados por inestabilidad con frecuencia. Como los marcadores de microsatélites se eligieron originariamente
de forma bastante aleatoria por los investigadores, basándose en sus propios experimentos, se celebró una conferencia
en Bethesda, MD, para discutir los problemas y hacer sugerencias para promover la coherencia entre estudios. Esta dio
30 como resultado una recomendación para un panel marcador "estándar de oro", conocido como el panel Bethesda 9. Este
panel consta de tres repeticiones dinucleotídicas (D2S123, D5S346, D17S250) y dos repeticiones mononucleotídicas
(BAT26, BAT25) y sigue siendo la prueba estándar para MSI. Se propuso considerar un tumor positivo en MSI si el 40%
o más de los marcadores analizados eran inestables (también denominados de MSI alto o MSI-H). Si se utiliza el panel
de cinco marcadores, esto significa que se denomina MSI cuando al menos dos de los mismos son positivos; no
35 obstante, a menudo cuatro o los cinco son positivos en tumores con MSI. Los tumores que dan negativo en los cinco
marcadores se denominan estables en microsatélites (MSS). Para los tumores que dieron positivo en 1 marcador tumoral
(o en < 30% de los marcadores tumorales), se propuso el término MSI-L9. Una repetición T-20 en la 3' UTR del gen
MTX1 se notificó como un marcador MSI adicional para el cáncer colorrectal (Morandi et al. 2011, Int J Colorectal Dis 27:
647-656).
40
Aunque el panel Bethesda todavía se considera el criterio a seguir, se sabe que tiene una sensibilidad bastante baja
(también dependiendo de qué gen MMR esté mutado). Por ejemplo, para pacientes con mutaciones MLH1, la
sensibilidad es del 80%, pero para pacientes con mutaciones MSH6, es de solo el 55%10. Esto se puede mejorar
añadiendo marcadores10 adicionales, pero aún así, los pacientes con MSI-H real pueden presentarse como MSI-L o
45 MSS. Esto no deja de ser significativo, ya que el estado de MSI es importante en el pronóstico (generalmente es mejor
para los pacientes con MSI-H11), el tratamiento (los tumores MSI-H no responden a la terapia adyuvante basada en
fluorouracilo (FU), ya que se necesita un sistema MMR intacto para inducir la apoptosis de células con ADN modificado
por FU11-13) y el diagnóstico de varios cánceres (por ejemplo, los del síndrome de Lynch), y los pacientes con cáncer
colorrectal (CCR) recién diagnosticado se criban de forma rutinaria para determinar el estado de MSI. Los inhibidores de
50 PARP (poli (ADP-ribosa) polimerasa) en el contexto de MSI y mutaciones de genes de reparación de ADN se abordan
por Gaymes et al. 2010 (Blood 116:513) y Vilar et al. 2011 (Cancer Res 71: 2632-2642; de forma específicamente
relacionada con la deficiencia en MRE11 en cáncer colorrectal). Se ha divulgado una clase específica de inhibidores de
PARP para el tratamiento de síndrome mielodisplásico y leucemia mieloide aguda (documento WO2012/166151).

55 Otra desventaja significativa es que el panel Bethesda solo se recomienda para el cáncer de colon, aunque se conocen
otros cánceres que muestran MSI9. Parece que esto se debe al hecho de que se identificó de forma bastante aleatoria
que los cinco marcadores estaban mutados en cáncer de colon inestable en microsatélites, pero no se conoce ningún
mecanismo biológico. En el contexto del síndrome de Lynch y MSI, se redactaron directrices Bethesda revisadas, tal
como se aborda por Umar et al. 2004 (J Nat Cancer Inst 96: 261-268).
60
Otra desventaja es de naturaleza técnica. El panel de marcadores Bethesda contiene repeticiones bastante largas (por
ejemplo, el marcador BAT26 contiene una repetición A de 26 nucleótidos), y los productos de PCR típicos utilizados para
determinar el estado de MSI se encuentran muy por encima de 100 pb. Para secuenciar con precisión estos fragmentos
y determinar la longitud exacta de la repetición, normalmente se utilizan procedimientos de secuenciación basados en
65 Sanger junto con electroforesis en gel multicapilar. Sin embargo, cada vez más laboratorios utilizan la secuenciación
denominada de "próxima generación", que emplea técnicas de secuenciación masivamente paralelas. Si bien son más
3
E13717473
ES 2 906 023 T3 11-02-2022

económicas, estas tecnologías utilizan lecturas más cortas y no pueden utilizarse para detectar inestabilidad
microsatelital en el panel de marcadores Bethesda. Como consecuencia, los laboratorios deben mantener dos
secuenciadores: uno para el cribado del panel de marcadores Bethesda y otro para otros experimentos. Sería mucho
más conveniente si no se requiriera un secuenciador especial para determinar el estado de MSI y esta determinación
5 pudiera realizarse en equipos de uso común. El documento US6664064 se refiere a un procedimiento para el análisis de
la curva de fusión de productos de PCR repetitivos.

Por lo tanto, sería ventajoso encontrar marcadores de inestabilidad microsatelital que fueran más sensibles que el
panel Bethesda que se utiliza actualmente y que conservaran al mismo tiempo la especificidad para MSI. De forma
10 ideal, estos marcadores se encuentran utilizando procedimientos de detección no sesgados (es decir, que observen
la totalidad del genoma en lugar de verificar regiones específicas que se supone que están alteradas en el contexto
de la enfermedad). Una ventaja adicional sería la identificación de marcadores que fueran indicativos de MSI como
tales. Es decir, que fueran un marcador general de inestabilidad microsatelital, y no solo de inestabilidad
microsatelital en el cáncer de colon (como es el caso del panel Bethesda). De hecho, esto evitaría la necesidad de
15 encontrar nuevos marcadores para cada cáncer en el que pueda haber presencia de MSI. Una ventaja adicional
sería la identificación de marcadores cuyo estado se pudiera determinar independientemente de la tecnología. Más
particularmente, marcadores que pudieran identificarse utilizando tecnologías de secuenciación de próxima
generación (en lugar de identificarse únicamente mediante secuenciación de Sanger). De esta forma, los
laboratorios no necesitan aferrarse a un aparato que solo utilizan para verificar los marcadores del panel Bethesda.
20 Además, también existe una gran necesidad de optimizar aún más las terapias específicas de MMR, por ejemplo
para predecir de forma más racional su respuesta a las terapias dirigidas. Además, existe la necesidad de encontrar
formas de superar la resistencia a las terapias de uso común, por ejemplo mediante la identificación de terapias a las
que los tumores deficientes en MMR sean sensibles, incluso aunque sean resistentes al tratamiento estándar.

25 Sumario

Es un objeto de la invención proporcionar mejores marcadores para determinar el estado de MSI de un cáncer
particular. Para asegurar que la detección no fuera sesgada, informamos en el presente documento, por primera
vez, de la secuenciación de próxima generación de tumores deficientes en la reparación de errores de
30 apareamiento. Los marcadores se eligen de forma que no estén en microsatélites largos, de modo que su detección
no dependa de la metodología de secuenciación de Sanger. Además, para ampliar la aplicabilidad de marcadores,
se evaluaron marcadores en diferentes tipos de tumores de modo que representaran marcadores de inestabilidad
microsatelital en varios cánceres, y no marcadores específicos del tipo de cáncer. Finalmente, se seleccionaron
marcadores que se encontraran de forma recurrente en los tumores. Es interesante señalar que muchas de las
35 mutaciones (de punto caliente) recurrentes agrupadas en genes afectan a la vía de reparación de roturas de doble
hebra de ADN, y podría demostrarse que esta vía también se ve afectada funcionalmente. Como resultado, se pudo
demostrar que los tumores positivos a estos marcadores son sensibles a la inhibición con inhibidores de enzimas de
reparación por escisión de bases de ADN, tales como los inhibidores de PARP: esto da como resultado una
interacción letal sintética.
40
Tal como se ampliará en la sección Ejemplos, la secuenciación de próxima generación permitió la identificación de
un nuevo panel de marcadores que puede utilizarse para detectar deficiencia en MMR y que estaba de acuerdo con
estas condiciones.

45 Los marcadores identificados se pueden dividir en dos clases: indeles presentes en regiones de microsatélites de
regiones codificantes (es decir, exones) e indeles presentes en regiones no codificantes (más particularmente
regiones 5' y 3' UTR) de genes específicos.

En consecuencia, en el presente documento se proporcionan procedimientos para diagnosticar el estado de MSI de


50 un tumor, que comprenden determinar la presencia de un indel en al menos dos regiones homopoliméricas en una
muestra del ADN del tumor, en los que las, al menos dos, regiones homopoliméricas son

- al menos dos regiones homopoliméricas presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en
la tabla 1, o
55
- al menos tres regiones homopoliméricas seleccionadas de las presentes en los exones de los genes
enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1,

en los que dichas regiones homopoliméricas son regiones de microsatélites que son repeticiones mononucleotídicas
60 de al menos 6 nucleótidos y que no exceden de 20 nucleótidos, y en los que la presencia de un indel en el 2% o más
de las regiones homopoliméricas es indicativa de MSI.

Según otras formas de realización particulares más, las regiones de microsatélites son idénticas a las regiones de
microsatélites identificadas en la tabla 1 o 2 (es decir, las, al menos dos, regiones de microsatélites se seleccionan
65 de la lista de regiones de microsatélites enumeradas en la tabla 1 o 2).

4
E13717473
ES 2 906 023 T3 11-02-2022

Según formas de realización específicas, las regiones de microsatélites presentes en las UTR pueden seleccionarse
de la tabla 4 en lugar de de la tabla 1. Según otras formas de realización específicas, estas regiones de
microsatélites se pueden seleccionar de la tabla 6 en lugar de de la tabla 1.

5 Según formas de realización específicas alternativas pero no exclusivas, las regiones de microsatélites presentes en
los exones de genes se pueden seleccionar de la tabla 5 en lugar de de la tabla 2. Según otras formas de realización
específicas, las regiones se pueden seleccionar de la tabla 7 en lugar de de la tabla 2.

Según formas de realización muy particulares, las regiones de microsatélites pueden seleccionarse de los genes
10 enumerados en la tabla 8.

Según formas de realización particulares, el cáncer o el tumor para el que se diagnostica el estado de MSI se
selecciona del grupo de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un
tumor del síndrome de Lynch.
15
Como los indeles presentes en microsatélites de regiones no codificantes (tales como las regiones 5' y 3' UTR) están
sujetos a menos presión de selección que los indeles presentes en regiones codificantes (dado que estos últimos
causan mutaciones de desplazamiento de marco que dan como resultado una traducción completamente diferente
de la original), pudo demostrarse que los indeles presentes en microsatélites de regiones no codificantes son
20 marcadores más fiables de MSI en todos los tipos de cáncer. De hecho, más del 50% de los marcadores no
codificantes identificados en el presente documento obtienen resultados positivos cuando se someten a ensayo en
tumores deficientes en MMR con MSI comprobada. Para los marcadores exónicos, todavía más de 1/3 obtuvo
resultados positivos cuando se sometieron a ensayo en estos tumores. Esto explica por qué se prevé utilizar al
menos tres marcadores cuando al menos parte de los marcadores se encuentren en regiones exónicas.
25
También se prevé particularmente utilizar combinaciones de marcadores presentes en regiones exónicas y
marcadores presentes en regiones no codificantes. Por ejemplo, según formas de realización particulares, las, al
menos dos, regiones de microsatélites en las que se determina la presencia de un indel son al menos dos regiones
de microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la
30 tabla 1 y en al menos dos regiones de microsatélites seleccionadas de las presentes en los exones de los genes
enumerados en la tabla 2.

Según formas de realización específicas, se prevé utilizar más marcadores que al menos dos o tres. El uso de más
marcadores normalmente producirá un diagnóstico más preciso (aunque este beneficio deberá compensarse con un
35 aumento de los costes. Además, una vez que se supera un determinado umbral de marcadores, el valor relativo de
añadir otro marcador es limitado, ya que no necesariamente añade información). Por lo tanto, según formas de
realización particulares, se utilizan al menos cuatro, cinco, seis, siete u ocho marcadores (es decir, indeles presentes
en regiones de microsatélites seleccionadas de entre las presentes en los exones de los genes enumerados en la
tabla 2 y/o las presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1). Según otras
40 formas de realización particulares, la presencia de al menos 8, 9, 10, 11 o 12 indeles en regiones de microsatélites
seleccionadas de entre las presentes en los exones de los genes enumerados en la tabla 2 y/o las presentes en las
regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1 se utilizan para determinar el estado de MSI.
Según incluso otras formas de realización particulares, se utilizan todavía más marcadores, por ejemplo al menos
15, al menos 20, al menos 25, al menos 30, al menos 35, al menos 40 marcadores o al menos 50 marcadores.
45
Según formas de realización específicas, al menos un marcador utilizado es un marcador exónico presente en un
gen no asociado previamente con cáncer, o en un gen que no se sabía previamente que estuviera afectado en
tumores deficientes en MMR. Por lo tanto, se prevé que el microsatélite o los microsatélites seleccionados de entre
los presentes en los exones de los genes enumerados en la tabla 2 comprendan al menos un microsatélite presente
50 en un gen seleccionado de la lista de: SETD1B, RBMXL1, CCDC150, OR7E24, C15orf40, KIAA2018, LTN1,
SLC22A9, CDH26, DDX27, EXOSC9, FAM111B, KIAA0182, KIAA1919, MIS18BP1, PRRT2, TMEM60, AQP7,
ARV1, CCDC168, ELAVL3, F8, FETUB, HPS1, NBEAL1, P4HTM, PIGB, RBM43, RG9MTD1, SRPR, y TMEM97.
Según formas de realización aún más específicas, al menos un microsatélite está presente en un gen seleccionado
de la lista de: SETD1B, TMEM60, DDX27, EXOSC9, FAM111B y KIAA1919. Según formas de realización
55 alternativas, SEC31A, CNOT2, RNF145, RNPC3, SLC35F5, TMBIM4, CD3G, DOCK3, MYO10 y PRRG1 también
pueden utilizarse en estas listas.

Según formas de realización específicas alternativas, al menos un marcador utilizado es un indel presente en un
homopolímero de entre 10 y 15 bases de repetición situado en una región 5' o 3' UTR.
60
Un panel de marcadores particularmente previsto son los microsatélites presentes en los genes que se muestran
en la tabla 3. Por lo tanto, según estas formas de realización, se proporcionan procedimientos en los que se
determina la presencia de un indel en al menos dos regiones de microsatélites en una muestra del ADN tumoral,
en los que las, al menos dos, regiones de microsatélites son regiones de microsatélites de los 56 genes que se
65 muestran en la tabla 3.

5
E13717473
ES 2 906 023 T3 11-02-2022

Según formas de realización particulares, el estado de MSI se puede caracterizar además de la forma siguiente: si el
17% o más de las regiones de microsatélites estudiadas contienen un indel, el tumor es MSI-H, si entre el 2% y el
17% de las regiones de microsatélites contiene un indel, el tumor es MSI-L, y si menos del 2% de las regiones de
microsatélites contienen un indel, el tumor es estable en microsatélites (MSS). A modo de ejemplo, para un panel de
5 56 marcadores, si 0 o 1 marcadores son positivos, el tumor se clasifica como MSS, para 2 a 9 marcadores positivos,
el tumor es MSI-L, y para 10 o más marcadores positivos, el tumor se clasifica como MSI-H. Alternativamente, el
intervalo del panel Bethesda se puede extrapolar (0 de 10 marcadores positivos es MSS, 1 o 2 de cada 10
marcadores positivos es MSI-L, 3 o más marcadores positivos es MSI-H; que corresponde a límites de entre el 1 y el
9% de marcadores positivos para la distinción entre MSS y MSI-L y de más del 20% de marcadores positivos para la
10 clasificación como MSI-H).

Según un aspecto específico, los marcadores de indeles de microsatélites proporcionados en el presente documento
pueden detectarse independientemente de la tecnología utilizada. Sin embargo, se prevé particularmente que la
determinación de la presencia de un indel no se realice mediante un procedimiento basado en la secuenciación de
15 Sanger. Esto se debe a que el proceso de detección de la inestabilidad microsatelital utilizando el panel de
marcadores Bethesda se realiza normalmente mediante la secuenciación de Sanger, un protocolo que resulta
bastante engorroso. Según formas de realización adicionales, se prevé particularmente determinar la presencia de
un indel por medio de procedimientos de extensión de un único par de bases (tales como Sequenom MassArray),
tecnologías de hibridación de ADN (por ejemplo, Taqman), análisis de la curva de fusión (incluido HRM) o una
20 tecnología similar.

Según otro aspecto, se proporciona el uso de un panel de biomarcadores tal como se describe en las
reivindicaciones 18 a 24 para determinar la MSI en una muestra tumoral. Según formas de realización particulares,
el panel de biomarcadores comprende al menos la mitad de las regiones de microsatélites enumeradas en la tabla 3.
25 Según otras formas de realización particulares más, el panel de biomarcadores está representado por las 56
regiones de microsatélites enumeradas en la tabla 3.

En particular, se prevé que este panel de biomarcadores pueda utilizarse para detectar el estado de MSI en un
cáncer. En consecuencia, el uso de este panel de biomarcadores se proporciona en el diagnóstico de inestabilidad
30 microsatelital en cáncer.

En consecuencia, los paneles de biomarcadores descritos en el presente documento se proporcionan para su uso
como diagnóstico. Incluso más particularmente, los paneles de biomarcadores tal como se describen en el presente
documento se proporcionan para su uso en el diagnóstico de inestabilidad microsatelital en cáncer.
35
Tal como se muestra en la sección Ejemplos, los marcadores de indeles proporcionados en el presente documento
están enriquecidos en genes implicados en las vías de reparación de roturas de doble hebra de ADN y afectan a su
funcionalidad. Como consecuencia, las células en las que están presentes estos marcadores son sensibles a
letalidad sintética por inhibición de la reparación por escisión de bases de ADN. Esto ofrece nuevas oportunidades
40 terapéuticas, ya que los tumores positivos en MSI a menudo son resistentes a las quimioterapias estándar utilizadas.

En consecuencia, en un aspecto adicional, se proporcionan procedimientos de cribado de la sensibilidad de las


células cancerosas al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN, que
comprende determinar el estado de MSI en las células cancerosas. Según formas de realización particulares, el
45 inhibidor de una enzima de reparación por escisión de bases de ADN es un inhibidor de PARP. Según formas de
realización específicas, las células cancerosas son de un cáncer seleccionado de la lista de: cáncer colorrectal,
cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un tumor del síndrome de Lynch. Aunque estos
procedimientos pueden realizarse en principio in vivo, ex vivo e in vitro, se prevé particularmente que se realicen in
vitro.
50
Según formas de realización particulares, la presencia de MSI es indicativa de la sensibilidad de las células
cancerosas al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN; es decir, las
células cancerosas morirán, dejarán de crecer o proliferarán menos cuando se traten con dicho inhibidor.

55 Según formas de realización específicas, las células cancerosas son células obtenidas de un sujeto, y el cribado de
la sensibilidad al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN se utiliza
para guiar el tratamiento del sujeto. Según formas de realización alternativas, el cribado de sensibilidad se usa para
estratificar o clasificar al sujeto para un ensayo clínico.

60 Según formas de realización particulares, la presencia de MSI se establece mediante un procedimiento descrito en
el presente documento. Según formas de realización particulares adicionales, la presencia de MSI se establece
utilizando un panel de biomarcadores tal como se describe en las reivindicaciones 18 a 24.

Por lo tanto, no solo se proporcionan procedimientos para detectar la sensibilidad de las células cancerosas, sino
65 también procedimientos para diagnosticar la sensibilidad de un sujeto con cáncer al tratamiento con un inhibidor de
una enzima de reparación por escisión de bases de ADN, que comprende las etapas siguientes:
6
E13717473
ES 2 906 023 T3 11-02-2022

- determinar el estado de MSI en una muestra de células cancerosas obtenidas del sujeto;

- correlacionar el estado de MSI con la sensibilidad al tratamiento con un inhibidor de una enzima de reparación
5 por escisión de bases de ADN, siendo la presencia de MSI indicativa de sensibilidad al tratamiento.

Opcionalmente, estos procedimientos contienen una etapa adicional de obtención de una muestra de células
cancerosas del sujeto (antes de la etapa de determinación). La determinación del estado de MSI generalmente se
realiza en las células de la muestra obtenida. En particular, se prevé que la determinación del estado de MSI en una
10 muestra de células cancerosas se realice in vitro.

Según formas de realización particulares, el inhibidor de una enzima de reparación por escisión de bases de ADN es
un inhibidor de PARP. Según formas de realización específicas, las células cancerosas son de un cáncer
seleccionado de la lista de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un
15 tumor del síndrome de Lynch (o cualquier otro tumor del espectro del síndrome de Lynch). Según formas de
realización particulares, la presencia de MSI se establece mediante un procedimiento descrito en el presente
documento.

Según formas de realización particulares adicionales, la presencia de MSI se establece utilizando un panel de
20 biomarcadores tal como se describe en las reivindicaciones 18 a 24 en el presente documento.

También se prevé que los procedimientos según este aspecto pueden contener una etapa adicional de tratamiento
del sujeto con un inhibidor de una enzima de reparación por escisión de bases del ADN (si el sujeto es sensible a
dicho tratamiento, según se ha determinado mediante el estado de MSI).
25
Por lo tanto, también se proporcionan procedimientos para tratar un cáncer con MSI en un sujeto que lo necesite,
que comprenden:

- establecer la presencia de MSI en el cáncer;


30
- administrar un inhibidor de una enzima de reparación por escisión de bases de ADN al sujeto.

Se prevé que el cáncer se trate mediante la administración del inhibidor al sujeto. Los procedimientos pueden
presentar opcionalmente una etapa adicional de obtención de una muestra de células cancerosas del sujeto (antes
35 de la etapa de determinación de MSI y de establecer la presencia de MSI).

Según formas de realización particulares, el inhibidor de una enzima de reparación por escisión de bases de ADN es
un inhibidor de PARP. Según formas de realización específicas, las células cancerosas son de un cáncer
seleccionado de la lista de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un
40 tumor del síndrome de Lynch. Según formas de realización particulares, la presencia de MSI se establece mediante
un procedimiento descrito en el presente documento.

Según formas de realización particulares adicionales, la presencia de MSI se establece utilizando un panel de
biomarcadores tal como se describe en las reivindicaciones 18 a 24 en el presente documento.
45
Breve descripción de las figuras

Figura 1. Sustituciones somáticas e indeles en el hipermutador deficiente en MSH6.

50 (a) Frecuencias de mutación promedio (número de mutaciones por base, mpb) en el tumor deficiente en MMR y en
dos tumores competentes en MMR. (b) Frecuencia de mutación estratificada por indeles y sustituciones. (c-d) La
fracción de indeles (c) y sustituciones (d) observada en microsatélites, homopolímeros (longitud superior a 5 pb),
homopolímeros cortos (longitud de 3 a 5 pb) y "regiones no en repetición" en comparación con su fracción esperada
en estas regiones. (e-f) Frecuencias de indeles (e) y sustituciones (f) en el tumor deficiente en MMR estratificadas en
55 regiones exónicas, intergénicas e intrónicas.

Figura 2. Sustitución somática y patrones de indeles en el hipermutador deficiente en MSH6.

(a) Patrones de sustitución somática en secuencias de genoma completo de melanoma, cáncer de pulmón de
60 células pequeñas, cáncer de pulmón de células no pequeñas, tumor endometrial deficiente en MMR, dos tumores
endometriales competentes en MMR y ADN de línea germinal correspondiente (glóbulos blancos periféricos) del
paciente con tumor endometrial. (b-c) Estratificación de la frecuencia de sustitución somática en tumores deficientes
en MMR (b) y competentes en MMR (c) por dinucleótido, estando el primer nucleótido mutado. Las frecuencias de
sustitución normalizadas reflejan el número de dinucleótidos afectados dividido por el número de esos dinucleótidos
65 en el genoma completo, expresado como porcentaje de las frecuencias de sustitución totales. (d) Modelado de
regresión lineal multivariante de características del genoma que predicen frecuencias de sustituciones en el tumor
7
E13717473
ES 2 906 023 T3 11-02-2022

deficiente en MMR. Se muestran mapas de calor de los datos de características del genoma ordenados según el
número de sustituciones que visualizan las correlaciones entre las frecuencias de sustitución y las características del
genoma. Los valores T resultantes del modelo lineal se muestran para cada característica del genoma en los
gráficos de barras a la derecha de los mapas de calor e indican la importancia (el sombreado en gris es igual a P >
5 0,01) y la dirección de la correlación. Para acomodar las diferentes escalas de cada característica en un solo mapa
de calor, los datos de características del genoma se muestran distribuidos por percentiles, indicando el blanco y el
rojo, respectivamente, los centiles bajo y alto. Las transiciones G:C>A:T en sitios CpG se agruparon en ventanas de
10 Mb ya que los números eran insuficientes para el modelado por ventana de 1 Mb. (e) Frecuencia de
sustituciones, transiciones (excluidas G:C>A:T en CG) y transversiones en el hipermutador por ventana de 1 Mb,
10 frente al tiempo de replicación de esa ventana agrupada por decil. Las frecuencias se muestran en relación con las
ventanas que se replican más temprano. Las barras de error indican el error estándar de la media (P < 0,01 para
sustituciones y transiciones en tiempos de replicación superiores a 0,2). (f) Frecuencia de sustituciones, transiciones
(excluidas G:C>A:T en CG) y transversiones dentro y fuera de las islas CpG, con respecto a su frecuencia en el
genoma completo en el hipermutador. (g) Modelado de regresión lineal multivariante de características del genoma
15 que predicen la frecuencia de indeles en el tumor deficiente en MMR. El mapa de calor y el gráfico de barras son tal
como se describen para el panel (d). (h) Fracción de homopolímeros afectados por un indel estratificada por
nucleótido en el tumor deficiente en MMR en comparación con la fracción en el genoma completo de homopolímeros
con ese contenido de nucleótidos. (i) Fracción de todos los indeles que insertan o eliminan el número de bases
indicado. (j-k) La distancia entre una sustitución somática y el indel (j) o sustitución (k) somáticos más cercanos en el
20 hipermutador, y la distancia esperada basada en 200 modelos aleatorios.

Figura 3. Patrones de mutación somática de 10 exomas deficientes en MMR.

(a) Frecuencias de mutación promedio en los exones codificantes de 10 tumores deficientes en MMR y 4 tumores
25 competentes en MMR. (b) Frecuencia de mutación promedio en los exones codificantes de 10 tumores deficientes
en MMR frente a 4 tumores competentes en MMR estratificada para indeles y sustituciones. (c-d) Estratificación de
frecuencias de sustitución por dinucleótido (estando el primer nucleótido mutado) en exones deficientes en MMR (c)
y un conjunto de sustituciones de novo de la línea germinal publicadas (d). Las frecuencias de sustitución
normalizadas representadas en la gráfica reflejan el número de dinucleótidos afectados dividido por el número de
30 esos dinucleótidos en el genoma completo y expresado como porcentaje del total de frecuencias de sustitución
somática. (e) La fracción de indeles observada en microsatélites, homopolímeros, homopolímeros cortos y en
regiones no en repetición en tumores deficientes en MLH1 y MSH2 en comparación con la fracción del genoma
completo de estas regiones.

35 Figura 4. Mutaciones de punto caliente en el exoma, 5' y 3' UTR de tumores deficientes en MMR.

(a) Fracción de homopolímeros en función de su longitud en regiones codificantes, 5' y 3' UTR. (b) Fracción de
homopolímeros afectados por un indel en función de la longitud del homopolímero para regiones codificantes, 5' y 3'
UTR. (c) Frecuencias medias de indeles somáticos en las regiones codificantes, 5' y 3' UTR de tumores deficientes
40 en MMR. (d) Fracción de homopolímeros afectados de forma recurrente por un indel en función de la longitud del
homopolímero para las regiones codificantes, 5' y 3' UTR.

Figura 5. El panel de mutación de punto caliente Bethesda y 56 marcadores para evaluar la MSI. El panel Bethesda
ampliado y un panel de 56 mutaciones de punto caliente en exones, 5' y 3' UTR identificadas por secuenciación del
45 exoma se analizaron en una serie independiente de 114 tumores endometriales primarios no seleccionados. Los
resultados se codificaron por colores según estado de inestabilidad microsatelital alta (MSI-H), inestabilidad
microsatelital baja (MSI-L) o estable en microsatélites (MSS) basándose en el panel Bethesda ampliado.

Figura 6. Mutaciones somáticas que afectan a la vía de reparación de DSB de ADN por HR. Diagrama de la vía de
50 reparación de DSB por HR (adaptado del diagrama de la vía de recombinación homóloga IPA). Los genes marcados
en naranja (con fondo gris) portan mutaciones somáticas en nuestro propio conjunto de tumores deficientes en MMR
o en tumores MSI-H del conjunto de datos TCGA disponible públicamente.

Figura 7. Las células deficientes en MMR son sensibles a la inhibición de PARP.


55
(a) Imágenes confocales representativas de células tumorales primarias deficientes en MMR y competentes en MMR
expuestas a olaparib 0 o 10 µM teñidas por el marcador de reparación de ADN RAD51 (verde) y contrateñidas con
DAPI (azul). Las flechas (amarillas) indican células positivas a RAD51 que contienen más de 5 focos nucleares
verdes. (b) Cuantificación de células que contienen > 5 focos de RAD51. Se muestran los promedios para cultivos de
60 8 células deficientes en MMR diferentes y 4 células competentes en MMR diferentes a las 24 horas después del
tratamiento con olaparib (10 µM) o control de vehículo. (c-d) Proliferación celular promedio de 8 células deficientes
en MMR (c) y 4 células competentes en MMR (d) con concentraciones crecientes de olaparib (1 µM, 3 µM, 10 µM).
La proliferación celular en tiempo real se midió utilizando el sistema xCELLigence RTCA DP (Roche Applied
Science) hasta 48 horas después del tratamiento. Los valores se normalizan con respecto al control tratado de forma
65 simulada (olaparib 0 µM). Las barras de error representan el error estándar de medias. Un asterisco indica una
diferencia estadísticamente significativa entre las células tratadas frente a las tratadas de forma simulada en el punto
8
E13717473
ES 2 906 023 T3 11-02-2022

temporal indicado (P < 0,05). (e) Tasas de proliferación celular para cada uno de los cultivos celulares (las células
deficientes en MMR se muestran en azul (8 inferiores en el gráfico) y las células competentes en MMR se muestran
en rojo (cuatro superiores en el gráfico)). En resumen, las células deficientes en MMR se caracterizaron por una
disminución de la proliferación dependiente de la dosis, mientras que las células competentes en MMR no
5 respondieron a olaparib (P = 2,0E-7 mediante medición repetida; véase también la figura 7c).

Descripción detallada

Definiciones
10
La presente invención se describirá con respecto a formas de realización particulares y con referencia a
determinados dibujos, pero la invención no se limita a las mismas, sino únicamente a las reivindicaciones. Cualquier
signo de referencia en las reivindicaciones no se interpretará como una limitación del alcance. Los dibujos descritos
son solo esquemáticos y no limitantes. En los dibujos, el tamaño de algunos de los elementos puede estar
15 exagerado y no estar dibujado a escala con fines ilustrativos. Cuando se utiliza en la presente descripción y las
reivindicaciones el término "que comprende", no excluye otros elementos o etapas. Si se utiliza un artículo indefinido
o definido cuando se hace referencia a un sustantivo singular, por ejemplo "un" o "una", "el" o "la", este incluye un
plural de ese sustantivo a menos que se indique específicamente lo contrario.

20 Además, los términos primero, segundo, tercero y similares en la descripción y en las reivindicaciones se utilizan
para distinguir entre elementos similares y no necesariamente para describir un orden secuencial o cronológico.
Debe entenderse que los términos así utilizados son intercambiables en circunstancias apropiadas y que las formas
de realización de la invención descritas en el presente documento pueden funcionar en otras secuencias diferentes a
las descritas o ilustradas en el presente documento.
25
Los siguientes términos o definiciones se proporcionan únicamente para ayudar en la comprensión de la invención.
A menos que se definan específicamente en el presente documento, todos los términos utilizados en el presente
documento tienen el mismo significado que tendrían para un experto en la técnica de la presente invención. Los
facultativos se dirigen particularmente a Sambrook et al., Molecular Cloning: A Laboratory Manual, 2ª ed., Cold
30 Spring Harbor Press, Plainsview, Nueva York (1989); y Ausubel et al., Current Protocols in Molecular Biology
(Suplemento 47), John Wiley & Sons, Nueva York (1999), para obtener definiciones y términos de la técnica. Las
definiciones proporcionadas en el presente documento no deben interpretarse de forma que tengan un alcance
inferior al comprendido por un experto en la técnica.

35 El término "microsatélite" o "regiones de microsatélites", tal como se utiliza en el presente documento, se refiere a
repeticiones mono-, di-, tri-, tetra-, penta- o hexanucleotídicas en una secuencia de nucleótidos, que consta de al
menos dos unidades repetidas y que presenta una longitud mínima de 6 bases. Una subclase particular de
microsatélites incluye los homopolímeros.

40 "Homopolímero", tal como se utiliza en el presente documento, se refiere a una región de microsatélites que es una
repetición de mononucleótidos de al menos 6 bases; en otras palabras, un tramo de al menos 6 residuos
consecutivos A, C, T o G si se considera al nivel del ADN. Más particularmente, al determinar los microsatélites, se
considera el ADN genómico de un sujeto (o el ADN genómico de un cáncer presente en el sujeto).

45 El término "estado de MSI", tal como se utiliza en la solicitud, se refiere a la presencia de inestabilidad microsatelital
(MSI), un cambio clonal o somático en el número de unidades de nucleótidos de ADN repetidas en microsatélites. El
estado de MSI puede ser uno de tres clases discretas: MSI-H, también conocido como MSI alta, MSI positiva o MSI,
MSI-L, también conocido como MSI baja, o estabilidad en microsatélites (MSS), también conocido como ausencia de
MSI. Por lo general, para ser clasificado como MSI-H, al menos el 20% de los marcadores utilizados para clasificar
50 el estado de MSI deben tener una puntuación positiva, mientras que para la clasificación de MSS, menos del 2,5%
tiene una puntuación positiva. Si un número intermedio de marcadores tiene una puntuación positiva, el tumor se
clasifica como MSI-L. Téngase en cuenta que, como estos límites iniciales se derivan del panel de marcadores
Bethesda ampliado (que consta de solo 10 marcadores), dado que normalmente se evaluarán menos de 100
marcadores y el número de marcadores positivos es un número entero, los porcentajes son aproximados. La
55 diferencia entre MSS y MSI-L se encontrará típicamente entre el 1 y el 9% de los marcadores que obtienen una
puntuación positiva (cuando se evalúan 10 marcadores, esto significa que 1 marcador positivo da como resultado
una clasificación MSI-L), mientras que la diferencia entre MSI-L y MSI-H se encontrará generalmente entre el 15 y el
25% de marcadores positivos (es decir, por encima de ese umbral, un tumor es MSI-H, por debajo del mismo es
MSI-L). Alternativamente, en lugar de realizar la distinción en tres clases, solo se evalúa la diferencia entre presencia
60 y ausencia de inestabilidad microsatelital, en cuyo caso el estado es presencia de MSI o ausencia de MSI (= MSS).
Teniendo en cuenta la correlación entre la ausencia de un sistema intacto de reparación de errores de apareamiento
(MMR) y la presencia de MSI, diagnosticar la presencia de MSI (o diagnosticar el estado de MSI) puede interpretarse
como un diagnóstico de deficiencia en MMR. Sin embargo, téngase en cuenta que la MMR puede ser funcional o
deficiente, no existe una clase intermedia. Por lo tanto, MSI-L también corresponde a deficiencia en MMR; esta
65 situación equivale a evaluar solo la presencia o ausencia de MSI.

9
E13717473
ES 2 906 023 T3 11-02-2022

"Diagnosticar el estado de MSI de un tumor" o "diagnosticar el estado de MSI de un tumor presente en un sujeto" o
"diagnosticar el estado de MSI de un sujeto" o "determinar el estado de MSI de un tumor (o sujeto)" se consideran
sinónimos en el presente documento. Determinar (o diagnosticar) el estado de MSI normalmente implica extraer la
conclusión de MSI basándose en la detección de la presencia de uno o más indeles en las regiones de
5 microsatélites en investigación, o la conclusión de la ausencia de inestabilidad microsatelital basada en no detectar
indeles en las regiones de microsatélites en investigación. En consecuencia, "determinar la presencia de un indel" en
una región de microsatélites significa evaluar o detectar la presencia o la ausencia de un indel en dicha región de
microsatélites. Asimismo, determinar la presencia de un indel en al menos dos regiones de microsatélites significa
evaluar o detectar la presencia o ausencia de un indel en cada una de dichas, al menos dos, regiones de
10 microsatélites. La presencia de al menos un indel es indicativa de MSI (tal como se explica en la solicitud, el número
exacto de marcadores positivos necesarios para establecer MSI dependerá del número de marcadores utilizados).

Un "indel", tal como se utiliza en el presente documento, se refiere a una clase de mutación que incluye tanto
inserciones como deleciones y la combinación de las mismas. Un indel en una región de microsatélites da como
15 resultado una ganancia o una pérdida neta de nucleótidos. La presencia de un indel se puede establecer mediante
comparación con el ADN en el que no está presente (por ejemplo, mediante comparación del ADN de una muestra
tumoral con el ADN de la línea germinal del sujeto que tiene el tumor) o, especialmente en el caso de microsatélites
u homopolímeros monomórficos, mediante comparación con la longitud conocida del microsatélite, en particular
contando el número de unidades repetidas. Según formas de realización específicas, los indeles particularmente
20 contemplados tienen una longitud de entre 1 y 5 nucleótidos (es decir, la longitud del microsatélite u homopolímero
es de 1 a 5 nucleótidos más larga o más corta que la longitud normal conocida del microsatélite u homopolímero).
Según otras formas de realización específicas, los indeles tienen una longitud de 1 a 4 nucleótidos, 1 a 3 nucleótidos
o 1 o 2 nucleótidos. Téngase en cuenta que, como los indeles pueden ser una combinación de una inserción y una
deleción, la secuencia de ácido nucleico alterada puede ser mayor que la diferencia de longitud (por ejemplo, una
25 deleción de 5 nucleótidos combinada con una inserción de 3 nucleótidos conduce a una longitud alterada de 2, pero
la secuencia del microsatélite también puede haber cambiado). Sin embargo, más típicamente, un indel será una
inserción o una deleción, típicamente de 1 o 2 nucleótidos.

Un "microsatélite monomórfico" es aquel en el que todos los individuos, en particular todos los individuos de una
30 población determinada, comparten el mismo número de unidades de repetición. Este se diferencia de un
"microsatélite polimórfico", que se utiliza para referirse a microsatélites en los que más del 1% de una población
determinada muestra heterocigosidad por el número de unidades de repetición. A modo de ejemplo, el marcador
BAT26 está compuesto por 26 adeninas en más del 99% de los europeos étnicos, mientras que los alelos con
diferentes números de adeninas en esta ubicación (por ejemplo, 15, 20, 22, 23) se observan hasta en el 25% de
35 africanos étnicos, incluidos los afroamericanos17. Por lo tanto, BAT26 es un microsatélite monomórfico en los
europeos y un microsatélite polimórfico en los africanos16.

Una "muestra de ADN tumoral" se refiere a cualquier muestra que pueda usarse como base para la secuenciación
en la que esté presente ADN de un cáncer. El término "cáncer", tal como se utiliza en el presente documento, se
40 refiere a diferentes enfermedades que implican el crecimiento celular no regulado, también denominado neoplasia
maligna. El término "tumor" se utiliza como sinónimo en la solicitud. Se prevé que este término abarque todos los
tipos de tumores sólidos (carcinoma, sarcoma, blastoma), pero también abarca explícitamente tipos de cáncer no
sólidos tales como leucemia, linfoma o mieloma. Por lo tanto, una "muestra de ADN tumoral" también puede ser una
muestra de sangre de una persona con leucemia. Normalmente, una muestra de ADN tumoral se ha aislado en un
45 punto de un sujeto, particularmente un sujeto con cáncer. Opcionalmente, se ha sometido a una o más formas de
pretratamiento (por ejemplo, lisis, fraccionamiento, separación, purificación) con el fin de secuenciar el ADN, aunque
también se prevé que el ADN se secuencie de una muestra no tratada. Tal como se utiliza en el presente
documento, el sustantivo "sujeto" se refiere a un vertebrado individual, más particularmente a un mamífero individual,
de la forma más particular a un ser humano individual. Un "sujeto", tal como se utiliza en el presente documento es
50 típicamente un ser humano, pero también puede ser un mamífero, particularmente animales domésticos tales como
gatos, perros, conejos, cobayas, hurones, ratas, ratones y similares, o animales de granja tales como caballos,
vacas, cerdos, cabras, ovejas, llamas y similares. Un sujeto también puede ser un vertebrado no mamífero, tal como
un pez, un reptil, un anfibio o un ave; en esencia, cualquier animal que pueda desarrollar cáncer cumple con la
definición.
55
El término "cáncer colorrectal", tal como se utiliza en el presente documento, incluye neoplasias malignas de colon
(C18 en ICD-10), neoplasias malignas de la unión rectosigmoidea (C19 en ICD-10), neoplasias malignas del recto
(C20 en ICD-10) y neoplasias malignas del ano y del canal anal (C21 en ICD-10).

60 El término "síndrome de Lynch", tal como se utiliza en el presente documento, se refiere a una afección genética
autosómica dominante que tiene un alto riesgo de desarrollar cáncer de colon o colorrectal, así como otros cánceres
que incluyen cáncer endometrial, de ovario, de estómago, de intestino delgado, del aparato hepatobiliar, del aparato
urinario superior, del cerebro y de piel. El mayor riesgo de estos cánceres se debe a mutaciones heredadas que
alteran la reparación de errores de apareamiento del ADN. El nombre antiguo de la afección es HNPCC.
65

10
E13717473
ES 2 906 023 T3 11-02-2022

Un "inhibidor de una enzima de reparación por escisión de bases de ADN", tal como se utiliza en el presente
documento se refiere a una sustancia que puede interferir con la función de reparación por escisión de bases del
producto génico, ya sea a nivel del ADN (inhibiendo la formación del producto génico relevante, es decir, previniendo
la transcripción o interfiriendo con la misma), a nivel de ARN (neutralizando o desestabilizando el ARNm para
5 prevenir la traducción o interferir con la misma) o a nivel de proteína (neutralizando o inhibiendo la proteína
involucrada en BER). Se prevé particularmente que el inhibidor sea un inhibidor de PARP, ya que dichos inhibidores
están bien caracterizados. Se prevén más particularmente los inhibidores de PARP-1 y/o de PARP-2, ya que estas
enzimas son las PARP más activamente implicadas en BER. Sin embargo, los inhibidores de otras PARP también
pueden ser útiles. A este respecto, publicaciones recientes sugieren que el inhibidor de PARP iniparib, cuyo uso está
10 explícitamente previsto, inhibe otras PARP distintas de PARP-1 y 2, en particular PARP-5 y 6 (Ji J, Lee MP, Kadota
M, et al. Pharmacodynamic and pathway analysis of three presumed inhibitors of poly (ADP-ribose) polymerase:
ABT-888, AZD 2281 y BSI201. Actas de la 102ª Reunión Anual de la Asociación Estadounidense para la
Investigación del Cáncer; 2-6 de abril de 2011; Orlando, Fla. AACR. 2011. Resumen Nº 4527; Maegley KA, Bingham
P, Tatlock JH et al. All PARP inhibitors are not equal: an in vitro mechanistic comparison of PF-01367338 to iniparib.
15 J Clin Oncol. 2011; 29 (supl; resumen e13576); Nagourney RA, Kenyon KR, Francisco FR, et al. Functional analysis
of PARP inhibitors AZD 2281 and BSI-201 in human tumor primary cultures: a comparison of activity and
examination of synergy with cytotoxic drugs. J Clin Oncol. 2011; 29 (supl; resumen e13599)).

Los ejemplos de inhibidores de PARP incluyen, pero sin limitación: iniparib, olaparib, rucaparib, veliparib, CEP 9722,
20 MK 4827, BMN-673 y 3-aminobenzamida.

Descripción

Los errores de replicación del ADN que se producen en células deficientes en la reparación de errores de
25 apareamiento (MMR) persisten como mutaciones de errores de apareamiento y predisponen a una serie de tumores.
A este respecto, se secuenciaron los primeros genomas de tumores deficientes en MMR, lo que permitió la
evaluación no sesgada de errores de replicación del ADN. Se observó que las tasas de mutación aumentaron
drásticamente con respecto a tumores competentes en MMR. Las mutaciones de inserción o deleción (indel) se
produjeron con mayor frecuencia y se limitaron en gran medida a tramos homopoliméricos, mientras que las
30 sustituciones de un solo par de bases consistieron principalmente en transiciones A:T>G:C y G:C>A:T y se ubicaron
con mayor frecuencia cerca de indeles. Como las tasas de sustituciones fueron más altas en los indeles somáticos
cercanos, esto sugiere que las mutaciones de indel actúan como sitios mutagénicos durante la replicación del ADN.
Debido a la selección clonal negativa, las tasas de mutación somática fueron inferiores en el exoma que en el resto
del genoma, mientras que debido a la selección positiva, se produjeron algunas mutaciones exónicas en varios
35 tumores deficientes en MMR. Estas mutaciones recurrentes afectaron específicamente a los genes expresados en el
tejido correspondiente normal, lo que sugiere que representan impulsores de la progresión tumoral deficiente en
MMR.

Curiosamente, los indeles se ubicaron principalmente en homopolímeros, en particular en homopolímeros de mayor


40 longitud. Estas observaciones también tienen una implicación clínica inmediata. El panel Bethesda ampliado,
utilizado actualmente para la clasificación diagnóstica de tumores MSI9,14-15 tiene una sensibilidad limitada, es decir,
el 80%, el 84% y el 55% para tumores deficientes en MLH1, MSH2 y MSH616, presumiblemente porque este panel
consta de 8 microsatélites y solo 2 marcadores de homopolímeros, respectivamente, con una longitud de 25 y 26
nucleótidos. Al aplicar nuestro panel de 56 indeles recurrentes a 114 tumores endometriales, pudimos demostrar que
45 hasta el 43% de los tumores presentaban un grado variable de MSI. Este fue significativamente más alto de lo que
se informó anteriormente, muy probablemente porque estos indeles no se seleccionaron aleatoriamente, sino que se
identificaron a través de una evaluación no sesgada de mutaciones que afectan de forma recurrente al exoma y las
5' y 3' UTR. También observamos que los indeles recurrentes en los tumores endometriales se ubicaron en tumores
MMR de otros tipos de cáncer. Dado que los indeles en las 3' UTR solo están determinados por la longitud del
50 homopolímero afectado, mientras que en el exoma deben seleccionarse positivamente en genes expresados por el
tejido de origen, la mayor parte de los indeles compartidos entre varios tipos de cáncer se ubicaron en las 5' y 3'
UTR. Por lo tanto, las mutaciones recurrentes en las 5' y 3' UTR u otras secuencias no codificantes parecen ser
particularmente adecuadas para detectar MSI en varios tipos de cáncer. Es interesante señalar que un panel
selectivo de las mutaciones más recurrentes fue muy sensible en la detección de la inestabilidad microsatelital (MSI)
55 en varios tipos de cáncer. En 114 tumores endometriales primarios, se observó un espectro continuo de MSI en casi
la mitad de los tumores, lo que sugiere que la MSI ocurre con más frecuencia de lo previsto.

Como se detallará en la sección Ejemplos, particularmente en el ejemplo 5, existen homopolímeros particulares en


las regiones 5' UTR y 3' UTR que se ven afectados más frecuentemente por indeles en tumores deficientes en MMR.
60 En la tabla 1 se proporciona una lista de los genes mutados de forma recurrente más frecuentes.

11
E13717473
ES 2 906 023 T3 11-02-2022

Tabla 1. Indeles recurrentes más comunes en las regiones 5' y 3' UTR para 16 muestras tumorales deficientes en
MMR (presentes en al menos 4 de 16 muestras tumorales). Las dos últimas columnas indican la frecuencia con la
que el homopolímero se ve afectado por una inserción o una deleción, respectivamente.

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
13 LRRC8D cr1 90401405 T 11 3' UTR
13 NPR3 cr5 32787131 A 11 3' UTR
12 AHCYL1 cr1 110566210 A 14 3' UTR
12 CD5L cr1 157801230 A 13 3' UTR
12 CEP170 cr1 243288181 T 11 3' UTR
12 SAMD12 cr8 119209320 A 11 3' UTR
12 UBE2Z cr17 47005701 A 11 3' UTR
11 SEPT7 cr7 35944036 T 11 3' UTR
11 CASK crX 41379131 A 13 3' UTR
11 DIDO1 cr20 61536691 A 11 3' UTR
11 EIF4G3 cr1 21133286 A 13 3' UTR
11 FAM20B cr1 179044906 A 12 3' UTR
11 GSK3B cr3 119542766 A 11 3' UTR
11 HELZ cr17 65070976 A 14 3' UTR
11 KCNK1 cr1 233807667 A 11 3' UTR
11 KCNMB4 cr12 70824838 A 14 3' UTR
11 LHX9 cr1 197898395 T 12 3' UTR
11 LYRM1 cr16 20935842 T 11 3' UTR
11 MYO5B cr18 47351784 A 12 3' UTR
11 NARG2 cr15 60712503 T 13 3' UTR
11 PPP1R12A cr12 80169697 T 13 3' UTR
11 PRTG cr15 55903921 A 11 3' UTR
11 RAB11FIP1 cr8 37718707 A 13 3' UTR
11 RASGRP1 cr15 38781450 T 13 3' UTR
11 SH3KBP1 crX 19552231 T 13 3' UTR
11 SHROOM3 cr4 77701305 A 12 3' UTR
11 TMEM26 cr10 63166725 A 12 3' UTR
11 TMEM65 cr8 125325217 A 11 3' UTR
11 TRIP11 cr14 92435633 A 12 3' UTR
11 ZBTB7A cr19 4046571 T 11 3' UTR
11 ZKSCAN1 cr7 99633041 T 12 3' UTR
11 ZNF217 cr20 52185289 A 13 3' UTR
11 ZNF275 crX 152617043 A 12 3' UTR
10 ACVR1C cr2 158387581 T 14 3' UTR
10 ARAP2 cr4 36068192 A 12 3' UTR
10 BCL11A cr2 60685409 T 12 3' UTR
10 C14orf101 cr14 57114799 A 13 3' UTR
10 C15orf29 cr15 34434105 T 12 3' UTR
10 C17orf63 cr17 27083744 T 12 3' UTR
10 CBFB cr16 67133068 T 11 3' UTR
10 CBX5 cr12 54628041 T 13 3' UTR
12
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
10 CD36 cr7 80306123 T 12 3' UTR
10 EPS15 cr1 51821385 A 13 3' UTR
10 ERBB2IP cr5 65375200 T 15 3' UTR
10 ERGIC2 cr12 29493722 T 11 3' UTR
10 FAM38B cr18 10670849 T 14 3' UTR
10 FGF9 cr13 22278024 T 13 3' UTR
10 FLRT2 cr14 86090074 A 12 3' UTR
10 GABPB1 cr15 50570604 A 13 3' UTR
10 GBP1 cr1 89518865 T 13 3' UTR
10 HIPK1 cr1 114519857 T 14 3' UTR
10 KCNG1 cr20 49620212 T 14 3' UTR
10 LPHN3 cr4 62936763 T 12 3' UTR
10 MAPK1IP1L cr14 55535728 T 13 3' UTR
10 MSR1 cr8 15997800 A 11 3' UTR
10 NCEH1 cr3 172348807 A 12 3' UTR
10 PEX13 cr2 61276332 T 15 3' UTR
10 PTEN cr10 89725293 T 11 3' UTR
10 RBMS1 cr2 161128989 T 13 3' UTR
10 RSPO2 cr8 108912568 A 11 3' UTR
10 SEMA6A cr5 115779928 A 13 3' UTR
10 SLAIN2 cr4 48428163 T 11 3' UTR
10 SNX31 cr8 101585895 T 11 3' UTR
10 TMEM57 cr1 25826052 T 12 3' UTR
10 TMTC3 cr12 88591979 T 13 3' UTR
10 UST cr6 149398012 T 13 3' UTR
10 VEGFA cr6 43754176 A 12 3' UTR
10 KLHL4 crX 86922591 A 13 3' UTR
9 AEN cr15 89174888 T 12 3' UTR
9 ALDH8A1 cr6 135238907 T 10 3' UTR
9 ANK2 cr4 114303782 T 11 3' UTR
9 ARHGAP17 cr16 24930800 A 14 3' UTR
9 ASPN cr9 95218905 A 12 3' UTR
9 BCL11B cr14 99637947 T 12 3' UTR
9 BCL7A cr12 122498799 A 12 3' UTR
9 BRAP cr12 112080129 T 12 3' UTR
9 C11orf87 cr11 109296012 A 12 3' UTR
9 C15orf2 cr15 24927891 A 10 3' UTR
9 CACNB4 cr2 152694131 T 11 3' UTR
9 CALN1 cr7 71245682 A 12 3' UTR
9 CAMK2A cr5 149600684 T 11 3' UTR
9 CBLN4 cr20 54572755 A 12 3' UTR
9 CCDC85C cr14 99978765 A 12 3' UTR
13
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
9 CD1E cr1 158327025 T 13 3' UTR
9 CISD1 cr10 60048285 T 11 3' UTR
9 CMTM6 cr3 32523862 A 12 3' UTR
9 CNR1 cr6 88853530 A 11 3' UTR
9 CSNK1E cr22 38686807 T 12 3' UTR
9 CYP1B1 cr2 38297055 T 12 3' UTR
9 DLGAP2 cr8 1652939 A 11 3' UTR
9 DRAM2 cr1 111660181 A 11 3' UTR
9 DUSP10 cr1 221875661 A 11 3' UTR
9 EHD4 cr15 42191704 A 12 3' UTR
9 EPT1 cr2 26617514 T 11 3' UTR
9 FAM 104A cr17 71204073 A 13 3' UTR
9 FAM46A cr6 82458103 A 13 3' UTR
9 FMO2 cr1 171178335 A 11 3' UTR
9 FOXN3 cr14 89622979 T 13 3' UTR
9 FRMD4A cr10 13686797 A 12 3' UTR
9 FYN cr6 111982555 T 12 3' UTR
9 GLI3 cr7 42001569 A 11 3' UTR
9 H3F3C cr12 31944217 T 12 3' UTR
9 HIPK2 cr7 139249947 A 14 3' UTR
9 HNRNPK cr9 86583189 T 12 3' UTR
9 IER3IP1 cr18 44682385 A 11 3' UTR
9 IFNGR1 cr6 137518966 A 14 3' UTR
9 IL33 cr9 6256984 T 12 3' UTR
9 KCTD7 cr7 66105589 T 11 3' UTR
9 KCTD9 cr8 25286171 A 12 3' UTR
9 KIAA1712 cr4 175238738 T 13 3' UTR
9 KIAA2018 cr3 113371321 A 11 3' UTR
9 KRT8 cr12 53291007 A 11 3' UTR
9 LARP4B cr10 856116 A 13 3' UTR
9 MED1 cr17 37561712 T 13 3' UTR
9 MED28 cr4 17626082 T 11 3' UTR
9 M ETTL9 cr16 21667438 A 12 3' UTR
9 MEX3A cr1 156043944 T 11 3' UTR
9 MLL2 cr12 49413580 A 12 3' UTR
9 NAALAD2 cr11 89925062 T 10 3' UTR
9 PCBD2 cr5 134296980 T 14 3' UTR
9 PCDH9 cr13 66878392 A 26 3' UTR
9 PGK1 crX 77381770 T 13 3' UTR
9 PHACTR2 cr6 144151003 T 10 3' UTR
9 PI15 cr8 75766071 T 10 3' UTR
9 PLEKHA2 cr8 38830288 T 13 3' UTR
14
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
9 PPP2R3A cr3 135865826 T 11 3' UTR
9 PRCC cr1 156770552 T 12 3' UTR
9 PRKD3 cr2 37478759 T 12 3' UTR
9 PRPF40A cr2 153512044 T 15 3' UTR
9 PSEN1 cr14 73688298 T 13 3' UTR
9 RCC2 cr1 17735285 A 14 3' UTR
9 RELL1 cr4 37613352 A 12 3' UTR
9 RGS16 cr1 182569291 T 26 3' UTR
9 RUNDC3B cr7 87460421 T 12 3' UTR
9 SATB2 cr2 200136194 T 12 3' UTR
9 SCML4 cr6 108025850 T 13 3' UTR
9 SEC61G cr7 54819993 A 11 3' UTR
9 SENP1 cr12 48436768 T 11 3' UTR
9 SLC35D1 cr1 67465371 A 13 3' UTR
9 SMAD3 cr15 67486032 T 13 3' UTR
9 SPIN1 cr9 91090830 A 12 3' UTR
9 SRC cr20 36033633 T 13 3' UTR
9 TACC1 cr8 38705639 A 11 3' UTR
9 TAF4B cr18 23971176 A 14 3' UTR
9 TBC1D24 cr16 2553486 A 13 3' UTR
9 THAP1 cr8 42692467 A 12 3' UTR
9 TMEM106B cr7 12273303 A 13 3' UTR
9 TMEM14B cr6 10756863 A 11 3' UTR
9 TMEM209 cr7 129805893 A 12 3' UTR
9 TMEM33 cr4 41959614 T 14 3' UTR
9 TRA2A cr7 23544783 A 11 3' UTR
9 TRIM66 cr11 8635430 A 9 3' UTR
9 TTBK2 cr15 43037302 A 12 3' UTR
9 UBE2M cr19 59067290 A 13 3' UTR
9 USP44 cr12 95911789 A 11 3' UTR
9 VCPIP1 cr8 67545797 A 15 3' UTR
9 VGLL4 cr3 11599949 T 13 3' UTR
9 XPO4 cr13 21356029 A 10 3' UTR
9 ZBTB3 cr11 62519422 A 12 3' UTR
9 ZNF264 cr19 57730525 A 14 3' UTR
9 ZNF347 cr19 53643153 T 12 3' UTR
9 ZNF704 cr8 81550824 A 12 3' UTR
9 ZNF740 cr12 53582896 T 11 3' UTR
8 A1CF cr10 52566432 T 12 3' UTR
8 ABAT cr16 8876792 T 11 3' UTR
8 ABI1 cr10 27037487 A 11 3' UTR
8 ACTR2 cr2 65498035 A 12 3' UTR
15
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
8 AIDA cr1 222841524 T 10 3' UTR
8 AKIRIN1 cr1 39471672 A 10 3' UTR
8 APH1B cr15 63600287 T 12 3' UTR
8 ARHGAP18 cr6 129898731 A 11 3' UTR
8 ARHGAP5 cr14 32627034 T 11 3' UTR
8 ASB7 cr15 101189293 T 10 3' UTR
8 ATRX crX 76763679 A 13 3' UTR
8 BACE1 cr11 117159733 T 11 3' UTR
8 C4orf49 cr4 140187661 T 11 3' UTR
8 CADPS cr3 62384481 T 10 3' UTR
8 CALM L4 cr15 68483096 A 12 3' UTR
8 CAM KK2 cr12 121676365 A 11 3' UTR
8 CANX cr5 179158477 A 12 3' UTR
8 CANX cr5 179155907 T 12 3' UTR
8 CAP2 cr6 17556926 A 11 3' UTR
8 CCDC43 cr17 42754916 T 13 3' UTR
8 CCDC89 cr11 85395559 T 10 3' UTR
8 CD47 cr3 107762288 A 11 3' UTR
8 CDC23 cr5 137524388 A 11 3' UTR
8 CELF2 cr10 11373567 A 11 3' UTR
8 CHM crX 85118100 T 13 3' UTR
8 COPA cr1 160258927 T 15 3' UTR
8 CPEB3 cr10 93809826 A 11 3' UTR
8 CPNE3 cr8 87571865 T 11 3' UTR
8 CRTAP cr3 33187520 A 12 3' UTR
8 CSDA cr12 10851811 T 14 3' UTR
8 CSMD2 cr1 33979967 T 12 3' UTR
8 DCP2 cr5 112351058 T 11 3' UTR
8 DDHD1 cr14 53513439 A 12 3' UTR
8 DIEXF cr1 210026704 T 15 3' UTR
8 DLG3 crX 69722274 T 13 3' UTR
8 DLGAP2 cr8 1653883 T 11 3' UTR
8 DSC3 cr18 28573880 A 12 3' UTR
8 EFNA5 cr5 106714693 A 12 3' UTR
8 EPHA4 cr2 222290623 T 11 3' UTR
8 EXOSC2 cr9 133579920 A 11 3' UTR
8 FAM107B cr10 14561157 T 12 3' UTR
8 FAM116A cr3 57611367 A 11 3' UTR
8 FAM8A1 cr6 17609273 T 11 3' UTR
8 FAM91A1 cr8 124826583 T 12 3' UTR
8 FGFBP3 cr10 93666830 A 11 3' UTR
8 GABRG2 cr5 161581834 A 11 3' UTR
16
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
8 GAL cr11 68458592 T 12 3' UTR
8 GLS cr2 191828629 T 12 3' UTR
8 GPAM cr10 113910871 T 12 3' UTR
8 HCRTR2 cr6 55147361 T 12 3' UTR
8 HERPUD2 cr7 35672678 T 14 3' UTR
8 HIP1 cr7 75166838 A 11 3' UTR
8 HIPK2 cr7 139257355 T 11 3' UTR
8 HMGCS1 cr5 43290194 A 16 3' UTR
8 HNRNPUL1 cr19 41812943 A 12 3' UTR
8 HSPA9 cr5 137891047 A 13 3' UTR
8 IFIT2 cr10 91068075 T 12 3' UTR
8 IGF2BP1 cr17 47129195 T 12 3' UTR
8 KLF9 cr9 73002115 T 11 3' UTR
8 LHFPL4 cr3 9543422 A 13 3' UTR
8 LRAT cr4 155673737 A 10 3' UTR
8 LSM14A cr19 34718607 T 12 3' UTR
8 MAP3K5 cr6 136878751 T 14 3' UTR
8 MED13 cr17 60023567 A 10 3' UTR
8 MESDC1 cr15 81296129 T 12 3' UTR
8 METTL21B cr12 58175145 T 15 3' UTR
8 MITF cr3 70014804 A 11 3' UTR
8 MS4A7 cr11 60161438 A 12 3' UTR
8 MTF2 cr1 93602675 A 14 3' UTR
8 NAP1L4 cr11 2966276 A 15 3' UTR
8 NEDD1 cr12 97346987 A 13 3' UTR
8 NEK5 cr13 52639268 A 13 3' UTR
8 OXR1 cr8 107763507 T 13 3' UTR
8 PAPD5 cr16 50264031 A 13 3' UTR
8 PDE9A cr21 44195537 A 13 3' UTR
8 PIGM cr1 159998798 T 11 3' UTR
8 PM20D2 cr6 89874860 T 11 3' UTR
8 POGZ cr1 151377008 A 13 3' UTR
8 POMT2 cr14 77741349 T 11 3' UTR
8 POU2F2 cr19 42595246 T 17 3' UTR
8 RAB11FIP2 cr10 119766958 A 12 3' UTR
8 RAP2A cr13 98118463 A 14 3' UTR
8 RBM25 cr14 73587904 T 14 3' UTR
8 RBM33 cr7 155569742 T 13 3' UTR
8 RBM45 cr2 178994205 T 11 3' UTR
8 RIMKLB cr12 8926680 T 11 3' UTR
8 RNF149 cr2 101893233 A 10 3' UTR
8 RNLS cr10 90034667 A 11 3' UTR
17
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
8 RORA cr15 60788653 A 12 3' UTR
8 SAMD5 cr6 147887423 T 12 3' UTR
8 SAR1A cr10 71911798 A 12 3' UTR
8 SEL1L cr14 81942829 T 13 3' UTR
8 SEMA4D cr9 91992883 A 13 3' UTR
8 SETX cr9 135139195 T 11 3' UTR
8 SH3RF1 cr4 170017405 A 14 3' UTR
8 SMARCC2 cr12 56556167 A 14 3' UTR
8 SNRNP40 cr1 31732677 A 11 3' UTR
8 SOX4 cr6 21596500 A 12 3' UTR
8 ST7L cr1 113067470 A 10 3' UTR
8 STXBP5 cr6 147708451 A 10 3' UTR
8 TGIF2 cr20 35220571 A 14 3' UTR
8 TLE3 cr15 70340967 A 11 3' UTR
8 TMC7 cr16 19073947 A 10 3' UTR
8 TMEM57 cr1 25825931 T 13 3' UTR
8 TNRC6B cr22 40722031 A 10 3' UTR
8 TNRC6B cr22 40720866 T 14 3' UTR
8 TNRC6B cr22 40720294 T 15 3' UTR
8 TRPS1 cr8 116424407 A 12 3' UTR
8 TSGA10 cr2 99614595 A 13 3' UTR
8 TSPAN14 cr10 82279557 T 14 3' UTR
8 TTL cr2 113289264 A 11 3' UTR
8 TTLL5 cr14 76420881 T 11 3' UTR
8 UBA6 cr4 68481877 T 12 3' UTR
8 UFM1 cr13 38935214 T 11 3' UTR
8 VCP cr9 35056078 T 12 3' UTR
8 VEZF1 cr17 56049540 T 11 3' UTR
8 WHSC1L1 cr8 38175279 A 11 3' UTR
8 WSB1 cr17 25640066 A 15 3' UTR
8 ZBTB43 cr9 129596297 A 11 3' UTR
8 ZNF12 cr7 6730082 T 12 3' UTR
8 ZNF238 cr1 244220229 T 10 3' UTR
8 ZNF281 cr1 200375822 T 12 3' UTR
8 ZNF621 cr3 40575421 A 11 3' UTR
7 ADRBK2 cr22 26121915 A 11 3' UTR
7 ALG9 cr11 111655441 A 11 3' UTR
7 ANKIB1 cr7 92029899 T 11 3' UTR
7 ANKRD28 cr3 15709862 T 13 3' UTR
7 ARFIP1 cr4 153832102 T 11 3' UTR
7 ARID4A cr14 58840119 T 10 3' UTR
7 ATP11A cr13 113540850 T 12 3' UTR
18
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
7 ATP2B1 cr12 89984601 T 12 3' UTR
7 ATXN1 cr6 16300902 T 11 3' UTR
7 BOD1L cr4 13570453 A 11 3' UTR
7 C14orf37 cr14 58471378 T 11 3' UTR
7 C2orf29 cr2 101886538 T 12 3' UTR
7 C3orf58 cr3 143709141 T 11 3' UTR
7 C3orf62 cr3 49308391 A 11 3' UTR
7 C3orf72 cr3 138671354 T 13 3' UTR
C8orf44-
7 cr8 67772690 A 11 3' UTR
SGK3,SGK3
7 CALN1 cr7 71249416 T 10 3' UTR
7 CASK crX 41377809 A 11 3' UTR
7 CD300LB cr17 72518440 A 11 3' UTR
7 CDC25A cr3 48199852 T 12 3' UTR
7 CDC73 cr1 193220974 T 12 3' UTR
7 CDKN2AIPNL cr5 133738313 A 11 3' UTR
7 CELSR1 cr22 46756848 A 11 3' UTR
7 CMIP cr16 81744987 A 10 3' UTR
7 COIL cr17 55016354 A 14 3' UTR
7 COPS7B cr2 232673378 T 13 3' UTR
7 COX18 cr4 73923142 A 12 3' UTR
7 CSNK1E cr22 38686864 A 11 3' UTR
7 DCP1A cr3 53321360 T 27 3' UTR
7 DNAJC27 cr2 25167221 T 14 3' UTR
7 DNMT3B cr20 31395997 T 11 3' UTR
7 DTNA cr18 32446839 T 12 3' UTR
7 EFNB1 crX 68061978 A 12 3' UTR
7 ENTPD1 cr10 97628618 A 10 3' UTR
7 ERBB4 cr2 212247967 A 18 3' UTR
7 EYA1 cr8 72110673 A 12 3' UTR
7 FAM118A cr22 45736689 T 11 3' UTR
7 FAM126B cr2 201838933 A 13 3' UTR
7 FAM13B cr5 137274915 A 11 3' UTR
7 FAM169A cr5 74075446 T 12 3' UTR
7 FAM60A cr12 31435556 A 10 3' UTR
7 FBLN7 cr2 112945284 T 11 3' UTR
7 FGF9 cr13 22277774 T 10 3' UTR
7 FKBP5 cr6 35554624 T 12 3' UTR
7 FOXO3 cr6 109005013 A 11 3' UTR
7 FXR1 cr3 180694863 T 14 3' UTR
7 GBP6 cr1 89851722 A 13 3' UTR
7 GNB1 cr1 1717242 T 12 3' UTR

19
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
7 GNRHR cr4 68604166 A 12 3' UTR
7 GPC3 crX 132670054 A 13 3' UTR
7 GRIK2 cr6 102517011 T 11 3' UTR
7 H3F3B cr17 73774199 T 13 3' UTR
7 HAS2 cr8 122625936 A 12 3' UTR
7 HELZ cr17 65073603 A 11 3' UTR
7 HIPK2 cr7 139250450 T 11 3' UTR
7 HN1 cr17 73132058 A 12 3' UTR
7 HNRNPA3 cr2 178088002 T 10 3' UTR
7 HNRNPR cr1 23636874 T 11 3' UTR
7 HUS1B cr6 656079 A 10 3' UTR
7 KDM5A cr12 389523 T 11 3' UTR
7 KHNYN cr14 24908391 T 11 3' UTR
7 KIF3A cr5 132029672 A 14 3' UTR
7 KIF5C cr2 149879665 T 10 3' UTR
7 KLHL28 cr14 45398006 T 11 3' UTR
7 LRCH1 cr13 47325657 A 10 3' UTR
7 LRIG2 cr1 113667282 T 11 3' UTR
7 LRP6 cr12 12272288 A 12 3' UTR
7 MAGEB3 crX 30255422 A 11 3' UTR
7 MAK cr6 10764372 T 9 3' UTR
7 MCTS1 crX 119754487 A 14 3' UTR
7 MDM2 cr12 69236873 T 13 3' UTR
7 MED19 cr11 57471199 T 13 3' UTR
7 MESDC1 cr15 81296262 T 9 3' UTR
7 MGAT4A cr2 99235842 A 11 3' UTR
7 MLL3 cr7 151832596 T 11 3' UTR
7 MTMR9 cr8 11185354 A 10 3' UTR
7 NAA35 cr9 88637203 A 10 3' UTR
7 NAF1 cr4 164049985 A 11 3' UTR
7 NHLH1 cr1 160341680 A 11 3' UTR
7 NIPAL3 cr1 24799398 A 12 3' UTR
7 NPAS3 cr14 34271068 A 12 3' UTR
7 NRF1 cr7 129395138 T 11 3' UTR
7 NTRK2 cr9 87487518 T 11 3' UTR
7 PALM2 cr9 112708967 A 25 3' UTR
7 PAPSS2 cr10 89507276 A 11 3' UTR
7 PCDH7 cr4 31146675 T 12 3' UTR
7 PCSK2 cr20 17463028 T 11 3' UTR
7 PHF6 crX 133561520 T 10 3' UTR
7 PKP4 cr2 159537312 T 10 3' UTR
7 PLXNA4 cr7 131809795 A 13 3' UTR
20
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
7 POFUT1 cr20 30826323 A 11 3' UTR
7 PPP1CB cr2 29024298 T 14 3' UTR
7 PPP2R3A cr3 135865709 A 14 3' UTR
7 PRPF4 cr9 116054493 A 14 3' UTR
7 PRPF40A cr2 153509691 A 11 3' UTR
7 PRR23A cr3 138723892 A 9 3' UTR
7 PSMD11 cr17 30807996 A 11 3' UTR
7 PTAFR cr1 28475836 T 27 3' UTR
7 PTPN11 cr12 112944240 T 12 3' UTR
7 PTPN18 cr2 131131908 T 14 3' UTR
7 PTPRJ cr11 48189153 T 13 3' UTR
7 PURB cr7 44920830 A 9 3' UTR
7 RB1CC1 cr8 53536112 A 11 3' UTR
7 RBM12B cr8 94745437 A 11 3' UTR
7 RC3H1 cr1 173901043 T 11 3' UTR
7 RDH10 cr8 74236678 T 10 3' UTR
7 RECK cr9 36123172 T 11 3' UTR
7 RPS6KA2 cr6 166824706 T 13 3' UTR
7 RS1 crX 18659977 A 13 3' UTR
7 RUNDC3B cr7 87459581 A 13 3' UTR
7 RXRA cr9 137331937 A 12 3' UTR
7 RYBP cr3 72424549 T 9 3' UTR
7 RYR3 cr15 34157541 A 10 3' UTR
7 SAMD10 cr20 62605493 T 12 3' UTR
7 SEC31A cr4 83740163 T 11 3' UTR
7 SENP1 cr12 48437910 T 11 3' UTR
7 SGCD cr5 156190730 A 12 3' UTR
7 SH3BP5 cr3 15297082 T 13 3' UTR
7 SH3RF1 cr4 170016066 A 11 3' UTR
7 SLC16A7 cr12 60173983 A 11 3' UTR
7 SLC2A3 cr12 8072022 T 13 3' UTR
7 SLC30A7 cr1 101446221 T 11 3' UTR
7 SLC7A11 cr4 139092374 A 11 3' UTR
7 SLC9A2 cr2 103326258 T 10 3' UTR
7 SMAD4 cr18 48609102 T 12 3' UTR
7 SNAPC1 cr14 62262433 A 11 3' UTR
7 SNAPC3 cr9 15461137 A 13 3' UTR
7 SNX27 cr1 151666826 T 11 3' UTR
7 SPCS3 cr4 177250201 T 10 3' UTR
7 STARD7 cr2 96851899 A 14 3' UTR
7 TBC1D22B cr6 37299299 T 12 3' UTR
7 TBL1XR1 cr3 176741889 A 13 3' UTR
21
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
7 TFAP2C cr20 55213320 T 11 3' UTR
7 TIGD6 cr5 149373143 T 13 3' UTR
7 TMEM108 cr3 133116233 A 14 3' UTR
7 TMEM161B cr5 87491917 T 10 3' UTR
7 TMEM47 crX 34646666 T 12 3' UTR
7 TMEM64 cr8 91637753 A 12 3' UTR
7 TNRC6B cr22 40719790 A 14 3' UTR
7 TNRC6C cr17 76101834 T 9 3' UTR
7 TOMM20 cr1 235275027 T 12 3' UTR
7 TPH1 cr11 18042321 A 11 3' UTR
7 UACA cr15 70946988 A 12 3' UTR
7 UBXN7 cr3 196080741 T 11 3' UTR
7 UGT2B28 cr4 70160632 A 11 3' UTR
7 USP28 cr11 113669136 A 11 3' UTR
7 WDR82 cr3 52289627 A 11 3' UTR
7 ZBTB34 cr9 129646763 T 11 3' UTR
7 ZBTB44 cr11 130102910 A 11 3' UTR
7 ZDHHC13 cr11 19197719 A 10 3' UTR
7 ZNF136 cr19 12299608 A 13 3' UTR
7 ZNF238 cr1 244219573 A 9 3' UTR
7 ZNF563 cr19 12428823 T 15 3' UTR
7 ZNF652 cr17 47369576 T 11 3' UTR
7 ZNF716 cr7 57529811 A 10 3' UTR
7 ZNF737 cr19 20723566 A 11 3' UTR
7 ZNF737 cr19 20722094 A 14 3' UTR
6 MARCH1 cr4 164446860 T 9 3' UTR
6 ADRA1D cr20 4201344 T 10 3' UTR
6 AJAP1 cr1 4843660 T 11 3' UTR
6 AK4 cr1 65692499 T 11 3' UTR
6 ANKH cr5 14705393 A 13 3' UTR
6 ANKRD13C cr1 70727638 A 12 3' UTR
6 ANKRD40 cr17 48770711 A 10 3' UTR
6 AP1AR cr4 113190822 A 11 3' UTR
6 APOL1 cr22 36662141 T 12 3' UTR
6 ARHGAP28 cr18 6914974 A 10 3' UTR
6 ARID1B cr6 157530262 A 14 3' UTR
6 ARIH1 cr15 72877867 A 12 3' UTR
6 ARL10 cr5 175800426 T 10 3' UTR
6 ATF2 cr2 175939223 A 12 3' UTR
6 ATP11C crX 138809822 A 10 3' UTR
6 ATXN1 cr6 16301824 A 13 3' UTR
6 BCLAF1 cr6 136581674 T 11 3' UTR
22
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
6 BIN1 cr2 127805622 T 10 3' UTR
6 BNIP3L cr8 26268445 A 10 3' UTR
6 BOD1L cr4 13571144 A 10 3' UTR
6 C1orf9 cr1 172580460 T 9 3' UTR
6 C5orf43 cr5 60453908 A 9 3' UTR
6 C6orf145 cr6 3723315 A 11 3' UTR
6 C9orf167 cr9 140176659 T 10 3' UTR
6 CAMLG cr5 134086670 A 13 3' UTR
6 CBL cr11 119175340 T 14 3' UTR
6 CCND2 cr12 4411110 T 12 3' UTR
6 CCNE2 cr8 95892992 A 11 3' UTR
6 CHD7 cr8 61778758 T 11 3' UTR
6 CHP cr15 41572703 T 27 3' UTR
6 CIT cr12 120123939 T 11 3' UTR
6 CLCN5 crX 49862213 A 12 3' UTR
6 CLN8 cr8 1729701 T 14 3' UTR
6 CLSPN cr1 36201819 A 17 3' UTR
6 CRTC1 cr19 18890267 T 14 3' UTR
6 DAG1 cr3 49571620 T 11 3' UTR
6 DNAJB7 cr22 41256660 T 14 3' UTR
6 DNAJC17 cr15 41060070 A 14 3' UTR
6 DSTYK cr1 205112278 T 14 3' UTR
6 DYRK2 cr12 68054141 A 11 3' UTR
6 EBF1 cr5 158125829 A 12 3' UTR
6 ECE1 cr1 21546032 A 10 3' UTR
6 EGR3 cr8 22545637 T 11 3' UTR
6 EIF4EBP2 cr10 72188037 A 11 3' UTR
6 EIF5A2 cr3 170607962 A 11 3' UTR
6 ELTD1 cr1 79356149 T 11 3' UTR
6 ENTPD4 cr8 23289680 A 11 3' UTR
6 EPM2AIP1 cr3 37030780 T 11 3' UTR
6 ERBB2IP cr5 65376306 A 11 3' UTR
6 ERBB4 cr2 212243952 T 11 3' UTR
6 FAM120C crX 54098998 A 12 3' UTR
6 FAM122A cr9 71396662 T 11 3' UTR
6 FAM168B cr2 131805979 G 9 3' UTR
6 FBLIM1 cr1 16112130 A 10 3' UTR
6 FBXO21 cr12 117582899 T 11 3' UTR
6 FBXO27 cr19 39514872 T 12 3' UTR
6 FGFR1OP2 cr12 27118594 A 11 3' UTR
6 FOXP1 cr3 71007140 T 11 3' UTR
6 G3BP1 cr5 151184779 T 11 3' UTR
23
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
6 GABRB2 cr5 160717254 T 12 3' UTR
6 GDA cr9 74866560 T 12 3' UTR
6 GIT1 cr17 27901146 A 12 3' UTR
6 GJC1 cr17 42878975 T 13 3' UTR
6 GPR4 cr19 46093443 A 11 3' UTR
6 GSK3B cr3 119544323 A 9 3' UTR
6 GSR cr8 30536666 A 19 3' UTR
6 GTF3C1 cr16 27471985 T 11 3' UTR
6 HAS2 cr8 122625490 T 10 3' UTR
6 HMGN2 cr1 26801737 T 15 3' UTR
HNRNPA3
6 cr2 178088125 A 12 3' UTR
HNRNPH2,RPL36
6 A-HNRNPH2 crX 100668932 T 13 3' UTR
6 HNRNPU cr1 245014280 T 11 3' UTR
6 HOMEZ cr14 23744114 A 14 3' UTR
6 ICA1L cr2 203642599 T 22 3' UTR
6 IGF2BP3 cr7 23350733 T 12 3' UTR
6 IGFBP5 cr2 217537045 T 14 3' UTR
6 ILF3 cr19 10796313 T 10 3' UTR
6 INSR cr19 7112347 A 9 3' UTR
6 IPCEF1 cr6 154476149 A 12 3' UTR
6 KCNJ2 cr17 68175917 A 10 3' UTR
6 KDM5A cr12 393489 T 12 3' UTR
6 KHSRP cr19 6413651 T 10 3' UTR
6 KIAA0825 cr5 93489194 T 8 3' UTR
6 KIAA1671 cr22 25592399 T 12 3' UTR
6 LANCL1 cr2 211297865 T 9 3' UTR
6 LCORL cr4 17882781 T 11 3' UTR
6 LIN7C cr11 27517703 A 14 3' UTR
6 LMO4 cr1 87813143 A 11 3' UTR
6 LRRC4 cr7 127668232 T 9 3' UTR
6 LYRM7 cr5 130537006 A 12 3' UTR
6 MAGI1 cr3 65340577 T 11 3' UTR
6 MAL cr2 95719330 A 10 3' UTR
6 MEIS2 cr15 37183446 T 10 3' UTR
6 MKL1 cr22 40806781 C 9 3' UTR
6 MKLN1 cr7 131175980 A 10 3' UTR
6 MTDH cr8 98740104 A 10 3' UTR
6 NANP cr20 25595618 A 11 3' UTR
6 NAPEPLD cr7 102742595 A 10 3' UTR
6 NCEH1 cr3 172349171 T 12 3' UTR
6 NCOA5 cr20 44689693 A 10 3' UTR

24
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
6 NKAIN2 cr6 125146684 T 9 3' UTR
6 NPNT cr4 106892254 T 13 3' UTR
6 NPR3 cr5 32786465 T 11 3' UTR
6 NR2F2 cr15 96881216 T 10 3' UTR
6 NR3C1 cr5 142657694 T 9 3' UTR
6 NUFIP2 cr17 27584536 T 12 3' UTR
6 OPA3 cr19 46052745 T 12 3' UTR
6 ORAI3 cr16 30965549 T 15 3' UTR
6 OTUB2 cr14 94512841 A 11 3' UTR
6 OXR1 cr8 107764239 A 10 3' UTR
6 PAQR7 cr1 26188503 A 31 3' UTR
6 PCDHB3 cr5 140482943 T 10 3' UTR
6 PDP2 cr16 66920308 T 10 3' UTR
6 PEBP1 cr12 118582973 A 21 3' UTR
6 PELI2 cr14 56764487 T 13 3' UTR
6 PGPEP1 cr19 18477965 A 20 3' UTR
6 PGR cr11 100902321 T 15 3' UTR
6 PHLDA1 cr12 76421757 T 12 3' UTR
6 PID1 cr2 229889188 A 9 3' UTR
6 PIGN cr18 59712451 A 11 3' UTR
6 PIM2 crX 48770831 A 20 3' UTR
6 PLAA cr9 26904508 T 10 3' UTR
6 PLEKHA6 cr1 204190022 A 13 3' UTR
6 PPM1A cr14 60761433 T 10 3' UTR
6 PPP1R3D cr20 58513623 T 11 3' UTR
6 PRDM1 cr6 106557171 T 10 3' UTR
6 PTCD3 cr2 86366926 A 11 3' UTR
6 PTGDR cr14 52741746 A 11 3' UTR
6 RAB22A cr20 56941068 T 10 3' UTR
6 RAB8B cr15 63557574 T 13 3' UTR
6 RAD51L1 cr14 68964202 T 12 3' UTR
6 RBM12B cr8 94744118 T 11 3' UTR
6 RNF10 cr12 121014987 T 11 3' UTR
6 RORA cr15 60785852 T 11 3' UTR
6 RRAGD cr6 90076341 A 13 3' UTR
6 RRM2B cr8 103216874 A 9 3' UTR
6 RTF1 cr15 41775015 T 10 3' UTR
6 RUFY3 cr4 71655520 A 12 3' UTR
6 S100A4 cr1 153516162 A 10 3' UTR
6 SBK1 cr16 28334644 A 13 3' UTR
6 SERBP1 cr1 67878789 T 11 3' UTR
6 SIPA1L3 cr19 38698671 T 17 3' UTR
25
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
6 SLC16A6 cr17 66265042 A 11 3' UTR
6 SLC25A20 cr3 48894565 A 12 3' UTR
6 SLC30A5 cr5 68399959 T 11 3' UTR
6 SLC35B4 cr7 133977008 T 10 3' UTR
6 SLC44A5 cr1 75668544 A 11 3' UTR
6 SLMAP cr3 57913669 T 13 3' UTR
6 SMAD5 cr5 135515014 A 10 3' UTR
6 SMEK1 cr14 91924528 A 11 3' UTR
6 SOCS4 cr14 55512747 T 10 3' UTR
6 SORCS1 cr10 108333635 A 11 3' UTR
6 SOX1 cr13 112724861 A 10 3' UTR
6 SOX4 cr6 21597192 A 11 3' UTR
6 SPIRE1 cr18 12449300 T 11 3' UTR
6 SPTLC2 cr14 77975645 A 11 3' UTR
6 SRCIN1 cr17 36687785 T 12 3' UTR
6 STEAP3 cr2 120023163 T 12 3' UTR
6 STK11 cr19 1228058 T 11 3' UTR
6 STX12 cr1 28150575 T 10 3' UTR
6 STX3 cr11 59569295 A 11 3' UTR
6 SULF2 cr20 46286320 A 10 3' UTR
6 SUZ12 cr17 30326763 T 12 3' UTR
6 SYNJ2BP cr14 70834868 A 10 3' UTR
6 TARDBP cr1 11084333 T 11 3' UTR
6 TBC1D1 cr4 38140081 A 10 3' UTR
6 TBC1D5 cr3 17201870 T 11 3' UTR
6 TCERG1 cr5 145890609 T 12 3' UTR
6 TCF20 cr22 42556646 A 12 3' UTR
6 TFAP2B cr6 50814900 A 10 3' UTR
6 TLCD2 cr17 1608003 T 11 3' UTR
6 TMTC3 cr12 88591036 T 25 3' UTR
6 TMTC3 cr12 88590177 T 12 3' UTR
6 TNIP3 cr4 122052756 T 22 3' UTR
6 TNRC6B cr22 40731027 T 10 3' UTR
6 TOR1AIP1 cr1 179888400 A 12 3' UTR
6 TP53INP1 cr8 95941646 A 13 3' UTR
6 TRIM66 cr11 8636480 T 13 3' UTR
6 TRRAP cr7 98610830 T 11 3' UTR
6 TSR2 crX 54471045 T 10 3' UTR
6 TTC30B cr2 178415366 T 10 3' UTR
6 UBASH3B cr11 122681008 T 13 3' UTR
6 VAX1 cr10 118893337 A 10 3' UTR
6 WDFY1 cr2 224742022 T 12 3' UTR
26
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
6 WIF1 cr12 65444595 T 13 3' UTR
6 XKR7 cr20 30585884 G 10 3' UTR
6 XYLT1 cr16 17199775 A 11 3' UTR
6 ZADH2 cr18 72910475 T 13 3' UTR
6 ZBTB7A cr19 4046340 T 11 3' UTR
6 ZNF238 cr1 244219033 T 11 3' UTR
6 ZNF24 cr18 32917176 T 12 3' UTR
6 ZNF362 cr1 33764950 T 12 3' UTR
6 ZNF407 cr18 72516095 T 11 3' UTR
6 ZNF430 cr19 21241252 A 14 3' UTR
6 ZNF80 cr3 113954690 A 12 3' UTR
5 ABHD2 cr15 89739843 T 10 3' UTR
5 ABI2 cr2 204292194 T 10 3' UTR
5 ACOX1 cr17 73941869 A 10 3' UTR
5 ACTBL2 cr5 56777006 T 10 3' UTR
5 AFF2 crX 148080284 T 10 3' UTR
5 ANAPC16 cr10 73993363 T 10 3' UTR
5 ARF5 cr7 127231635 T 10 3' UTR
5 ARL1 cr12 101787092 T 11 3' UTR
5 ASAH1 cr8 17914871 A 10 3' UTR
5 ATP1B2 cr17 7560698 A 10 3' UTR
5 ATXN7 cr3 63985894 T 11 3' UTR
5 B3GNT7 cr2 232264806 T 26 3' UTR
5 BAG1 cr9 33253979 T 12 3' UTR
5 BCL11B cr14 99638830 A 9 3' UTR
5 BMP7 cr20 55744815 T 10 3' UTR
5 BTBD11 cr12 108052115 T 12 3' UTR
5 BTBD7 cr14 93708030 A 10 3' UTR
5 C14orf126 cr14 31917025 A 10 3' UTR
5 C14orf28 cr14 45376124 A 12 3' UTR
5 C18orf56 cr18 649879 T 15 3' UTR
5 C20orf12 cr20 18364708 T 12 3' UTR
5 C5orf41 cr5 172563230 A 11 3' UTR
5 C7orf68 cr7 128097963 A 10 3' UTR
5 C9orf66 cr9 214453 T 9 3' UTR
5 CABP4 cr11 67226510 T 14 3' UTR
5 CACNB4 cr2 152695481 T 11 3' UTR
5 CASP2 cr7 143003342 T 25 3' UTR
5 CBFB cr16 67133969 T 9 3' UTR
5 CBX5 cr12 54630019 T 10 3' UTR
5 CCDC102B cr18 66722368 A 9 3' UTR
5 CCND1 cr11 69468187 T 14 3' UTR
27
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
5 CCND2 cr12 4409520 T 10 3' UTR
5 CCNL2 cr1 1327869 T 9 3' UTR
5 CCR1 cr3 46244273 G 10 3' UTR
5 CDH3 cr16 68732679 T 11 3' UTR
5 CEP68 cr2 65312945 A 12 3' UTR
5 CGGBP1 cr3 88104472 T 10 3' UTR
5 CHMP2B cr3 87303064 A 14 3' UTR
5 CIB2 cr15 78397249 T 12 3' UTR
5 CLEC5A cr7 141627861 T 12 3' UTR
5 CNST cr1 246830426 A 10 3' UTR
5 COL19A1 cr6 70918737 T 12 3' UTR
COL8A2 36561052
5 cr1 A 10 3' UTR
COX16,SYNJ2BP- 70793015
5 COX16 cr14 A 14 3' UTR
5 CPLX4 cr18 56963029 A 10 3' UTR
5 CREB3L2 cr7 137563914 A 10 3' UTR
5 CSNK1G1 cr15 64461259 A 9 3' UTR
5 CTIF cr18 46388423 T 10 3' UTR
5 CUL5 cr11 107975795 T 13 3' UTR
5 CYP17A1 cr10 104590293 A 11 3' UTR
5 DAND5 cr19 13084677 T 17 3' UTR
5 DCUN1D5 cr11 102930486 G 7 3' UTR
5 DDN cr12 49389156 A 11 3' UTR
5 DDX5 cr17 62495664 A 10 3' UTR
5 DDX6 cr11 118622141 A 10 3' UTR
5 DLX3 cr17 48067712 T 14 3' UTR
5 DNAJC15 cr13 43681779 T 9 3' UTR
5 DNAJC18 cr5 138747976 T 11 3' UTR
5 DOPEY2 cr21 37666277 A 14 3' UTR
5 DPYSL2 cr8 26515559 T 10 3' UTR
5 DSEL cr18 65174583 A 26 3' UTR
5 DTNA cr18 32448118 A 16 3' UTR
5 DYNC1LI2 cr16 66755235 T 11 3' UTR
5 DYRK2 cr12 68055576 T 10 3' UTR
5 EBF1 cr5 158125671 T 15 3' UTR
5 EFNA5 cr5 106716350 A 11 3' UTR
5 EFNA5 cr5 106712689 T 12 3' UTR
5 EFR3B cr2 25378726 T 13 3' UTR
5 ELAVL1 cr19 8023995 T 11 3' UTR
5 ELAVL3 cr19 11562278 T 16 3' UTR
5 EPS15 cr1 51822219 A 12 3' UTR
5 ESRP1 cr8 95719492 A 11 3' UTR

28
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
5 EVI5 cr1 92978704 A 11 3' UTR
5 EVI5 cr1 92977467 T 11 3' UTR
5 EXTL2 cr1 101338118 A 10 3' UTR
5 FAF2 cr5 175935960 T 10 3' UTR
5 FAM105A cr5 14611814 T 10 3' UTR
5 FAM164A cr8 79631105 T 10 3' UTR
5 FAM20B cr1 179044326 A 13 3' UTR
5 FAM46A cr6 82457992 T 10 3' UTR
5 FBN2 cr5 127594063 A 10 3' UTR
5 FBRSL1 cr12 133160562 A 9 3' UTR
5 FBXL4 cr6 99321799 T 10 3' UTR
5 FBXO36 cr2 230876985 A 11 3' UTR
5 FBXW2 cr9 123524089 A 12 3' UTR
5 FCGR3A cr1 161512430 T 9 3' UTR
5 FCHSD2 cr11 72549649 A 10 3' UTR
5 FICD cr12 108913292 A 11 3' UTR
5 FOXN2 cr2 48604358 T 10 3' UTR
5 FOXN3 cr14 89627649 T 11 3' UTR
5 GABRB2 cr5 160719907 A 9 3' UTR
5 GNA13 cr17 63005677 A 10 3' UTR
5 GNAI2 cr3 50296405 C 9 3' UTR
5 GNAI2 cr3 50296330 A 12 3' UTR
5 GPR12 cr13 27330332 T 10 3' UTR
5 GPR137B cr1 236372038 T 10 3' UTR
5 GPR37L1 cr1 202098133 T 21 3' UTR
5 GRID1 cr10 87359476 T 11 3' UTR
5 GRIN3A cr9 104331901 A 9 3' UTR
5 GRPEL2 cr5 148731880 T 14 3' UTR
5 HAPLN1 cr5 82937251 A 10 3' UTR
5 HBS1L cr6 135357535 A 10 3' UTR
5 HDAC4 cr2 239974109 A 9 3' UTR
5 HEXA cr15 72636197 T 10 3' UTR
5 HNRNPK cr9 86583800 A 10 3' UTR
5 HOOK3 cr8 42876247 A 29 3' UTR
5 HRH1 cr3 11303522 A 11 3' UTR
5 HUWE1 crX 53559710 T 11 3' UTR
5 IGDCC4 cr15 65674432 A 12 3' UTR
5 IGF1 cr12 102790988 A 11 3' UTR
5 IGF2BP2 cr3 185361762 T 12 3' UTR
5 IGFBP5 cr2 217537240 A 11 3' UTR
5 INSR cr19 7116555 A 12 3' UTR
5 JAM3 cr11 134020535 T 12 3' UTR
29
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
5 KCTD1 cr18 24035448 T 12 3' UTR
5 KCTD6 cr3 58487415 T 11 3' UTR
5 KDM5A cr12 393804 T 11 3' UTR
5 KIAA1324 cr1 109749368 T 11 3' UTR
5 KIAA1324 cr1 109748644 T 11 3' UTR
5 KIAA1737 cr14 77582032 T 14 3' UTR
5 KIAA2026 cr9 5919249 T 11 3' UTR
5 KLHL20 cr1 173754885 A 12 3' UTR
5 KLHL24 cr3 183400567 T 10 3' UTR
5 LDHAL6A cr11 18500557 T 12 3' UTR
5 LENG8 cr19 54972801 T 9 3' UTR
5 LHFP cr13 39917691 A 12 3' UTR
5 LMO4 cr1 87811174 A 11 3' UTR
5 LPHN3 cr4 62937355 A 12 3' UTR
5 LPL cr8 19823634 A 11 3' UTR
5 LRRC27 cr10 134193076 T 9 3' UTR
5 LRRC4B cr19 51020187 T 10 3' UTR
5 LTN1 cr21 30301899 T 10 3' UTR
5 MAP1B cr5 71505347 A 11 3' UTR
5 MAP3K7 cr6 91225524 A 9 3' UTR
5 MAPK1 cr22 22114660 T 12 3' UTR
5 MAX cr14 65543065 A 10 3' UTR
5 MED1 cr17 37562164 T 11 3' UTR
5 MED13 cr17 60022040 A 11 3' UTR
5 MED28 cr4 17625638 T 10 3' UTR
5 MKX cr10 27962805 A 10 3' UTR
5 MNT cr17 2287533 T 13 3' UTR
5 MOBKL2A cr19 2072745 A 13 3' UTR
5 MORC1 cr3 108677146 A 10 3' UTR
5 MST4 crX 131208596 A 9 3' UTR
5 MTA2 cr11 62360911 A 27 3' UTR
5 MTF1 cr1 38278949 A 11 3' UTR
5 NAA38 cr7 117832209 A 9 3' UTR
5 NAPG cr18 10551001 T 11 3' UTR
5 NCOA1 cr2 24991385 A 25 3' UTR
5 NCOA3 cr20 46282984 T 11 3' UTR
5 NKAIN4 cr20 61872616 T 12 3' UTR
5 NLGN4X crX 5808268 T 11 3' UTR
5 NMNAT1 cr1 10044969 T 8 3' UTR
5 NPLOC4 cr17 79525610 A 9 3' UTR
5 NPNT cr4 106890724 T 10 3' UTR
5 NR2F2 cr15 96881909 T 10 3' UTR
30
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
5 NUFIP2 cr17 27585085 T 12 3' UTR
5 ODZ4 cr11 78367062 T 9 3' UTR
5 OGFOD1 cr16 56510333 T 12 3' UTR
5 OPA3 cr19 46049757 T 14 3' UTR
5 OSBP cr11 59341900 T 12 3' UTR
5 PAPD5 cr16 50264179 T 10 3' UTR
5 PAPD5 cr16 50263692 T 10 3' UTR
5 PAPD5 cr16 50263454 A 8 3' UTR
5 PFN1 cr17 4848972 A 10 3' UTR
5 PHKB cr16 47734578 A 10 3' UTR
5 PIGM cr1 159998080 T 11 3' UTR
5 PIGM cr1 159997525 A 10 3' UTR
32944046
5 PKP2 cr12 A 11 3' UTR
30781644
5 PLAGL2 cr20 A 11 3' UTR
5 PLEKHM3 cr2 208686453 A 10 3' UTR
5 POLR3B cr12 106903452 A 9 3' UTR
5 PPIC cr5 122359467 A 12 3' UTR
5 PPP1R10 cr6 30568234 A 11 3' UTR
5 PPP6C cr9 127911821 A 11 3' UTR
5 PPPDE1 cr1 244869241 A 12 3' UTR
5 PRKX crX 3525721 T 9 3' UTR
5 PRRG1 crX 37313537 T 10 3' UTR
5 PSMD5 cr9 123578376 A 10 3' UTR
5 PTGS2 cr1 186642025 T 9 3' UTR
5 RAB11FIP2 cr10 119765266 T 11 3' UTR
5 RANBP10 cr16 67757024 T 10 3' UTR
5 RASGRP4 cr19 38900377 A 11 3' UTR
5 RBL1 cr20 35632028 A 13 3' UTR
5 RBM15B cr3 51431679 T 11 3' UTR
5 RBMS3 cr3 30046424 A 11 3' UTR
5 RC3H1 cr1 173904709 A 11 3' UTR
5 RHOBTB3 cr5 95129188 A 12 3' UTR
5 RIMBP2 cr12 130882589 A 11 3' UTR
5 RNF41 cr12 56599353 G 10 3' UTR
5 RRP15 cr1 218506526 A 10 3' UTR
5 SAMD12 cr8 119208740 A 13 3' UTR
5 SAR1A cr10 71910315 A 10 3' UTR
5 SARM1 cr17 26726913 T 12 3' UTR
5 SATB2 cr2 200135086 T 10 3' UTR
5 SCAI cr9 127706579 T 16 3' UTR
5 SCAMP1 cr5 77772627 A 10 3' UTR

31
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
5 SCUBE3 cr6 35216591 A 10 3' UTR
5 SDC4 cr20 43954848 A 9 3' UTR
5 SENP5 cr3 196660478 T 11 3' UTR
5 SERPINE1 cr7 100781987 G 8 3' UTR
5 SFRS18 cr6 99848035 A 12 3' UTR
5 SH3KBP1 crX 19553810 T 12 3' UTR
5 SIK1 cr21 44835578 A 10 3' UTR
5 SKI cr1 2240043 T 10 3' UTR
5 SLC16A1 cr1 113455427 A 13 3' UTR
5 SLC26A4 cr7 107357810 A 25 3' UTR
5 SLC2A12 cr6 134312045 T 11 3' UTR
5 SLC6A6 cr3 14526824 T 11 3' UTR
5 SLC7A11 cr4 139090880 A 10 3' UTR
5 SMAD5 cr5 135513612 A 11 3' UTR
5 SMG1 cr16 18819070 T 11 3' UTR
5 SMS crX 22012649 T 10 3' UTR
5 SMURF2 cr17 62541185 T 13 3' UTR
5 SNAP23 cr15 42824292 T 14 3' UTR
5 SOST cr17 41831361 T 11 3' UTR
5 SPCS3 cr4 177250844 T 10 3' UTR
5 SPOCK1 cr5 136313113 A 11 3' UTR
5 SSR1 cr6 7284948 T 13 3' UTR
5 SSR3 cr3 156259169 T 10 3' UTR
5 ST3GAL5 cr2 86067101 A 9 3' UTR
5 ST7L cr1 113066620 A 11 3' UTR
5 STC2 cr5 172744019 T 12 3' UTR
5 STX6 cr1 180945093 A 9 3' UTR
5 SYNJ2BP cr14 70838863 T 10 3' UTR
5 SYT11 cr1 155851834 T 12 3' UTR
5 TAF8 cr6 42045495 T 11 3' UTR
5 THRAP3 cr1 36770047 T 17 3' UTR
5 TLL2 cr10 98124863 A 11 3' UTR
5 TMEM119 cr12 108984472 A 11 3' UTR
5 TMEM201 cr1 9674449 T 10 3' UTR
5 TMOD3 cr15 52201130 T 10 3' UTR
5 TMTC1 cr12 29656466 A 8 3' UTR
5 TNFAIP1 cr17 26672324 A 10 3' UTR
5 TNFAIP3 cr6 138204003 A 12 3' UTR
5 TNRC6B cr22 40724536 T 10 3' UTR
5 TRIP10 cr19 6751495 A 12 3' UTR
5 TRPM1 cr15 31293995 A 11 3' UTR
5 TSC22D2 cr3 150177375 T 13 3' UTR
32
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
5 TTC39C cr18 21715264 T 11 3' UTR
5 UBE2G2 cr21 46191155 A 12 3' UTR
5 UBLCP1 cr5 158712401 A 11 3' UTR
5 UBN2 cr7 138989574 T 10 3' UTR
5 UGT8 cr4 115598050 T 11 3' UTR
5 UTP15 cr5 72876582 T 12 3' UTR
5 WASL cr7 123323428 A 12 3' UTR
5 WDFY2 cr13 52334589 A 11 3' UTR
5 WDR76 cr15 44158820 T 21 3' UTR
5 XYLT1 cr16 17199280 T 8 3' UTR
5 ZBTB41 cr1 197124441 A 11 3' UTR
5 ZC3H6 cr2 113097277 T 13 3' UTR
5 ZDBF2 cr2 207177005 T 8 3' UTR
5 ZNF287 cr17 16454419 T 9 3' UTR
5 ZNF395 cr8 28205776 T 27 3' UTR
5 ZNF451 cr6 57033558 A 8 3' UTR
5 ZNF566 cr19 36937171 T 18 3' UTR
5 ZNF572 cr8 125990551 T 11 3' UTR
5 ZNF780B cr19 40535764 A 10 3' UTR
5 ZXDC cr3 126179925 T 11 3' UTR
5 ZYG11B cr1 53290310 A 13 3' UTR
4 SEPT11 cr4 77957803 T 10 3' UTR
4 ACVR1C cr2 158390343 A 10 3' UTR
4 ACVR2A cr2 148687300 A 10 3' UTR
4 ADAMTS18 cr16 77316279 T 11 3' UTR
4 AGPAT5 cr8 6617153 A 11 3' UTR
4 AKAP1 cr17 55198578 A 14 3' UTR
4 ANKIB1 cr7 92030525 A 11 3' UTR
4 ANKRD13B cr17 27941253 T 19 3' UTR
4 ANKS1B cr12 99138458 T 11 3' UTR
4 ARHGAP12 cr10 32096465 A 9 3' UTR
4 ARID5B cr10 63853410 T 27 3' UTR
4 ARL2BP cr16 57287376 T 12 3' UTR
4 ARMC8 cr3 137964255 T 9 3' UTR
4 ARPP19 cr15 52841555 A 10 3' UTR
4 ATP6V0D1 cr16 67472221 G 9 3' UTR
4 AXIN2 cr17 63525462 A 11 3' UTR
4 BAG5 cr14 104023132 A 10 3' UTR
4 BARX2 cr11 129321925 T 10 3' UTR
4 BCL11A cr2 60685736 T 13 3' UTR
4 BCL11A cr2 60684501 A 11 3' UTR
4 BCL11B cr14 99637754 T 10 3' UTR
33
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 BCL7A cr12 122498867 A 11 3' UTR
4 BEND4 cr4 42114856 A 10 3' UTR
4 BFAR cr16 14762692 A 16 3' UTR
4 BRAF cr7 140434294 A 9 3' UTR
4 BTBD7 cr14 93708031 A 9 3' UTR
4 BTBD7 cr14 93705796 T 13 3' UTR
4 C10orf46 cr10 120445285 A 10 3' UTR
4 C10orf84 cr10 120069534 A 9 3' UTR
4 C11orf41 cr11 33690228 T 8 3' UTR
4 C11orf58 cr11 16777810 T 24 3' UTR
4 C11orf58 cr11 16777368 T 9 3' UTR
4 C12orf23 cr12 107367018 A 10 3' UTR
4 C12orf5 cr12 4463524 T 10 3' UTR
4 C12orf66 cr12 64587315 A 10 3' UTR
4 C12orf76 cr12 110479725 A 11 3' UTR
4 C14orf101 cr14 57116192 A 10 3' UTR
4 C14orf43 cr14 74183215 A 11 3' UTR
4 C16orf45 cr16 15680717 C 9 3' UTR
4 C16orf87 cr16 46836142 T 12 3' UTR
4 C17orf78 cr17 35749617 A 11 3' UTR
4 C18orf25 cr18 43846502 A 9 3' UTR
4 C3orf70 cr3 184795851 A 10 3' UTR
4 C6orf170 cr6 121401361 T 21 3' UTR
4 C6orf62 cr6 24705738 A 10 3' UTR
4 C7orf45 cr7 129856476 A 11 3' UTR
4 C7orf69 cr7 47859241 A 11 3' UTR
4 C8orf48 cr8 13425580 T 9 3' UTR
4 C9 cr5 39285017 T 9 3' UTR
4 CA5B crX 15801003 T 10 3' UTR
4 CABLES2 cr20 60965113 A 10 3' UTR
4 CAPRIN1 cr11 34121880 T 8 3' UTR
4 CBFA2T2 cr20 32236969 T 11 3' UTR
4 CBL cr11 119172610 A 10 3' UTR
4 CBY1 cr22 39069285 T 9 3' UTR
4 CC2D1B cr1 52817555 A 22 3' UTR
4 CCND1 cr11 69466274 A 9 3' UTR
4 CD59 cr11 33730438 T 8 3' UTR
4 CD96 cr3 111368930 A 9 3' UTR
4 CDH13 cr16 83828683 A 11 3' UTR
4 CDH4 cr20 60512276 A 19 3' UTR
4 CEP164 cr11 117283967 T 11 3' UTR
4 CEP57L1 cr6 109484935 T 10 3' UTR
34
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 CHMP4C cr8 82671242 A 12 3' UTR
4 CLCN5 crX 49858223 A 9 3' UTR
4 CLDN14 cr21 37833059 T 10 3' UTR
4 CLEC3A cr16 78065330 T 12 3' UTR
4 CMTM8 cr3 32411483 A 9 3' UTR
4 CNNM1 cr10 101153279 A 9 3' UTR
4 CNNM3 cr2 97499281 A 12 3' UTR
4 CORO2B cr15 69020046 T 10 3' UTR
4 CPSF2 cr14 92630061 T 9 3' UTR
4 CREBBP cr16 3776240 G 10 3' UTR
4 CRTC1 cr19 18890340 A 9 3' UTR
4 CSMD3 cr8 113236641 T 9 3' UTR
4 CTTN cr11 70281530 T 10 3' UTR
4 CYP1B1 cr2 38296985 T 10 3' UTR
4 CYP20A1 cr2 204163758 A 10 3' UTR
4 CYP2C18 cr10 96495747 A 9 3' UTR
4 CYP4F22 cr19 15662704 C 9 3' UTR
4 DACH1 cr13 72014288 T 11 3' UTR
4 DCUN1D3 cr16 20870892 A 10 3' UTR
4 DCUN1D5 cr11 102928449 A 11 3' UTR
4 DDHD1 cr14 53513329 T 10 3' UTR
4 DDX18 cr2 118589332 A 9 3' UTR
4 DDX3X crX 41207099 T 10 3' UTR
4 DFFB cr1 3801133 T 11 3' UTR
4 DGCR8 cr22 20099229 C 16 3' UTR
4 DICER1 cr14 95554259 T 10 3' UTR
4 DLGAP4 cr20 35156622 T 10 3' UTR
4 DPP8 cr15 65738415 A 11 3' UTR
4 DSE cr6 116758558 A 11 3' UTR
4 DSTYK cr1 205115701 T 16 3' UTR
4 DUT cr15 48634591 A 10 3' UTR
4 DUT cr15 48634443 A 9 3' UTR
4 EAPP cr14 34985335 A 10 3' UTR
4 EDEM1 cr3 5260540 T 10 3' UTR
4 EEF2K cr16 22299309 T 19 3' UTR
4 EIF2B2 cr14 75476004 A 10 3' UTR
4 EIF4G3 cr1 21133145 T 12 3' UTR
4 ELAVL3 cr19 11564674 T 11 3' UTR
4 ERLIN2 cr8 37614867 T 10 3' UTR
4 ESRRB cr14 76967818 G 8 3' UTR
4 ETNK1 cr12 22839785 T 28 3' UTR
4 ETS1 cr11 128329018 A 9 3' UTR
35
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 FADS1 cr11 61567668 T 14 3' UTR
4 FAIM3 cr1 207077642 T 18 3' UTR
4 FAM101B cr17 292360 T 10 3' UTR
4 FAM116A cr3 57612436 A 13 3' UTR
4 FAM117B cr2 203633341 T 10 3' UTR
4 FAM126B cr2 201845397 G 7 3' UTR
4 FAM160B1 cr10 116621715 A 9 3' UTR
4 FAM189A1 cr15 29414906 G 8 3' UTR
4 FANCD2 cr3 10143061 T 25 3' UTR
4 FBN2 cr5 127594650 A 8 3' UTR
4 FBXO27 cr19 39515468 T 11 3' UTR
4 FGD4 cr12 32798227 T 12 3' UTR
4 FGD5 cr3 14976010 T 9 3' UTR
4 FGF12 cr3 191859718 T 11 3' UTR
4 FGFR1OP2 cr12 27118562 T 10 3' UTR
4 FLCN cr17 17115789 A 26 3' UTR
4 FMNL3 cr12 50033467 A 10 3' UTR
4 FOXN2 cr2 48603079 T 10 3' UTR
4 FOXO1 cr13 41132503 A 9 3' UTR
4 FOXP1 cr3 71005222 T 9 3' UTR
4 FPGT cr1 74672686 T 9 3' UTR
4 FTSJD1 cr16 71317151 A 10 3' UTR
4 FUT8 cr14 66209673 T 13 3' UTR
4 FZD7 cr2 202902385 A 11 3' UTR
4 GADL1 cr3 30769514 T 11 3' UTR
4 GAL3ST4 cr7 99757342 A 13 3' UTR
4 GAN cr16 81413521 T 12 3' UTR
4 GAPVD1 cr9 128127210 T 10 3' UTR
4 GATAD2A cr19 19617715 T 10 3' UTR
4 GATAD2B cr1 153781275 A 20 3' UTR
4 GDAP2 cr1 118411744 T 10 3' UTR
4 GDAP2 cr1 118408218 A 10 3' UTR
4 GFPT1 cr2 69549530 A 9 3' UTR
4 GLCCI1 cr7 8127832 T 11 3' UTR
4 GLDN cr15 51697574 T 21 3' UTR
4 GLYR1 cr16 4853902 T 10 3' UTR
4 GOLT1B cr12 21669842 A 9 3' UTR
4 GPM6A cr4 176555451 T 10 3' UTR
4 GPR124 cr8 37701260 A 10 3' UTR
4 GPR155 cr2 175299037 T 13 3' UTR
4 GPR161 cr1 168054505 T 10 3' UTR
4 GPR180 cr13 95279582 A 8 3' UTR
36
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 GPX8 cr5 54460112 T 10 3' UTR
4 GRAMD3 cr5 125829168 T 10 3' UTR
4 GSTCD cr4 106767825 T 20 3' UTR
4 GXYLT1 cr12 42477780 A 10 3' UTR
4 HCCS crX 11140989 T 11 3' UTR
4 HCN1 cr5 45260992 T 9 3' UTR
4 HDAC4 cr2 239971996 A 11 3' UTR
4 HELZ cr17 65067696 T 8 3' UTR
4 HEY2 cr6 126081692 T 10 3' UTR
4 HIF3A cr19 46843765 T 12 3' UTR
4 HNRNPA1L2 cr13 53217847 T 11 3' UTR
4 HNRNPK cr9 86584095 C 9 3' UTR
4 HOOK1 cr1 60338642 A 8 3' UTR
4 HP1BP3 cr1 21070971 A 10 3' UTR
4 HS3ST5 cr6 114376959 A 10 3' UTR
4 HUWE1 crX 53559518 A 12 3' UTR
4 IKZF4 cr12 56431620 A 10 3' UTR
4 IL7R cr5 35876844 A 10 3' UTR
4 IMPG2 cr3 100945663 A 9 3' UTR
4 INSR cr19 7112871 A 10 3' UTR
4 IRGQ cr19 44094353 A 11 3' UTR
4 IRS1 cr2 227600758 T 11 3' UTR
4 ISL1 cr5 50689706 A 9 3' UTR
4 ITPRIPL1 cr2 96994050 A 10 3' UTR
4 JAKMIP1 cr4 6055625 A 11 3' UTR
4 KBTBD7 cr13 41766026 A 9 3' UTR
4 KBTBD8 cr3 67059954 T 10 3' UTR
4 KCNMA1 cr10 78646910 A 9 3' UTR
4 KDELR2 cr7 6501817 A 10 3' UTR
4 KDM5A cr12 393295 T 11 3' UTR
4 KDSR cr18 60998042 T 15 3' UTR
4 KIAA0182 cr16 85706942 A 10 3' UTR
4 KIAA0494 cr1 47142711 T 9 3' UTR
4 KIAA0825 cr5 93487128 A 28 3' UTR
4 KIF1B cr1 10438932 T 10 3' UTR
4 KIF1B cr1 10437995 A 13 3' UTR
4 KLF12 cr13 74261703 T 11 3' UTR
4 KLHL4 crX 86922592 A 12 3' UTR
4 KPNA6 cr1 32639763 C 9 3' UTR
4 KREMEN1 cr22 29539729 A 14 3' UTR
4 L1CAM crX 153127125 T 9 3' UTR
4 LARP4B cr10 856761 A 9 3' UTR
37
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 LATS2 cr13 21547830 A 9 3' UTR
4 LBR cr1 225590887 A 10 3' UTR
4 LEF1 cr4 108969352 A 9 3' UTR
4 LIAS cr4 39478848 A 11 3' UTR
4 LIMS1 cr2 109300693 A 10 3' UTR
4 LIN7C cr11 27517538 A 10 3' UTR
4 LIX1 cr5 96428100 A 10 3' UTR
4 LMTK2 cr7 97837420 A 11 3' UTR
4 LRCH2 crX 114346112 T 10 3' UTR
4 LRRC8A cr9 131679397 A 11 3' UTR
4 LUZP2 cr11 25102964 A 12 3' UTR
4 LYRM7 cr5 130540369 A 15 3' UTR
4 MAP1B cr5 71502852 A 10 3' UTR
4 MAP4 cr3 48016254 A 13 3' UTR
4 MAP6 cr11 75316787 A 11 3' UTR
4 MAPK1IP1L cr14 55534134 T 10 3' UTR
4 MB21D2 cr3 192516152 A 10 3' UTR
4 MDM2 cr12 69233886 T 11 3' UTR
4 MEF2C cr5 88017643 A 7 3' UTR
4 MEGF9 cr9 123366681 T 10 3' UTR
4 METAP2 cr12 95908545 A 11 3' UTR
4 METTL8 cr2 172174950 T 8 3' UTR
4 MEX3A cr1 156044195 T 17 3' UTR
4 MFN2 cr1 12073251 A 11 3' UTR
4 MGAT4A cr2 99236361 T 10 3' UTR
4 MIDN cr19 1258791 A 10 3' UTR
4 MKLN1 cr7 131181200 T 10 3' UTR
4 MKRN3 cr15 23812682 T 8 3' UTR
4 MLL2 cr12 49413198 A 10 3' UTR
4 MLLT6 cr17 36883386 T 16 3' UTR
4 MMP2 cr16 55539895 T 10 3' UTR
4 MOSPD1 crX 134022551 A 9 3' UTR
4 MRPL44 cr2 224831951 T 11 3' UTR
4 MTMR4 cr17 56567367 A 9 3' UTR
4 MTSS1 cr8 125564840 A 9 3' UTR
4 MYCL1 cr1 40361307 A 10 3' UTR
4 NAPB cr20 23355923 A 9 3' UTR
4 NARG2 cr15 60714335 T 11 3' UTR
4 NCS1 cr9 132996076 T 12 3' UTR
4 NDFIP1 cr5 141533930 T 10 3' UTR
4 NEGR1 cr1 71869847 T 11 3' UTR
4 NEIL3 cr4 178283942 T 10 3' UTR
38
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 NF2 cr22 30092784 T 14 3' UTR
4 NLK cr17 26523190 T 10 3' UTR
4 NPC2 cr14 74946724 A 10 3' UTR
4 NR2F2 cr15 96882212 G 8 3' UTR
4 NRSN1 cr6 24147583 T 10 3' UTR
4 OSBP2 cr22 31302451 T 10 3' UTR
4 OSBPL3 cr7 24837354 A 10 3' UTR
4 OTUD4 cr4 146058513 T 8 3' UTR
4 OTUD4 cr4 146057615 G 13 3' UTR
4 OXR1 cr8 107764095 A 10 3' UTR
4 PABPC5 crX 90691818 T 9 3' UTR
4 PAICS cr4 57327144 A 10 3' UTR
4 PAK1IP1 cr6 10709747 T 12 3' UTR
4 PALM2 cr9 112706843 A 11 3' UTR
4 PAPD4 cr5 78982336 T 10 3' UTR
4 PAPOLA cr14 97033430 A 10 3' UTR
4 PCDH17 cr13 58300047 A 10 3' UTR
4 PCNP cr3 101312474 A 10 3' UTR
4 PDE4C cr19 18320061 T 12 3' UTR
4 PDGFA cr7 537622 A 11 3' UTR
4 PDGFA cr7 536908 T 11 3' UTR
4 PGM2L1 cr11 74047320 T 11 3' UTR
4 PIGW cr17 34894609 T 11 3' UTR
4 PIK3R1 cr5 67595054 A 10 3' UTR
4 PIM1 cr6 37143155 T 11 3' UTR
4 PIP5K1A cr1 151220867 T 11 3' UTR
4 PKD2 cr4 88998190 A 11 3' UTR
4 PKN2 cr1 89301773 T 11 3' UTR
4 PLA2G12A cr4 110633665 T 10 3' UTR
4 PLAGL2 cr20 30784138 T 11 3' UTR
4 PLCB1 cr20 8863118 A 10 3' UTR
4 PLCL1 cr2 199013907 T 9 3' UTR
4 PLCXD3 cr5 41307606 A 9 3' UTR
4 PLK2 cr5 57749858 A 9 3' UTR
4 PODNL1 cr19 14042032 G 8 3' UTR
4 PODXL cr7 131185943 A 11 3' UTR
4 POLH cr6 43584323 A 14 3' UTR
4 PPAP2B cr1 56962088 T 10 3' UTR
4 PPARA cr22 46633507 A 16 3' UTR
4 PPARGC1B cr5 149227267 A 14 3' UTR
4 PPM1E cr17 57060351 A 10 3' UTR
4 PPP1R3A cr7 113517422 A 9 3' UTR
39
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 PPP3CA cr4 101946069 T 10 3' UTR
4 PRDM15 cr21 43220664 A 12 3' UTR
4 PROSC cr8 37636576 A 10 3' UTR
4 PRTG cr15 55907920 T 10 3' UTR
4 PTP4A2 cr1 32374021 A 10 3' UTR
4 PTPN22 cr1 114357118 T 10 3' UTR
4 PTPRF cr1 44088117 T 11 3' UTR
4 PTRF cr17 40554683 A 15 3' UTR
4 PUM1 cr1 31405680 T 10 3' UTR
4 QRICH1 cr3 49067797 A 11 3' UTR
4 RAB39B crX 154488466 T 11 3' UTR
4 RAB7L1 cr1 205738564 T 10 3' UTR
4 RAB8B cr15 63559206 T 12 3' UTR
4 RASAL2 cr1 178447287 T 11 3' UTR
4 RBM12B cr8 94745547 A 10 3' UTR
4 RBM38 cr20 55983973 G 8 3' UTR
4 RBMS3 cr3 30045473 T 10 3' UTR
4 RDX cr11 110102325 A 10 3' UTR
4 RGS18 cr1 192154126 T 8 3' UTR
4 RGS6 cr14 73030606 A 11 3' UTR
4 RND2 cr17 41181921 A 24 3' UTR
4 RNF122 cr8 33405498 A 26 3' UTR
4 RNGTT cr6 89320667 T 10 3' UTR
4 ROCK1 cr18 18530891 A 10 3' UTR
4 RPRD2 cr1 150447772 T 10 3' UTR
4 RPRD2 cr1 150445907 T 10 3' UTR
4 RRM2 cr2 10269544 T 10 3' UTR
4 RSBN1L cr7 77408705 A 9 3' UTR
4 RSL1D1 cr16 11930997 T 11 3' UTR
4 SALL3 cr18 76757543 A 10 3' UTR
4 SAMD4A cr14 55257700 A 10 3' UTR
4 SASH1 cr6 148872287 T 10 3' UTR
4 SATB1 cr3 18390227 T 12 3' UTR
4 SCN1A cr2 166846936 T 10 3' UTR
4 SDC4 cr20 43955023 A 24 3' UTR
4 SEC63 cr6 108190403 A 10 3' UTR
4 SENP5 cr3 196658083 A 10 3' UTR
4 SEPHS1 cr10 13360740 A 11 3' UTR
4 SFXN1 cr5 174954918 T 22 3' UTR
4 SGK223 cr8 8175297 T 12 3' UTR
4 SH2B3 cr12 111887735 T 14 3' UTR
4 SHC1 cr1 154935862 G 8 3' UTR
40
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 SHC4 cr15 49117721 T 10 3' UTR
4 SHCBP1 cr16 46614658 T 14 3' UTR
4 SHOC2 cr10 112773341 T 10 3' UTR
4 SIPA1L3 cr19 38698929 T 10 3' UTR
4 SIPA1L3 cr19 38698868 T 10 3' UTR
4 SIX4 cr14 61178202 A 10 3' UTR
4 SLAIN2 cr4 48426160 T 9 3' UTR
4 SLC17A5 cr6 74303467 A 10 3' UTR
4 SLC22A5 cr5 131730903 T 17 3' UTR
4 SLC25A36 cr3 140696772 A 11 3' UTR
4 SLC2A2 cr3 170715683 T 10 3' UTR
4 SLC39A9 cr14 69928356 T 10 3' UTR
4 SLC6A15 cr12 85253350 T 10 3' UTR
4 SLC9A6 crX 135128103 T 11 3' UTR
4 SMAD3 cr15 67485102 A 9 3' UTR
4 SMAD4 cr18 48605007 T 10 3' UTR
4 SMAD7 cr18 46447623 A 10 3' UTR
4 SORL1 cr11 121502077 T 11 3' UTR
4 SORL1 cr11 121501334 T 9 3' UTR
4 SOST cr17 41831941 T 10 3' UTR
4 SOX30 cr5 157053271 T 10 3' UTR
4 SPATA13 cr13 24878597 T 11 3' UTR
4 SPATS2 cr12 49921053 T 10 3' UTR
4 SPINK7 cr5 147695440 T 10 3' UTR
4 SPOP cr17 47676672 A 13 3' UTR
4 SPRED1 cr15 38648129 A 9 3' UTR
4 SPTBN1 cr2 54898095 T 10 3' UTR
4 SRRM4 cr12 119599690 A 10 3' UTR
4 SRRM4 cr12 119596858 T 9 3' UTR
4 STAT2 cr12 56736372 A 13 3' UTR
4 STK4 cr20 43708275 A 10 3' UTR
4 STMN2 cr8 80577224 A 13 3' UTR
4 SUMO2 cr17 73164056 T 11 3' UTR
4 SYT13 cr11 45264120 A 9 3' UTR
4 TACC1 cr8 38708293 A 25 3' UTR
4 TAOK1 cr17 27871502 A 11 3' UTR
4 TBL1X crX 9684635 A 9 3' UTR
4 TFAP2B cr6 50814917 T 9 3' UTR
4 TFCP2L1 cr2 121975868 T 11 3' UTR
4 THAP2 cr12 72073229 T 10 3' UTR
4 THSD4 cr15 72072880 A 10 3' UTR
4 THSD7A cr7 11411520 T 10 3' UTR
41
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 TLCD2 cr17 1606349 T 13 3' UTR
4 TM9SF4 cr20 30754878 T 11 3' UTR
4 TMEM14C cr6 10731011 A 9 3' UTR
4 TMEM169 cr2 216966376 T 10 3' UTR
4 TMEM192 cr4 165997961 T 10 3' UTR
4 TMEM40 cr3 12775743 T 9 3' UTR
4 TNFAIP8 cr5 118729618 A 10 3' UTR
4 TNRC6C cr17 76104332 C 9 3' UTR
4 TPM4 cr19 16212343 T 9 3' UTR
4 TRAK2 cr2 202244537 T 11 3' UTR
4 TRIM33 cr1 114940229 T 13 3' UTR
4 TRIM56 cr7 100733606 A 9 3' UTR
4 TRIM9 cr14 51442832 T 10 3' UTR
4 TRPC1 cr3 142525356 T 9 3' UTR
4 TRPS1 cr8 116424772 T 10 3' UTR
4 TRPS1 cr8 116423510 A 12 3' UTR
4 TSPAN31 cr12 58141530 T 13 3' UTR
4 TTC14 cr3 180326182 T 15 3' UTR
4 TULP4 cr6 158929910 T 27 3' UTR
4 TXNDC9 cr2 99936109 A 9 3' UTR
4 U2AF1 cr21 44513110 T 11 3' UTR
4 UBE2G1 cr17 4173433 A 10 3' UTR
4 UBE2K cr4 39780193 A 11 3' UTR
4 UBE3C cr7 157060934 T 10 3' UTR
4 UBE4B cr1 10240859 T 10 3' UTR
4 UBFD1 cr16 23582355 T 10 3' UTR
4 UBN2 cr7 138992059 T 9 3' UTR
4 USF2 cr19 35770658 A 10 3' UTR
4 USP31 cr16 23077020 T 11 3' UTR
4 USP43 cr17 9632696 T 12 3' UTR
4 USP43 cr17 9632427 T 13 3' UTR
4 USP43 cr17 9632418 A 9 3' UTR
4 VEZF1 cr17 56051105 T 14 3' UTR
4 VGLL3 cr3 86990599 T 11 3' UTR
4 VPS53 cr17 422006 A 27 3' UTR
4 VTI1A cr10 114575744 T 10 3' UTR
4 WDR3 cr1 118502087 T 11 3' UTR
4 WDR82 cr3 52288956 T 19 3' UTR
4 WHSC1 cr4 1945453 A 9 3' UTR
4 XKR6 cr8 10755309 T 10 3' UTR
4 XKR6 cr8 10755102 T 11 3' UTR
4 ZBTB16 cr11 114121371 A 11 3' UTR
42
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 ZBTB4 cr17 7363093 A 10 3' UTR
4 ZC3HAV1L cr7 138710878 A 11 3' UTR
4 ZCCHC13 crX 73524759 A 9 3' UTR
4 ZCCHC2 cr18 60244188 A 10 3' UTR
4 ZFHX4 cr8 77778696 T 14 3' UTR
4 ZFP36L1 cr14 69255309 T 12 3' UTR
4 ZFP36L2 cr2 43450053 C 8 3' UTR
4 ZMIZ1 cr10 81075616 A 10 3' UTR
4 ZNF498 cr7 99229241 T 11 3' UTR
4 ZNF528 cr19 52920874 T 12 3' UTR
4 ZNF594 cr17 5084035 A 10 3' UTR
4 ZNF618 cr9 116812463 A 9 3' UTR
4 ZNF629 cr16 30792783 T 10 3' UTR
4 ZNF681 cr19 23925293 A 13 3' UTR
4 ZNF737 cr19 20726934 A 11 3' UTR
4 ZNF740 cr12 53584463 T 14 3' UTR
4 ZSCAN30 cr18 32831761 T 12 3' UTR
13 GABRG2 cr5 161494990 A 12 5' UTR
12 ARHGEF11 cr1 157014811 A 12 5' UTR
12 CCT6B cr17 33288433 A 11 5' UTR
12 LRMP cr12 25205380 A 11 5' UTR
11 TMEM177 cr2 120437061 A 11 5' UTR
11 ZNF781 cr19 38161161 T 11 5' UTR
10 EPHB6 cr7 142560576 A 13 5' UTR
10 LMOD3 cr3 69171664 T 13 5' UTR
10 MBNL1 cr3 152017897 T 11 5' UTR
9 ARHGEF9 crX 62974288 T 12 5' UTR
9 BDNF cr11 27741184 A 10 5' UTR
9 CBLN2 cr18 70211389 A 14 5' UTR
9 OIT3 cr10 74653468 A 10 5' UTR
8 BMP5 cr6 55739711 A 14 5' UTR
8 LOC642587 cr1 209602342 T 13 5' UTR
8 OMD cr9 95179844 T 11 5' UTR
8 SEMA6A cr5 115910134 A 11 5' UTR
8 TCF4 cr18 53255634 A 12 5' UTR
7 ASPH cr8 62602295 A 11 5' UTR
7 CNTNAP2 cr7 145813627 T 11 5' UTR
7 DIO2 cr14 80678323 T 14 5' UTR
7 DIO2 cr14 80678077 T 25 5' UTR
7 GSDMC cr8 130798567 A 14 5' UTR
7 PTP4A2 cr1 32384716 A 11 5' UTR
7 ZXDB crX 57618380 T 9 5' UTR
43
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
6 AMD1 cr6 111196178 A 11 5' UTR
6 DDX3X crX 41192964 A 10 5' UTR
6 ESCO1 cr18 19164371 A 11 5' UTR
6 GEN1 cr2 17935494 T 11 5' UTR
6 LPHN1 cr19 14316982 A 15 5' UTR
6 LRRC70 cr5 61874619 A 18 5' UTR
6 MEIS1 cr2 66662690 T 13 5' UTR
6 SATB1 cr3 18465613 A 13 5' UTR
6 ST7L cr1 113162029 C 10 5' UTR
6 TMEM31 crX 102965989 T 10 5' UTR
6 TOX cr8 60031707 A 14 5' UTR
5 AAK1 cr2 69870217 T 24 5' UTR
5 ARHGEF11 cr1 157014870 A 11 5' UTR
5 CBLN2 cr18 70211440 A 9 5' UTR
5 CEPT1 cr1 111690319 A 9 5' UTR
5 EMP1 cr12 13364426 A 10 5' UTR
5 GTF2A1 cr14 81686922 A 13 5' UTR
5 L3MBTL3 cr6 130339785 A 10 5' UTR
5 LMO7 cr13 76195056 A 9 5' UTR
5 LPAR4 crX 78003392 A 31 5' UTR
5 LRRC4C cr11 40314470 A 10 5' UTR
5 MCF2 crX 138724841 A 15 5' UTR
5 NDE1 cr16 15737427 T 11 5' UTR
5 PBX1 cr1 164528904 T 10 5' UTR
5 PRMT8 cr12 3600691 T 11 5' UTR
5 PTPRB cr12 71031210 A 10 5' UTR
5 SCN2B cr11 118047234 A 9 5' UTR
5 TIGD7 cr16 3350676 A 10 5' UTR
5 TSHZ1 cr18 72922942 T 10 5' UTR
5 XRRA1 cr11 74656098 T 10 5' UTR
5 ZXDA crX 57936946 A 9 5' UTR
4 ABCC10 cr6 43399532 T 10 5' UTR
4 C1QL3 cr10 16563613 T 10 5' UTR
4 CPLX4 cr18 56985739 A 10 5' UTR
4 DHRS3 cr1 12677525 A 21 5' UTR
4 FAM65B cr6 24877343 A 8 5' UTR
4 GRIA2 cr4 158142151 A 9 5' UTR
4 HEXIM1 cr17 43226461 T 10 5' UTR
4 HRH2 cr5 175110094 A 21 5' UTR
4 HYLS1 cr11 125753769 A 10 5' UTR
4 IL18RAP cr2 103035368 T 11 5' UTR
4 MBNL1 cr3 152017452 A 10 5' UTR
44
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 NLRP3 cr1 247581609 T 12 5' UTR
4 NR2F2 cr15 96874920 T 11 5' UTR
4 NRXN3 cr14 79746442 T 10 5' UTR
4 OBFC2A cr2 192543129 T 24 5' UTR
4 PDGFB cr22 39640806 T 16 5' UTR
4 PIK3R1 cr5 67584512 T 12 5' UTR
4 PPP2R5C cr14 102276205 T 11 5' UTR
4 RALYL cr8 85095860 T 11 5' UTR
4 RFWD2 cr1 176176257 T 9 5' UTR
4 RGS4 cr1 163038838 T 10 5' UTR
4 SCN2A cr2 166150520 A 28 5' UTR
4 SEMA3E cr7 83278198 A 16 5' UTR
4 SETBP1 cr18 42260910 G 8 5' UTR
4 SIAE,SPA17 cr11 124543762 T 15 5' UTR
4 SKIV2L2 cr5 54603686 A 13 5' UTR
4 SLC38A5 crX 48327811 T 12 5' UTR
4 STIM2 cr4 26862546 T 18 5' UTR
4 STK11 cr19 1206796 T 10 5' UTR
4 TGFB3 cr14 76447771 A 11 5' UTR
4 TRIP6 cr7 100464995 A 10 5' UTR
4 ZNF107 cr7 64152284 A 8 5' UTR

Debe señalarse que algunos de los genes enumerados en la tabla 1 tienen más de un indel recurrente en las
5 regiones UTR (por ejemplo, CALN1, EIF4G3, KDM5A), lo que aumenta la probabilidad de que estas regiones
genómicas no se vieran afectadas aleatoriamente, sino que se sometieran a una selección positiva.

Es importante señalar que también los homopolímeros de las regiones exónicas se ven afectados con mayor
frecuencia por indeles en los tumores deficientes en MMR. Tal como se explica en, por ejemplo, el ejemplo 4, esto
10 no se basa en la longitud de la secuencia, sino que es debido a la selección clonal positiva. Por lo tanto, aunque por
lo general presentan mutaciones recurrentes con menos frecuencia, estas mutaciones podrían ser impulsoras de la
progresión del tumor. En la tabla 2 se proporciona una lista de los 31 genes afectados con mayor frecuencia por
indeles en sus regiones exónicas.

15

45
E13717473
ES 2 906 023 T3 11-02-2022

46
E13717473
ES 2 906 023 T3 11-02-2022

47
E13717473
ES 2 906 023 T3 11-02-2022

48
E13717473
ES 2 906 023 T3 11-02-2022

49
E13717473
ES 2 906 023 T3 11-02-2022

50
E13717473
ES 2 906 023 T3 11-02-2022

51
E13717473
ES 2 906 023 T3 11-02-2022

Tal como se detalla en la sección Ejemplos, más del 50% de los marcadores tomados de la tabla 1 tienen una
5 puntuación positiva en un conjunto aleatorio de tumores deficientes en MMR, mientras que este también es el caso
de más de un tercio de los marcadores exónicos enumerados en la tabla 2. Esto permite clasificar correctamente el
tumor deficiente en MMR como positivo a MSI con alta precisión y certeza.

En consecuencia, se proporcionan procedimientos para diagnosticar el estado de MSI de un tumor, que comprenden
10 determinar la presencia de un indel en al menos dos regiones homopoliméricas en una muestra del ADN del tumor,
en el que las, al menos dos, regiones homopoliméricas son

- al menos dos regiones homopoliméricas presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en
la tabla 1, o
15
- al menos tres regiones homopoliméricas seleccionadas de las presentes en los exones de los genes
enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1,
en los que dichas regiones homopoliméricas son regiones de microsatélites que son repeticiones
mononucleotídicas de al menos 6 nucleótidos y que no exceden de 20 nucleótidos, y en los que la presencia de al
20 menos un indel en el 2% o más de las regiones homopoliméricas es indicativa de MSI.

En particular, las regiones de microsatélites son regiones homopoliméricas. Son más particularmente idénticas a las
regiones homopoliméricas enumeradas en la tabla 1 o 2.

25 En particular, se prevé utilizar varios marcadores, ya que esto aumenta el poder de clasificación de MSI y aumenta
la sensibilidad. En particular, se utiliza una mezcla de marcadores UTR de la tabla 1 y marcadores exónicos de la
tabla 2. Varios marcadores pueden ser al menos 2 de cada lista, pero el número total de marcadores en particular es
de al menos 5, al menos 8, al menos 10, al menos 12, al menos 15, al menos 20.

30 Alternativamente, en lugar de la tabla 1, los marcadores se pueden elegir de la tabla 4, o de la tabla 6 o la tabla 8.
En lugar de la tabla 2, los marcadores se pueden seleccionar de la tabla 5, o de la tabla 7 o la tabla 8.

Según formas de realización específicas, al menos un marcador utilizado es un marcador exónico presente en un
gen no asociado previamente con cáncer, o en un gen que no se sabía previamente que estuviera afectado en
35 tumores deficientes en MMR. Por lo tanto, se prevé que el microsatélite o los microsatélites seleccionados entre los
presentes en los exones de los genes enumerados en la tabla 2 comprendan al menos un microsatélite presente en
un gen seleccionado de la lista de: SETD1B, RBMXL1, CCDC150, OR7E24, C15orf40, KIAA2018, LTN1, SLC22A9,
CDH26, DDX27, EXOSC9, FAM111B, KIAA0182, KIAA1919, MIS18BP1, PRRT2, TMEM60, AQP7, ARV1,
CCDC168, ELAVL3, F8, FETUB, HPS1, NBEAL1, P4HTM, PIGB, RBM43, RG9MTD1, SRPR, y TMEM97. Según
40 formas de realización aún más específicas, al menos un microsatélite está presente en un gen seleccionado de la
lista de: SETD1B, TMEM60, DDX27, EXOSC9, FAM111B y KIAA1919. Según formas de realización alternativas,
SEC31A, CNOT2, RNF145, RNPC3, SLC35F5, TMBIM4, CD3G, DOCK3, MYO10 y PRRG1 también se puede
utilizar en estas listas.

45 Según formas de realización específicas alternativas, al menos un marcador utilizado es un indel presente en un
homopolímero de entre 10 y 15 bases de repetición situadas en una región 5' o 3' UTR. Los ejemplos particulares de
dichos homopolímeros incluyen, pero sin limitación, homopolímeros en las regiones 3' UTR de la lista de genes
siguiente: WIPF2, NARG2, AHCYL1, C17orf63, CD5L, CEP170, COL5A2, CSNK1G3, DIDO1, EIF4G3, GSK3B,
KCNMB4, MAPK1IP1L, NPR3, PI15, PRTG, RASGRP1, SH3KBP1, SHROOM3, SLC5A3, UBE2Z, ZBTB33,
50 ZNF275, AGPAT3, APH1B, BCL11A, BMPR1B, CALN1, CASK, CBFB, CBX5, CCDC85C, CNOT7, CYP1B1,
DRAM2, EDA2R, EDEM3, EGR1, EIF4G3, FAM20B, FCHSD2, FLT1, FMO2, G3BP2, HELZ, HRNR, IER3IP1,
KCNG1, KCNK1, KLF3, LHX9, LRRC8D, LYRM1, MED13, MYO5B, NCEH1, PPP1R12A, PPP1R3D, RAB11FIP1,
RAB6C, SAMD12, SEMA6A, SLAIN2, SMAD4, TMED7, TMEM57, TMEM65, TNPO1, TOR1AIP2, TRAK2, TRIP11,
UST, VEGFA, ZBTB7A, ZKSCAN1, ZNF12, y ZNF169.
55
Se diseñó un panel de biomarcadores que consistía en una selección de 56 marcadores tomados de la tabla 1 y 2
(véase la sección Ejemplos). Según formas de realización particulares, estos marcadores se utilizan para
diagnosticar el estado de MSI. Estos 56 marcadores se enumeran en la tabla 3.

60

52
E13717473
ES 2 906 023 T3 11-02-2022

53
E13717473
ES 2 906 023 T3 11-02-2022

54
E13717473
ES 2 906 023 T3 11-02-2022

Los marcadores de este panel que están especialmente previstos para su uso (ya que son particularmente sensibles
a la aparición recurrente de indeles) incluyen uno o más de la lista de MYL1, DIDO1, UBE2Z, RYR3, TMEM65,
BTBD7, KDM5A, ABAT, PPM1A, UBA6 y ZNF185. También se prevén adicionalmente ARL10, GRIA2 y TMC7,
particularmente cuando se evalúa el estado de MSI de tumores colorrectales. Estos son tanto sensibles como
5 específicos (es decir, detectan pequeños casos de MSI falsos positivos).

Según formas de realización muy específicas, el panel de 56 marcadores se puede complementar con microsatélites
de MSH6 (indel exónico) y/o SULF2 (deleción en 3' UTR).

10 Según formas de realización alternativas, no se evalúan indeles en MSH6, ya que este es un gen de deficiencia en
MMR conocido. Aunque MSH3 también se conoce como un gen de deficiencia en MMR, la deficiencia de este gen
generalmente no se asocia con MSI27. Sin embargo, según formas de realización particulares, no se utilizan indeles
en MSH3 como marcador.

15 Tal como se detalla en la sección Ejemplos, se puede aplicar una etapa de filtrado adicional a los marcadores de la
tabla 1, excluyendo marcadores presentes como variantes en la línea germinal de nuestra base de datos genómica
patentada. Téngase en cuenta que todas estas son variantes raras, ya que no están presentes en dbSNP o en la
base de datos 1000 Genomes. Esta lista de marcadores se muestra en la tabla 4 (recurrencia mínima en 4 de 16
muestras tumorales).
20
Tabla 4. Indeles recurrentes más comunes en las regiones 5' y 3' UTR para 16 muestras tumorales deficientes en
MMR, después de una etapa de filtrado adicional.

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
13 LRRC8D cr1 90401405 T 11 3' UTR
13 NPR3 cr5 32787131 A 11 3' UTR
12 AHCYL1 cr1 110566210 A 14 3' UTR
12 CD5L cr1 157801230 A 13 3' UTR
12 CEP170 cr1 243288181 T 11 3' UTR
12 SAMD12 cr8 119209320 A 11 3'UTR
12 UBE2Z cr17 47005701 A 11 3' UTR
11 SEPT7 cr7 35944036 T 11 3' UTR
11 CASK crX 41379131 A 13 3' UTR
11 DIDO1 cr20 61536691 A 11 3' UTR
11 EIF4G3 cr1 21133286 A 13 3' UTR
11 FAM20B cr1 179044906 A 12 3' UTR
11 GSK3B cr3 119542766 A 11 3' UTR
11 HELZ cr17 65070976 A 14 3' UTR
11 KCNK1 cr1 233807667 A 11 3' UTR
11 KCNMB4 cr12 70824838 A 14 3'UTR
11 LHX9 cr1 197898395 T 12 3' UTR
11 LYRM1 cr16 20935842 T 11 3' UTR
11 MYO5B cr18 47351784 A 12 3' UTR
11 NARG2 cr15 60712503 T 13 3' UTR
11 PPP1R12A cr12 80169697 T 13 3' UTR
11 PRTG cr15 55903921 A 11 3' UTR
11 RAB11FIP1 cr8 37718707 A 13 3' UTR
11 RASGRP1 cr15 38781450 T 13 3' UTR
11 SH3KBP1 crX 19552231 T 13 3' UTR
11 SHROOM3 cr4 77701305 A 12 3' UTR

55
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
11 TMEM26 cr10 63166725 A 12 3' UTR
11 TMEM65 cr8 125325217 A 11 3' UTR
11 TRIP11 cr14 92435633 A 12 3' UTR
11 ZBTB7A cr19 4046571 T 11 3' UTR
11 ZKSCAN1 cr7 99633041 T 12 3' UTR
11 ZNF217 cr20 52185289 A 13 3' UTR
11 ZNF275 crX 152617043 A 12 3' UTR
10 ACVR1C cr2 158387581 T 14 3' UTR
10 ARAP2 cr4 36068192 A 12 3' UTR
10 BCL11A cr2 60685409 T 12 3' UTR
10 C14orf101 cr14 57114799 A 13 3' UTR
10 C15orf29 cr15 34434105 T 12 3' UTR
10 C17orf63 cr17 27083744 T 12 3' UTR
10 CBFB cr16 67133068 T 11 3' UTR
10 CBX5 cr12 54628041 T 13 3' UTR
10 CD36 cr7 80306123 T 12 3' UTR
10 EPS15 cr1 51821385 A 13 3' UTR
10 ERBB2IP cr5 65375200 T 15 3' UTR
10 ERGIC2 cr12 29493722 T 11 3' UTR
10 FAM38B cr18 10670849 T 14 3' UTR
10 FGF9 cr13 22278024 T 13 3' UTR
10 FLRT2 cr14 86090074 A 12 3' UTR
10 GABPB1 cr15 50570604 A 13 3' UTR
10 GBP1 cr1 89518865 T 13 3' UTR
10 HIPK1 cr1 114519857 T 14 3' UTR
10 KCNG1 cr20 49620212 T 14 3' UTR
10 LPHN3 cr4 62936763 T 12 3' UTR
10 MAPK1IP1L cr14 55535728 T 13 3' UTR
10 MSR1 cr8 15997800 A 11 3' UTR
10 NCEH1 cr3 172348807 A 12 3' UTR
10 PEX13 cr2 61276332 T 15 3' UTR
10 PTEN cr10 89725293 T 11 3' UTR
10 RBMS1 cr2 161128989 T 13 3' UTR
10 RSPO2 cr8 108912568 A 11 3' UTR
10 SEMA6A cr5 115779928 A 13 3' UTR
10 SLAIN2 cr4 48428163 T 11 3' UTR
10 SNX31 cr8 101585895 T 11 3' UTR
10 TMEM57 cr1 25826052 T 12 3' UTR
10 TMTC3 cr12 88591979 T 13 3' UTR
10 UST cr6 149398012 T 13 3' UTR
10 VEGFA cr6 43754176 A 12 3' UTR

56
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
10 KLHL4 crX 86922591 A 13 3' UTR
9 AEN cr15 89174888 T 12 3' UTR
9 ALDH8A1 cr6 135238907 T 10 3' UTR
9 ANK2 cr4 114303782 T 11 3' UTR
9 ARHGAP17 cr16 24930800 A 14 3' UTR
9 ASPN cr9 95218905 A 12 3' UTR
9 BCL11B cr14 99637947 T 12 3' UTR
9 BCL7A cr12 122498799 A 12 3' UTR
9 BRAP cr12 112080129 T 12 3' UTR
9 C11orf87 cr11 109296012 A 12 3' UTR
9 C15orf2 cr15 24927891 A 10 3' UTR
9 CACNB4 cr2 152694131 T 11 3' UTR
9 CALN1 cr7 71245682 A 12 3' UTR
9 CAMK2A cr5 149600684 T 11 3' UTR
9 CBLN4 cr20 54572755 A 12 3' UTR
9 CCDC85C cr14 99978765 A 12 3' UTR
9 CD1E cr1 158327025 T 13 3' UTR
9 CISD1 cr10 60048285 T 11 3' UTR
9 CMTM6 cr3 32523862 A 12 3' UTR
9 CNR1 cr6 88853530 A 11 3' UTR
9 CSNK1E cr22 38686807 T 12 3' UTR
9 CYP1B1 cr2 38297055 T 12 3' UTR
9 DLGAP2 cr8 1652939 A 11 3' UTR
9 DRAM2 cr1 111660181 A 11 3' UTR
9 DUSP10 cr1 221875661 A 11 3' UTR
9 EHD4 cr15 42191704 A 12 3' UTR
9 EPT1 cr2 26617514 T 11 3' UTR
9 FAM104A cr17 71204073 A 13 3' UTR
9 FAM46A cr6 82458103 A 13 3' UTR
9 FMO2 cr1 171178335 A 11 3' UTR
9 FOXN3 cr14 89622979 T 13 3' UTR
9 FRMD4A cr10 13686797 A 12 3' UTR
9 FYN cr6 111982555 T 12 3' UTR
9 GLI3 cr7 42001569 A 11 3' UTR
9 H3F3C cr12 31944217 T 12 3' UTR
9 HIPK2 cr7 139249947 A 14 3' UTR
9 HNRNPK cr9 86583189 T 12 3' UTR
9 IER3IP1 cr18 44682385 A 11 3' UTR
9 IFNGR1 cr6 137518966 A 14 3' UTR
9 IL33 cr9 6256984 T 12 3' UTR
9 KCTD7 cr7 66105589 T 11 3' UTR

57
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
9 KCTD9 cr8 25286171 A 12 3' UTR
9 KIAA1712 cr4 175238738 T 13 3' UTR
9 KIAA2018 cr3 113371321 A 11 3' UTR
9 KRT8 cr12 53291007 A 11 3' UTR
9 LARP4B cr10 856116 A 13 3' UTR
9 MED1 cr17 37561712 T 13 3' UTR
9 MED28 cr4 17626082 T 11 3' UTR
9 METTL9 cr16 21667438 A 12 3' UTR
9 MEX3A cr1 156043944 T 11 3' UTR
9 MLL2 cr12 49413580 A 12 3' UTR
9 NAALAD2 cr11 89925062 T 10 3' UTR
9 PCBD2 cr5 134296980 T 14 3' UTR
9 PCDH9 cr13 66878392 A 26 3' UTR
9 PGK1 crX 77381770 T 13 3' UTR
9 PHACTR2 cr6 144151003 T 10 3' UTR
9 PI15 cr8 75766071 T 10 3' UTR
9 PLEKHA2 cr8 38830288 T 13 3' UTR
9 PPP2R3A cr3 135865826 T 11 3' UTR
9 PRCC cr1 156770552 T 12 3' UTR
9 PRKD3 cr2 37478759 T 12 3' UTR
9 PRPF40A cr2 153512044 T 15 3' UTR
9 PSEN1 cr14 73688298 T 13 3' UTR
9 RCC2 cr1 17735285 A 14 3' UTR
9 RELL1 cr4 37613352 A 12 3' UTR
9 RGS16 cr1 182569291 T 26 3' UTR
9 RUNDC3B cr7 87460421 T 12 3' UTR
9 SATB2 cr2 200136194 T 12 3' UTR
9 SCML4 cr6 108025850 T 13 3'UTR
9 SEC61G cr7 54819993 A 11 3' UTR
9 SENP1 cr12 48436768 T 11 3' UTR
9 SLC35D1 cr1 67465371 A 13 3' UTR
9 SMAD3 cr15 67486032 T 13 3' UTR
9 SPIN1 cr9 91090830 A 12 3' UTR
9 SRC cr20 36033633 T 13 3' UTR
9 TACC1 cr8 38705639 A 11 3' UTR
9 TAF4B cr18 23971176 A 14 3' UTR
9 TBC1D24 cr16 2553486 A 13 3' UTR
9 THAP1 cr8 42692467 A 12 3' UTR
9 TMEM106B cr7 12273303 A 13 3' UTR
9 TMEM14B cr6 10756863 A 11 3' UTR
9 TMEM209 cr7 129805893 A 12 3' UTR

58
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
9 TMEM33 cr4 41959614 T 14 3' UTR
9 TRA2A cr7 23544783 A 11 3' UTR
9 TRIM66 cr11 8635430 A 9 3' UTR
9 TTBK2 cr15 43037302 A 12 3' UTR
9 UBE2M cr19 59067290 A 13 3' UTR
9 USP44 cr12 95911789 A 11 3' UTR
9 VCPIP1 cr8 67545797 A 15 3' UTR
9 VGLL4 cr3 11599949 T 13 3' UTR
9 XPO4 cr13 21356029 A 10 3' UTR
9 ZBTB3 cr11 62519422 A 12 3' UTR
9 ZNF264 cr19 57730525 A 14 3' UTR
9 ZNF347 cr19 53643153 T 12 3' UTR
9 ZNF704 cr8 81550824 A 12 3' UTR
9 ZNF740 cr12 53582896 T 11 3' UTR
8 A1CF cr10 52566432 T 12 3' UTR
8 ABAT cr16 8876792 T 11 3' UTR
8 ABI1 cr10 27037487 A 11 3' UTR
8 ACTR2 cr2 65498035 A 12 3' UTR
8 AIDA cr1 222841524 T 10 3' UTR
8 AKIRIN1 cr1 39471672 A 10 3' UTR
8 APH1B cr15 63600287 T 12 3' UTR
8 ARHGAP18 cr6 129898731 A 11 3' UTR
8 ARHGAP5 cr14 32627034 T 11 3' UTR
8 ASB7 cr15 101189293 T 10 3' UTR
8 ATRX crX 76763679 A 13 3' UTR
8 BACE1 cr11 117159733 T 11 3' UTR
8 C4orf49 cr4 140187661 T 11 3' UTR
8 CADPS cr3 62384481 T 10 3' UTR
8 CALM L4 cr15 68483096 A 12 3'UTR
8 CAM KK2 cr12 121676365 A 11 3'UTR
8 CANX cr5 179158477 A 12 3' UTR
8 CANX cr5 179155907 T 12 3' UTR
8 CAP2 cr6 17556926 A 11 3' UTR
8 CCDC43 cr17 42754916 T 13 3' UTR
8 CCDC89 cr11 85395559 T 10 3' UTR
8 CD47 cr3 107762288 A 11 3' UTR
8 CDC23 cr5 137524388 A 11 3' UTR
8 CELF2 cr10 11373567 A 11 3' UTR
8 CHM crX 85118100 T 13 3' UTR
8 COPA cr1 160258927 T 15 3' UTR
8 CPEB3 cr10 93809826 A 11 3' UTR

59
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
8 CPNE3 cr8 87571865 T 11 3' UTR
8 CRTAP cr3 33187520 A 12 3' UTR
8 CSDA cr12 10851811 T 14 3' UTR
8 CSMD2 cr1 33979967 T 12 3' UTR
8 DCP2 cr5 112351058 T 11 3' UTR
8 DDHD1 cr14 53513439 A 12 3' UTR
8 DIEXF cr1 210026704 T 15 3' UTR
8 DLG3 crX 69722274 T 13 3' UTR
8 DLGAP2 cr8 1653883 T 11 3' UTR
8 DSC3 cr18 28573880 A 12 3' UTR
8 EFNA5 cr5 106714693 A 12 3' UTR
8 EPHA4 cr2 222290623 T 11 3' UTR
8 EXOSC2 cr9 133579920 A 11 3' UTR
8 FAM107B cr10 14561157 T 12 3' UTR
8 FAM116A cr3 57611367 A 11 3' UTR
8 FAM8A1 cr6 17609273 T 11 3' UTR
8 FAM91A1 cr8 124826583 T 12 3' UTR
8 FGFBP3 cr10 93666830 A 11 3' UTR
8 GABRG2 cr5 161581834 A 11 3' UTR
8 GAL cr11 68458592 T 12 3' UTR
8 GLS cr2 191828629 T 12 3' UTR
8 GPAM cr10 113910871 T 12 3' UTR
8 HCRTR2 cr6 55147361 T 12 3' UTR
8 HERPUD2 cr7 35672678 T 14 3' UTR
8 HIP1 cr7 75166838 A 11 3' UTR
8 HIPK2 cr7 139257355 T 11 3' UTR
8 HMGCS1 cr5 43290194 A 16 3' UTR
8 HNRNPUL1 cr19 41812943 A 12 3' UTR
8 HSPA9 cr5 137891047 A 13 3' UTR
8 IFIT2 cr10 91068075 T 12 3' UTR
8 IGF2BP1 cr17 47129195 T 12 3' UTR
8 KLF9 cr9 73002115 T 11 3' UTR
8 LHFPL4 cr3 9543422 A 13 3' UTR
8 LRAT cr4 155673737 A 10 3' UTR
8 LSM14A cr19 34718607 T 12 3' UTR
8 MAP3K5 cr6 136878751 T 14 3' UTR
8 MED13 cr17 60023567 A 10 3' UTR
8 MESDC1 cr15 81296129 T 12 3' UTR
8 METTL21B cr12 58175145 T 15 3' UTR
8 MITF cr3 70014804 A 11 3' UTR
8 MS4A7 cr11 60161438 A 12 3' UTR

60
E13717473
ES 2 906 023 T3 11-02-2022

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
8 MTF2 cr1 93602675 A 14 3' UTR
8 NAP1L4 cr11 2966276 A 15 3' UTR
8 NEDD1 cr12 97346987 A 13 3' UTR
8 NEK5 cr13 52639268 A 13 3' UTR
8 OXR1 cr8 107763507 T 13 3' UTR
8 PAPD5 cr16 50264031 A 13 3' UTR
8 PDE9A cr21 44195537 A 13 3' UTR
8 PIGM cr1 159998798 T 11 3' UTR
8 PM20D2 cr6 89874860 T 11 3' UTR
8 POGZ cr1 151377008 A 13 3' UTR
8 POMT2 cr14 77741349 T 11 3' UTR
8 POU2F2 cr19 42595246 T 17 3' UTR
8 RAB11FIP2 cr10 119766958 A 12 3' UTR
8 RAP2A cr13 98118463 A 14 3' UTR
8 RBM25 cr14 73587904 T 14 3' UTR
8 RBM33 cr7 155569742 T 13 3' UTR
8 RBM45 cr2 178994205 T 11 3' UTR
8 RIMKLB cr12 8926680 T 11 3' UTR
8 RNF149 cr2 101893233 A 10 3' UTR
8 RNLS cr10 90034667 A 11 3' UTR
8 RORA cr15 60788653 A 12 3' UTR
8 SAMD5 cr6 147887423 T 12 3' UTR
8 SAR1A cr10 71911798 A 12 3' UTR
8 SEL1L cr14 81942829 T 13 3' UTR
8 SEMA4D cr9 91992883 A 13 3' UTR
8 SETX cr9 135139195 T 11 3' UTR
8 SH3RF1 cr4 170017405 A 14 3' UTR
8 SMARCC2 cr12 56556167 A 14 3' UTR
8 SNRNP40 cr1 31732677 A 11 3' UTR
8 SOX4 cr6 21596500 A 12 3' UTR
8 ST7L cr1 113067470 A 10 3' UTR
8 STXBP5 cr6 147708451 A 10 3' UTR
8 TGIF2 cr20 35220571 A 14 3' UTR
8 TLE3 cr15 70340967 A 11 3' UTR
8 TMC7 cr16 19073947 A 10 3' UTR
8 TMEM57 cr1 25825931 T 13 3' UTR
8 TNRC6B cr22 40722031 A 10 3' UTR
8 TNRC6B cr22 40720866 T 14 3' UTR
8 TNRC6B cr22 40720294 T 15 3' UTR
8 TRPS1 cr8 116424407 A 12 3' UTR
8 TSGA10 cr2 99614595 A 13 3' UTR

61
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
8 TSPAN14 cr10 82279557 T 14 3' UTR
8 TTL cr2 113289264 A 11 3' UTR
8 TTLL5 cr14 76420881 T 11 3' UTR
8 UBA6 cr4 68481877 T 12 3' UTR
8 UFM1 cr13 38935214 T 11 3' UTR
8 VCP cr9 35056078 T 12 3' UTR
8 VEZF1 cr17 56049540 T 11 3' UTR
8 WHSC1L1 cr8 38175279 A 11 3' UTR
8 WSB1 cr17 25640066 A 15 3' UTR
8 ZBTB43 cr9 129596297 A 11 3' UTR
8 ZNF12 cr7 6730082 T 12 3' UTR
8 ZNF238 cr1 244220229 T 10 3' UTR
8 ZNF281 cr1 200375822 T 12 3' UTR
8 ZNF621 cr3 40575421 A 11 3' UTR
7 ADRBK2 cr22 26121915 A 11 3' UTR
7 ALG9 cr11 111655441 A 11 3' UTR
7 ANKIB1 cr7 92029899 T 11 3' UTR
7 ANKRD28 cr3 15709862 T 13 3' UTR
7 ARFIP1 cr4 153832102 T 11 3' UTR
7 ARID4A cr14 58840119 T 10 3' UTR
7 ATP11A cr13 113540850 T 12 3' UTR
7 ATP2B1 cr12 89984601 T 12 3' UTR
7 ATXN1 cr6 16300902 T 11 3' UTR
7 BOD1L cr4 13570453 A 11 3' UTR
7 C14orf37 cr14 58471378 T 11 3' UTR
7 C2orf29 cr2 101886538 T 12 3' UTR
7 C3orf58 cr3 143709141 T 11 3' UTR
7 C3orf62 cr3 49308391 A 11 3' UTR
138671354
7 C3orf72 C8orf44- cr3 T 13 3' UTR
67772690
7 SGK3,SGK3 cr8 A 11 3' UTR
7 CALN1 cr7 71249416 T 10 3' UTR
7 CASK crX 41377809 A 11 3' UTR
7 CD300LB cr17 72518440 A 11 3' UTR
7 CDC25A cr3 48199852 T 12 3' UTR
7 CDC73 cr1 193220974 T 12 3' UTR
7 CDKN2AIPNL cr5 133738313 A 11 3' UTR
7 CELSR1 cr22 46756848 A 11 3' UTR
7 CMIP cr16 81744987 A 10 3' UTR
7 COIL cr17 55016354 A 14 3' UTR
7 COPS7B cr2 232673378 T 13 3' UTR
7 COX18 cr4 73923142 A 12 3' UTR

62
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
7 CSNK1E cr22 38686864 A 11 3' UTR
7 DCP1A cr3 53321360 T 27 3' UTR
7 DNAJC27 cr2 25167221 T 14 3' UTR
7 DNMT3B cr20 31395997 T 11 3' UTR
7 DTNA cr18 32446839 T 12 3' UTR
7 EFNB1 crX 68061978 A 12 3' UTR
7 ENTPD1 cr10 97628618 A 10 3' UTR
7 ERBB4 cr2 212247967 A 18 3' UTR
7 EYA1 cr8 72110673 A 12 3' UTR
7 FAM118A cr22 45736689 T 11 3' UTR
7 FAM126B cr2 201838933 A 13 3' UTR
7 FAM13B cr5 137274915 A 11 3' UTR
7 FAM169A cr5 74075446 T 12 3' UTR
7 FAM60A cr12 31435556 A 10 3' UTR
7 FBLN7 cr2 112945284 T 11 3' UTR
7 FGF9 cr13 22277774 T 10 3' UTR
7 FKBP5 cr6 35554624 T 12 3' UTR
7 FOXO3 cr6 109005013 A 11 3' UTR
7 FXR1 cr3 180694863 T 14 3' UTR
7 GBP6 cr1 89851722 A 13 3' UTR
7 GNB1 cr1 1717242 T 12 3' UTR
7 GNRHR cr4 68604166 A 12 3' UTR
7 GPC3 crX 132670054 A 13 3' UTR
7 GRIK2 cr6 102517011 T 11 3' UTR
7 H3F3B cr17 73774199 T 13 3' UTR
7 HAS2 cr8 122625936 A 12 3' UTR
7 HELZ cr17 65073603 A 11 3' UTR
7 HIPK2 cr7 139250450 T 11 3' UTR
7 HN1 cr17 73132058 A 12 3' UTR
7 HNRNPA3 cr2 178088002 T 10 3' UTR
7 HNRNPR cr1 23636874 T 11 3' UTR
7 HUS1B cr6 656079 A 10 3' UTR
7 KDM5A cr12 389523 T 11 3' UTR
7 KHNYN cr14 24908391 T 11 3' UTR
7 KIF3A cr5 132029672 A 14 3' UTR
7 KIF5C cr2 149879665 T 10 3' UTR
7 KLHL28 cr14 45398006 T 11 3' UTR
7 LRCH1 cr13 47325657 A 10 3' UTR
7 LRIG2 cr1 113667282 T 11 3' UTR
7 LRP6 cr12 12272288 A 12 3' UTR
7 MAGEB3 crX 30255422 A 11 3' UTR

63
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
7 MAK cr6 10764372 T 9 3' UTR
7 MCTS1 crX 119754487 A 14 3' UTR
7 MDM2 cr12 69236873 T 13 3' UTR
7 MED19 cr11 57471199 T 13 3' UTR
7 MESDC1 cr15 81296262 T 9 3' UTR
7 MGAT4A cr2 99235842 A 11 3' UTR
7 MLL3 cr7 151832596 T 11 3' UTR
7 MTMR9 cr8 11185354 A 10 3' UTR
7 NAA35 cr9 88637203 A 10 3' UTR
7 NAF1 cr4 164049985 A 11 3' UTR
7 NHLH1 cr1 160341680 A 11 3' UTR
7 NIPAL3 cr1 24799398 A 12 3' UTR
7 NPAS3 cr14 34271068 A 12 3' UTR
7 NRF1 cr7 129395138 T 11 3' UTR
7 NTRK2 cr9 87487518 T 11 3' UTR
7 PALM2 cr9 112708967 A 25 3' UTR
7 PAPSS2 cr10 89507276 A 11 3' UTR
7 PCDH7 cr4 31146675 T 12 3' UTR
7 PCSK2 cr20 17463028 T 11 3' UTR
7 PHF6 crX 133561520 T 10 3' UTR
7 PKP4 cr2 159537312 T 10 3' UTR
7 PLXNA4 cr7 131809795 A 13 3' UTR
7 POFUT1 cr20 30826323 A 11 3' UTR
7 PPP1CB cr2 29024298 T 14 3' UTR
7 PPP2R3A cr3 135865709 A 14 3' UTR
7 PRPF4 cr9 116054493 A 14 3' UTR
7 PRPF40A cr2 153509691 A 11 3' UTR
7 PRR23A cr3 138723892 A 9 3' UTR
7 PSMD11 cr17 30807996 A 11 3' UTR
7 PTAFR cr1 28475836 T 27 3' UTR
7 PTPN11 cr12 112944240 T 12 3' UTR
7 PTPN18 cr2 131131908 T 14 3' UTR
7 PTPRJ cr11 48189153 T 13 3' UTR
7 PURB cr7 44920830 A 9 3' UTR
7 RB1CC1 cr8 53536112 A 11 3' UTR
7 RBM12B cr8 94745437 A 11 3' UTR
7 RC3H1 cr1 173901043 T 11 3' UTR
7 RDH10 cr8 74236678 T 10 3' UTR
7 RECK cr9 36123172 T 11 3' UTR
7 RPS6KA2 cr6 166824706 T 13 3' UTR
7 RS1 crX 18659977 A 13 3' UTR

64
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
7 RUNDC3B cr7 87459581 A 13 3' UTR
7 RXRA cr9 137331937 A 12 3' UTR
7 RYBP cr3 72424549 T 9 3' UTR
7 RYR3 cr15 34157541 A 10 3' UTR
7 SAMD10 cr20 62605493 T 12 3' UTR
7 SEC31A cr4 83740163 T 11 3' UTR
7 SENP1 cr12 48437910 T 11 3' UTR
7 SGCD cr5 156190730 A 12 3' UTR
7 SH3BP5 cr3 15297082 T 13 3' UTR
7 SH3RF1 cr4 170016066 A 11 3' UTR
7 SLC16A7 cr12 60173983 A 11 3' UTR
7 SLC2A3 cr12 8072022 T 13 3' UTR
7 SLC30A7 cr1 101446221 T 11 3' UTR
7 SLC7A11 cr4 139092374 A 11 3' UTR
7 SLC9A2 cr2 103326258 T 10 3' UTR
7 SMAD4 cr18 48609102 T 12 3' UTR
7 SNAPC1 cr14 62262433 A 11 3' UTR
7 SNAPC3 cr9 15461137 A 13 3' UTR
7 SNX27 cr1 151666826 T 11 3' UTR
7 SPCS3 cr4 177250201 T 10 3' UTR
7 STARD7 cr2 96851899 A 14 3' UTR
7 TBC1D22B cr6 37299299 T 12 3' UTR
7 TBL1XR1 cr3 176741889 A 13 3' UTR
7 TFAP2C cr20 55213320 T 11 3' UTR
7 TIGD6 cr5 149373143 T 13 3' UTR
7 TMEM108 cr3 133116233 A 14 3' UTR
7 TMEM161B cr5 87491917 T 10 3' UTR
7 TMEM47 crX 34646666 T 12 3' UTR
7 TMEM64 cr8 91637753 A 12 3' UTR
7 TNRC6B cr22 40719790 A 14 3' UTR
7 TNRC6C cr17 76101834 T 9 3' UTR
7 TOMM20 cr1 235275027 T 12 3' UTR
7 TPH1 cr11 18042321 A 11 3' UTR
7 UACA cr15 70946988 A 12 3' UTR
7 UBXN7 cr3 196080741 T 11 3' UTR
7 UGT2B28 cr4 70160632 A 11 3' UTR
7 USP28 cr11 113669136 A 11 3' UTR
7 WDR82 cr3 52289627 A 11 3' UTR
7 ZBTB34 cr9 129646763 T 11 3' UTR
7 ZBTB44 cr11 130102910 A 11 3' UTR
7 ZDHHC13 cr11 19197719 A 10 3' UTR

65
ES 2 906 023 T3

(continuación)

Nº de Gen Cromosoma Posición Base de Longitud del Región


muestras inicial homopolímero homopolímero
afectadas afectada afectado
7 ZNF136 cr19 12299608 A 13 3' UTR
7 ZNF238 cr1 244219573 A 9 3' UTR
7 ZNF563 cr19 12428823 T 15 3' UTR
7 ZNF652 cr17 47369576 T 11 3' UTR
7 ZNF716 cr7 57529811 A 10 3' UTR
7 ZNF737 cr19 20723566 A 11 3' UTR
7 ZNF737 cr19 20722094 A 14 3' UTR
6 MARCH1 cr4 164446860 T 9 3' UTR
6 ADRA1D cr20 4201344 T 10 3' UTR
6 AJAP1 cr1 4843660 T 11 3' UTR
6 AK4 cr1 65692499 T 11 3' UTR
6 ANKH cr5 14705393 A 13 3' UTR
6 ANKRD13C cr1 70727638 A 12 3' UTR
6 ANKRD40 cr17 48770711 A 10 3' UTR
6 AP1AR cr4 113190822 A 11 3' UTR
6 APOL1 cr22 36662141 T 12 3' UTR
6 ARHGAP28 cr18 6914974 A 10 3' UTR
6 ARID1B cr6 157530262 A 14 3' UTR
6 ARIH1 cr15 72877867 A 12 3' UTR
6 ARL10 cr5 175800426 T 10 3' UTR
6 ATF2 cr2 175939223 A 12 3' UTR
6 ATP11C crX 138809822 A 10 3' UTR
6 ATXN1 cr6 16301824 A 13 3' UTR
6 BCLAF1 cr6 136581674 T 11 3' UTR
6 BIN1 cr2 127805622 T 10 3' UTR
6 BNIP3L cr8 26268445 A 10 3' UTR
6 BOD1L cr4 13571144 A 10 3' UTR
6 C1orf9 cr1 172580460 T 9 3' UTR
6 C5orf43 cr5 60453908 A 9 3' UTR
6 C6orf145 cr6 3723315 A 11 3' UTR
6 C9orf167 cr9 140176659 T 10 3' UTR
6 CAMLG cr5 134086670 A 13 3' UTR
6 CBL cr11 119175340 T 14 3' UTR
6 CCND2 cr12 4411110 T 12 3' UTR
6 CCNE2 cr8 95892992 A 11 3' UTR
6 CHD7 cr8 61778758 T 11 3' UTR
6 CHP cr15 41572703 T 27 3' UTR
6 CIT cr12 120123939 T 11 3' UTR
6 CLCN5 crX 49862213 A 12 3' UTR
6 CLN8 cr8 1729701 T 14 3' UTR
6 CLSPN cr1 36201819 A 17 3' UTR

66
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
6 CRTC1 cr19 18890267 T 14 3' UTR
6 DAG1 cr3 49571620 T 11 3' UTR
6 DNAJB7 cr22 41256660 T 14 3' UTR
6 DNAJC17 cr15 41060070 A 14 3' UTR
6 DSTYK cr1 205112278 T 14 3' UTR
6 DYRK2 cr12 68054141 A 11 3' UTR
6 EBF1 cr5 158125829 A 12 3' UTR
6 ECE1 cr1 21546032 A 10 3' UTR
6 EGR3 cr8 22545637 T 11 3' UTR
6 EIF4EBP2 cr10 72188037 A 11 3' UTR
6 EIF5A2 cr3 170607962 A 11 3' UTR
6 ELTD1 cr1 79356149 T 11 3' UTR
6 ENTPD4 cr8 23289680 A 11 3' UTR
6 EPM2AIP1 cr3 37030780 T 11 3' UTR
6 ERBB2IP cr5 65376306 A 11 3' UTR
6 ERBB4 cr2 212243952 T 11 3' UTR
6 FAM120C crX 54098998 A 12 3' UTR
6 FAM122A cr9 71396662 T 11 3' UTR
6 FAM168B cr2 131805979 G 9 3' UTR
6 FBLIM1 cr1 16112130 A 10 3' UTR
6 FBXO21 cr12 117582899 T 11 3' UTR
6 FBXO27 cr19 39514872 T 12 3' UTR
6 FGFR1OP2 cr12 27118594 A 11 3' UTR
6 FOXP1 cr3 71007140 T 11 3' UTR
6 G3BP1 cr5 151184779 T 11 3' UTR
6 GABRB2 cr5 160717254 T 12 3' UTR
6 GDA cr9 74866560 T 12 3' UTR
6 GIT1 cr17 27901146 A 12 3' UTR
6 GJC1 cr17 42878975 T 13 3' UTR
6 GPR4 cr19 46093443 A 11 3' UTR
6 GSK3B cr3 119544323 A 9 3' UTR
6 GSR cr8 30536666 A 19 3' UTR
6 GTF3C1 cr16 27471985 T 11 3' UTR
6 HAS2 cr8 122625490 T 10 3' UTR
6 HMGN2 cr1 26801737 T 15 3' UTR
HNRNPA3
6 cr2 178088125 A 12 3' UTR
HNRNPH2,RPL36
6 A-HNRNPH2 crX 100668932 T 13 3' UTR
6 HNRNPU cr1 245014280 T 11 3' UTR
6 HOMEZ cr14 23744114 A 14 3' UTR
6 ICA1L cr2 203642599 T 22 3' UTR
6 IGF2BP3 cr7 23350733 T 12 3' UTR

67
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
6 IGFBP5 cr2 217537045 T 14 3' UTR
6 ILF3 cr19 10796313 T 10 3' UTR
6 INSR cr19 7112347 A 9 3' UTR
6 IPCEF1 cr6 154476149 A 12 3' UTR
6 KCNJ2 cr17 68175917 A 10 3' UTR
6 KDM5A cr12 393489 T 12 3' UTR
6 KHSRP cr19 6413651 T 10 3' UTR
6 KIAA0825 cr5 93489194 T 8 3' UTR
6 KIAA1671 cr22 25592399 T 12 3' UTR
6 LANCL1 cr2 211297865 T 9 3' UTR
6 LCORL cr4 17882781 T 11 3' UTR
6 LIN7C cr11 27517703 A 14 3' UTR
6 LMO4 cr1 87813143 A 11 3' UTR
6 LRRC4 cr7 127668232 T 9 3' UTR
6 LYRM7 cr5 130537006 A 12 3' UTR
6 MAGI1 cr3 65340577 T 11 3' UTR
6 MAL cr2 95719330 A 10 3' UTR
6 MEIS2 cr15 37183446 T 10 3' UTR
6 MKL1 cr22 40806781 C 9 3' UTR
6 MKLN1 cr7 131175980 A 10 3' UTR
6 MTDH cr8 98740104 A 10 3' UTR
6 NANP cr20 25595618 A 11 3' UTR
6 NAPEPLD cr7 102742595 A 10 3' UTR
6 NCEH1 cr3 172349171 T 12 3' UTR
6 NCOA5 cr20 44689693 A 10 3' UTR
6 NKAIN2 cr6 125146684 T 9 3' UTR
6 NPNT cr4 106892254 T 13 3' UTR
6 NPR3 cr5 32786465 T 11 3' UTR
6 NR2F2 cr15 96881216 T 10 3' UTR
6 NR3C1 cr5 142657694 T 9 3' UTR
6 NUFIP2 cr17 27584536 T 12 3' UTR
6 OPA3 cr19 46052745 T 12 3' UTR
6 ORAI3 cr16 30965549 T 15 3' UTR
6 OTUB2 cr14 94512841 A 11 3' UTR
6 OXR1 cr8 107764239 A 10 3' UTR
6 PAQR7 cr1 26188503 A 31 3' UTR
6 PCDHB3 cr5 140482943 T 10 3' UTR
6 PDP2 cr16 66920308 T 10 3' UTR
6 PEBP1 cr12 118582973 A 21 3' UTR
6 PELI2 cr14 56764487 T 13 3' UTR
6 PGPEP1 cr19 18477965 A 20 3' UTR

68
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
6 PGR cr11 100902321 T 15 3' UTR
6 PHLDA1 cr12 76421757 T 12 3' UTR
6 PID1 cr2 229889188 A 9 3' UTR
6 PIGN cr18 59712451 A 11 3' UTR
6 PIM2 crX 48770831 A 20 3' UTR
6 PLAA cr9 26904508 T 10 3' UTR
6 PLEKHA6 cr1 204190022 A 13 3' UTR
6 PPM1A cr14 60761433 T 10 3' UTR
6 PPP1R3D cr20 58513623 T 11 3' UTR
6 PRDM1 cr6 106557171 T 10 3' UTR
6 PTCD3 cr2 86366926 A 11 3' UTR
6 PTGDR cr14 52741746 A 11 3' UTR
6 RAB22A cr20 56941068 T 10 3' UTR
6 RAB8B cr15 63557574 T 13 3' UTR
6 RAD51L1 cr14 68964202 T 12 3' UTR
6 RBM12B cr8 94744118 T 11 3' UTR
6 RNF10 cr12 121014987 T 11 3' UTR
6 RORA cr15 60785852 T 11 3' UTR
6 RRAGD cr6 90076341 A 13 3' UTR
6 RRM2B cr8 103216874 A 9 3' UTR
6 RTF1 cr15 41775015 T 10 3' UTR
6 RUFY3 cr4 71655520 A 12 3' UTR
6 S100A4 cr1 153516162 A 10 3' UTR
6 SBK1 cr16 28334644 A 13 3' UTR
6 SERBP1 cr1 67878789 T 11 3' UTR
6 SIPA1L3 cr19 38698671 T 17 3' UTR
6 SLC16A6 cr17 66265042 A 11 3' UTR
6 SLC25A20 cr3 48894565 A 12 3' UTR
6 SLC30A5 cr5 68399959 T 11 3' UTR
6 SLC35B4 cr7 133977008 T 10 3' UTR
6 SLC44A5 cr1 75668544 A 11 3' UTR
6 SLMAP cr3 57913669 T 13 3' UTR
6 SMAD5 cr5 135515014 A 10 3' UTR
6 SMEK1 cr14 91924528 A 11 3' UTR
6 SOCS4 cr14 55512747 T 10 3' UTR
6 SORCS1 cr10 108333635 A 11 3' UTR
6 SOX1 cr13 112724861 A 10 3' UTR
6 SOX4 cr6 21597192 A 11 3' UTR
6 SPIRE1 cr18 12449300 T 11 3' UTR
6 SPTLC2 cr14 77975645 A 11 3' UTR
6 SRCIN1 cr17 36687785 T 12 3' UTR

69
ES 2 906 023 T3

(continuación)

Nº de Gen Cromosoma Posición Base de Longitud del Región


muestras inicial homopolímero homopolímero
afectadas afectada afectado
6 STEAP3 cr2 120023163 T 12 3' UTR
6 STK11 cr19 1228058 T 11 3' UTR
6 STX12 cr1 28150575 T 10 3' UTR
6 STX3 cr11 59569295 A 11 3' UTR
6 SULF2 cr20 46286320 A 10 3' UTR
6 SUZ12 cr17 30326763 T 12 3' UTR
6 SYNJ2BP cr14 70834868 A 10 3' UTR
6 TARDBP cr1 11084333 T 11 3' UTR
6 TBC1D1 cr4 38140081 A 10 3' UTR
6 TBC1D5 cr3 17201870 T 11 3' UTR
6 TCERG1 cr5 145890609 T 12 3' UTR
6 TCF20 cr22 42556646 A 12 3' UTR
6 TFAP2B cr6 50814900 A 10 3' UTR
6 TLCD2 cr17 1608003 T 11 3' UTR
6 TMTC3 cr12 88591036 T 25 3' UTR
6 TMTC3 cr12 88590177 T 12 3' UTR
6 TNIP3 cr4 122052756 T 22 3' UTR
6 TNRC6B cr22 40731027 T 10 3' UTR
6 TOR1AIP1 cr1 179888400 A 12 3' UTR
6 TP53INP1 cr8 95941646 A 13 3' UTR
6 TRIM66 cr11 8636480 T 13 3' UTR
6 TRRAP cr7 98610830 T 11 3' UTR
6 TSR2 crX 54471045 T 10 3' UTR
6 TTC30B cr2 178415366 T 10 3' UTR
6 UBASH3B cr11 122681008 T 13 3' UTR
6 VAX1 cr10 118893337 A 10 3' UTR
6 WDFY1 cr2 224742022 T 12 3' UTR
6 WIF1 cr12 65444595 T 13 3' UTR
6 XKR7 cr20 30585884 G 10 3' UTR
6 XYLT1 cr16 17199775 A 11 3' UTR
6 ZADH2 cr18 72910475 T 13 3' UTR
6 ZBTB7A cr19 4046340 T 11 3' UTR
6 ZNF238 cr1 244219033 T 11 3' UTR
6 ZNF24 cr18 32917176 T 12 3' UTR
6 ZNF362 cr1 33764950 T 12 3' UTR
6 ZNF407 cr18 72516095 T 11 3' UTR
6 ZNF430 cr19 21241252 A 14 3' UTR
6 ZNF80 cr3 113954690 A 12 3' UTR
5 ABHD2 cr15 89739843 T 10 3' UTR
5 ABI2 cr2 204292194 T 10 3' UTR
5 ACOX1 cr17 73941869 A 10 3' UTR

70
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
5 ACTBL2 cr5 56777006 T 10 3' UTR
5 AFF2 crX 148080284 T 10 3' UTR
5 ANAPC16 cr10 73993363 T 10 3' UTR
5 ARF5 cr7 127231635 T 10 3' UTR
5 ARL1 cr12 101787092 T 11 3' UTR
5 ASAH1 cr8 17914871 A 10 3' UTR
5 ATP1B2 cr17 7560698 A 10 3' UTR
5 ATXN7 cr3 63985894 T 11 3' UTR
5 B3GNT7 cr2 232264806 T 26 3' UTR
5 BAG1 cr9 33253979 T 12 3' UTR
5 BCL11B cr14 99638830 A 9 3' UTR
5 BMP7 cr20 55744815 T 10 3' UTR
5 BTBD11 cr12 108052115 T 12 3' UTR
5 BTBD7 cr14 93708030 A 10 3' UTR
5 C14orf126 cr14 31917025 A 10 3' UTR
5 C14orf28 cr14 45376124 A 12 3' UTR
5 C18orf56 cr18 649879 T 15 3' UTR
5 C20orf12 cr20 18364708 T 12 3' UTR
5 C5orf41 cr5 172563230 A 11 3' UTR
5 C7orf68 cr7 128097963 A 10 3' UTR
5 C9orf66 cr9 214453 T 9 3' UTR
5 CABP4 cr11 67226510 T 14 3' UTR
5 CACNB4 cr2 152695481 T 11 3' UTR
5 CASP2 cr7 143003342 T 25 3' UTR
5 CBFB cr16 67133969 T 9 3' UTR
5 CBX5 cr12 54630019 T 10 3' UTR
5 CCDC102B cr18 66722368 A 9 3' UTR
5 CCND1 cr11 69468187 T 14 3' UTR
5 CCND2 cr12 4409520 T 10 3' UTR
5 CCNL2 cr1 1327869 T 9 3' UTR
5 CCR1 cr3 46244273 G 10 3' UTR
5 CDH3 cr16 68732679 T 11 3' UTR
5 CEP68 cr2 65312945 A 12 3' UTR
5 CGGBP1 cr3 88104472 T 10 3' UTR
5 CHMP2B cr3 87303064 A 14 3' UTR
5 CIB2 cr15 78397249 T 12 3' UTR
5 CLEC5A cr7 141627861 T 12 3' UTR
5 CNST cr1 246830426 A 10 3' UTR
5 COL19A1 cr6 70918737 T 12 3' UTR
COL8A2
5 cr1 36561052 A 10 3' UTR
COX16,SYNJ2BP-
5 COX16 cr14 70793015 A 14 3' UTR

71
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
5 CPLX4 cr18 56963029 A 10 3' UTR
5 CREB3L2 cr7 137563914 A 10 3' UTR
5 CSNK1G1 cr15 64461259 A 9 3' UTR
5 CTIF cr18 46388423 T 10 3' UTR
5 CUL5 cr11 107975795 T 13 3' UTR
5 CYP17A1 cr10 104590293 A 11 3' UTR
5 DAND5 cr19 13084677 T 17 3' UTR
5 DCUN1D5 cr11 102930486 G 7 3' UTR
5 DDN cr12 49389156 A 11 3' UTR
5 DDX5 cr17 62495664 A 10 3' UTR
5 DDX6 cr11 118622141 A 10 3' UTR
5 DLX3 cr17 48067712 T 14 3' UTR
5 DNAJC15 cr13 43681779 T 9 3' UTR
5 DNAJC18 cr5 138747976 T 11 3' UTR
5 DOPEY2 cr21 37666277 A 14 3' UTR
5 DPYSL2 cr8 26515559 T 10 3' UTR
5 DSEL cr18 65174583 A 26 3' UTR
5 DTNA cr18 32448118 A 16 3' UTR
5 DYNC1LI2 cr16 66755235 T 11 3' UTR
5 DYRK2 cr12 68055576 T 10 3' UTR
5 EBF1 cr5 158125671 T 15 3' UTR
5 EFNA5 cr5 106716350 A 11 3' UTR
5 EFNA5 cr5 106712689 T 12 3' UTR
5 EFR3B cr2 25378726 T 13 3' UTR
5 ELAVL1 cr19 8023995 T 11 3' UTR
5 ELAVL3 cr19 11562278 T 16 3' UTR
5 EPS15 cr1 51822219 A 12 3' UTR
5 ESRP1 cr8 95719492 A 11 3' UTR
5 EVI5 cr1 92978704 A 11 3' UTR
5 EVI5 cr1 92977467 T 11 3' UTR
5 EXTL2 cr1 101338118 A 10 3' UTR
5 FAF2 cr5 175935960 T 10 3' UTR
5 FAM105A cr5 14611814 T 10 3' UTR
5 FAM164A cr8 79631105 T 10 3' UTR
5 FAM20B cr1 179044326 A 13 3' UTR
5 FAM46A cr6 82457992 T 10 3' UTR
5 FBN2 cr5 127594063 A 10 3' UTR
5 FBRSL1 cr12 133160562 A 9 3' UTR
5 FBXL4 cr6 99321799 T 10 3' UTR
5 FBXO36 cr2 230876985 A 11 3' UTR
5 FBXW2 cr9 123524089 A 12 3' UTR

72
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
5 FCGR3A cr1 161512430 T 9 3' UTR
5 FCHSD2 cr11 72549649 A 10 3' UTR
5 FICD cr12 108913292 A 11 3' UTR
5 FOXN2 cr2 48604358 T 10 3' UTR
5 FOXN3 cr14 89627649 T 11 3' UTR
5 GABRB2 cr5 160719907 A 9 3' UTR
5 GNA13 cr17 63005677 A 10 3' UTR
5 GNAI2 cr3 50296405 C 9 3' UTR
5 GNAI2 cr3 50296330 A 12 3' UTR
5 GPR12 cr13 27330332 T 10 3' UTR
5 GPR137B cr1 236372038 T 10 3' UTR
5 GPR37L1 cr1 202098133 T 21 3' UTR
5 GRID1 cr10 87359476 T 11 3' UTR
5 GRIN3A cr9 104331901 A 9 3' UTR
5 GRPEL2 cr5 148731880 T 14 3' UTR
5 HAPLN1 cr5 82937251 A 10 3' UTR
5 HBS1L cr6 135357535 A 10 3' UTR
5 HDAC4 cr2 239974109 A 9 3' UTR
5 HEXA cr15 72636197 T 10 3' UTR
5 HNRNPK cr9 86583800 A 10 3' UTR
5 HOOK3 cr8 42876247 A 29 3' UTR
5 HRH1 cr3 11303522 A 11 3' UTR
5 HUWE1 crX 53559710 T 11 3' UTR
5 IGDCC4 cr15 65674432 A 12 3' UTR
5 IGF1 cr12 102790988 A 11 3' UTR
5 IGF2BP2 cr3 185361762 T 12 3' UTR
5 IGFBP5 cr2 217537240 A 11 3' UTR
5 INSR cr19 7116555 A 12 3' UTR
5 JAM3 cr11 134020535 T 12 3' UTR
5 KCTD1 cr18 24035448 T 12 3' UTR
5 KCTD6 cr3 58487415 T 11 3' UTR
5 KDM5A cr12 393804 T 11 3' UTR
5 KIAA1324 cr1 109749368 T 11 3' UTR
5 KIAA1324 cr1 109748644 T 11 3' UTR
5 KIAA1737 cr14 77582032 T 14 3' UTR
5 KIAA2026 cr9 5919249 T 11 3' UTR
5 KLHL20 cr1 173754885 A 12 3' UTR
5 KLHL24 cr3 183400567 T 10 3' UTR
5 LDHAL6A cr11 18500557 T 12 3' UTR
5 LENG8 cr19 54972801 T 9 3' UTR
5 LHFP cr13 39917691 A 12 3' UTR

73
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
5 LMO4 cr1 87811174 A 11 3' UTR
5 LPHN3 cr4 62937355 A 12 3' UTR
5 LPL cr8 19823634 A 11 3' UTR
5 LRRC27 cr10 134193076 T 9 3' UTR
5 LRRC4B cr19 51020187 T 10 3' UTR
5 LTN1 cr21 30301899 T 10 3' UTR
5 MAP1B cr5 71505347 A 11 3' UTR
5 MAP3K7 cr6 91225524 A 9 3' UTR
5 MAPK1 cr22 22114660 T 12 3' UTR
5 MAX cr14 65543065 A 10 3' UTR
5 MED1 cr17 37562164 T 11 3' UTR
5 MED13 cr17 60022040 A 11 3' UTR
5 MED28 cr4 17625638 T 10 3' UTR
5 MKX cr10 27962805 A 10 3' UTR
5 MNT cr17 2287533 T 13 3' UTR
5 MOBKL2A cr19 2072745 A 13 3' UTR
5 MORC1 cr3 108677146 A 10 3' UTR
5 MST4 crX 131208596 A 9 3' UTR
5 MTA2 cr11 62360911 A 27 3' UTR
5 MTF1 cr1 38278949 A 11 3' UTR
5 NAA38 cr7 117832209 A 9 3' UTR
5 NAPG cr18 10551001 T 11 3' UTR
5 NCOA1 cr2 24991385 A 25 3' UTR
5 NCOA3 cr20 46282984 T 11 3' UTR
5 NKAIN4 cr20 61872616 T 12 3' UTR
5 NLGN4X crX 5808268 T 11 3' UTR
5 NMNAT1 cr1 10044969 T 8 3' UTR
5 NPLOC4 cr17 79525610 A 9 3' UTR
5 NPNT cr4 106890724 T 10 3' UTR
5 NR2F2 cr15 96881909 T 10 3' UTR
5 NUFIP2 cr17 27585085 T 12 3' UTR
5 ODZ4 cr11 78367062 T 9 3' UTR
5 OGFOD1 cr16 56510333 T 12 3' UTR
5 OPA3 cr19 46049757 T 14 3' UTR
5 OSBP cr11 59341900 T 12 3' UTR
5 PAPD5 cr16 50264179 T 10 3' UTR
5 PAPD5 cr16 50263692 T 10 3' UTR
5 PAPD5 cr16 50263454 A 8 3' UTR
5 PFN1 cr17 4848972 A 10 3' UTR
5 PHKB cr16 47734578 A 10 3' UTR
5 PIGM cr1 159998080 T 11 3' UTR

74
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
5 PIGM cr1 159997525 A 10 3' UTR
5 PKP2 cr12 32944046 A 11 3' UTR
5 PLAGL2 cr20 30781644 A 11 3' UTR
5 PLEKHM3 cr2 208686453 A 10 3' UTR
5 POLR3B cr12 106903452 A 9 3' UTR
5 PPIC cr5 122359467 A 12 3' UTR
5 PPP1R10 cr6 30568234 A 11 3' UTR
5 PPP6C cr9 127911821 A 11 3' UTR
5 PPPDE1 cr1 244869241 A 12 3' UTR
5 PRKX crX 3525721 T 9 3' UTR
5 PRRG1 crX 37313537 T 10 3' UTR
5 PSMD5 cr9 123578376 A 10 3' UTR
5 PTGS2 cr1 186642025 T 9 3' UTR
5 RAB11FIP2 cr10 119765266 T 11 3' UTR
5 RANBP10 cr16 67757024 T 10 3' UTR
5 RASGRP4 cr19 38900377 A 11 3' UTR
5 RBL1 cr20 35632028 A 13 3' UTR
5 RBM15B cr3 51431679 T 11 3' UTR
5 RBMS3 cr3 30046424 A 11 3' UTR
5 RC3H1 cr1 173904709 A 11 3' UTR
5 RHOBTB3 cr5 95129188 A 12 3' UTR
5 RIMBP2 cr12 130882589 A 11 3' UTR
5 RNF41 cr12 56599353 G 10 3' UTR
5 RRP15 cr1 218506526 A 10 3' UTR
5 SAMD12 cr8 119208740 A 13 3' UTR
5 SAR1A cr10 71910315 A 10 3' UTR
5 SARM1 cr17 26726913 T 12 3' UTR
5 SATB2 cr2 200135086 T 10 3' UTR
5 SCAI cr9 127706579 T 16 3' UTR
5 SCAMP1 cr5 77772627 A 10 3' UTR
5 SCUBE3 cr6 35216591 A 10 3' UTR
5 SDC4 cr20 43954848 A 9 3' UTR
5 SENP5 cr3 196660478 T 11 3' UTR
5 SERPINE1 cr7 100781987 G 8 3' UTR
5 SFRS18 cr6 99848035 A 12 3' UTR
5 SH3KBP1 crX 19553810 T 12 3' UTR
5 SIK1 cr21 44835578 A 10 3' UTR
5 SKI cr1 2240043 T 10 3' UTR
5 SLC16A1 cr1 113455427 A 13 3' UTR
5 SLC26A4 cr7 107357810 A 25 3' UTR
5 SLC2A12 cr6 134312045 T 11 3' UTR

75
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
5 SLC6A6 cr3 14526824 T 11 3' UTR
5 SLC7A11 cr4 139090880 A 10 3' UTR
5 SMAD5 cr5 135513612 A 11 3' UTR
5 SMG1 cr16 18819070 T 11 3' UTR
5 SMS crX 22012649 T 10 3' UTR
5 SMURF2 cr17 62541185 T 13 3' UTR
5 SNAP23 cr15 42824292 T 14 3' UTR
5 SOST cr17 41831361 T 11 3' UTR
5 SPCS3 cr4 177250844 T 10 3' UTR
5 SPOCK1 cr5 136313113 A 11 3' UTR
5 SSR1 cr6 7284948 T 13 3' UTR
5 SSR3 cr3 156259169 T 10 3' UTR
5 ST3GAL5 cr2 86067101 A 9 3' UTR
5 ST7L cr1 113066620 A 11 3' UTR
5 STC2 cr5 172744019 T 12 3' UTR
5 STX6 cr1 180945093 A 9 3' UTR
5 SYNJ2BP cr14 70838863 T 10 3' UTR
5 SYT11 cr1 155851834 T 12 3' UTR
5 TAF8 cr6 42045495 T 11 3' UTR
5 THRAP3 cr1 36770047 T 17 3' UTR
5 TLL2 cr10 98124863 A 11 3' UTR
5 TMEM119 cr12 108984472 A 11 3' UTR
5 TMEM201 cr1 9674449 T 10 3' UTR
5 TMOD3 cr15 52201130 T 10 3' UTR
5 TMTC1 cr12 29656466 A 8 3' UTR
5 TNFAIP1 cr17 26672324 A 10 3' UTR
5 TNFAIP3 cr6 138204003 A 12 3' UTR
5 TNRC6B cr22 40724536 T 10 3' UTR
5 TRIP10 cr19 6751495 A 12 3' UTR
5 TRPM1 cr15 31293995 A 11 3' UTR
5 TSC22D2 cr3 150177375 T 13 3' UTR
5 TTC39C cr18 21715264 T 11 3' UTR
5 UBE2G2 cr21 46191155 A 12 3' UTR
5 UBLCP1 cr5 158712401 A 11 3' UTR
5 UBN2 cr7 138989574 T 10 3' UTR
5 UGT8 cr4 115598050 T 11 3' UTR
5 UTP15 cr5 72876582 T 12 3' UTR
5 WASL cr7 123323428 A 12 3' UTR
5 WDFY2 cr13 52334589 A 11 3' UTR
5 WDR76 cr15 44158820 T 21 3' UTR
5 XYLT1 cr16 17199280 T 8 3' UTR

76
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
5 ZBTB41 cr1 197124441 A 11 3' UTR
5 ZC3H6 cr2 113097277 T 13 3' UTR
5 ZDBF2 cr2 207177005 T 8 3' UTR
5 ZNF287 cr17 16454419 T 9 3' UTR
5 ZNF395 cr8 28205776 T 27 3' UTR
5 ZNF451 cr6 57033558 A 8 3' UTR
5 ZNF566 cr19 36937171 T 18 3' UTR
5 ZNF572 cr8 125990551 T 11 3' UTR
5 ZNF780B cr19 40535764 A 10 3' UTR
5 ZXDC cr3 126179925 T 11 3' UTR
5 ZYG11B cr1 53290310 A 13 3' UTR
4 SEPT11 cr4 77957803 T 10 3' UTR
4 ACVR1C cr2 158390343 A 10 3' UTR
4 ACVR2A cr2 148687300 A 10 3' UTR
4 ADAMTS18 cr16 77316279 T 11 3' UTR
4 AGPAT5 cr8 6617153 A 11 3' UTR
4 AKAP1 cr17 55198578 A 14 3' UTR
4 ANKIB1 cr7 92030525 A 11 3' UTR
4 ANKRD13B cr17 27941253 T 19 3' UTR
4 ANKS1B cr12 99138458 T 11 3' UTR
4 ARHGAP12 cr10 32096465 A 9 3' UTR
4 ARID5B cr10 63853410 T 27 3' UTR
4 ARL2BP cr16 57287376 T 12 3' UTR
4 ARMC8 cr3 137964255 T 9 3' UTR
4 ARPP19 cr15 52841555 A 10 3' UTR
4 ATP6V0D1 cr16 67472221 G 9 3' UTR
4 AXIN2 cr17 63525462 A 11 3' UTR
4 BAG5 cr14 104023132 A 10 3' UTR
4 BARX2 cr11 129321925 T 10 3' UTR
4 BCL11A cr2 60685736 T 13 3' UTR
4 BCL11A cr2 60684501 A 11 3' UTR
4 BCL11B cr14 99637754 T 10 3' UTR
4 BCL7A cr12 122498867 A 11 3' UTR
4 BEND4 cr4 42114856 A 10 3' UTR
4 BFAR cr16 14762692 A 16 3' UTR
4 BRAF cr7 140434294 A 9 3' UTR
4 BTBD7 cr14 93708031 A 9 3' UTR
4 BTBD7 cr14 93705796 T 13 3' UTR
4 C10orf46 cr10 120445285 A 10 3' UTR
4 C10orf84 cr10 120069534 A 9 3' UTR
4 C11orf41 cr11 33690228 T 8 3' UTR

77
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 C11orf58 cr11 16777810 T 24 3' UTR
4 C11orf58 cr11 16777368 T 9 3' UTR
4 C12orf23 cr12 107367018 A 10 3' UTR
4 C12orf5 cr12 4463524 T 10 3' UTR
4 C12orf66 cr12 64587315 A 10 3' UTR
4 C12orf76 cr12 110479725 A 11 3' UTR
4 C14orf101 cr14 57116192 A 10 3' UTR
4 C14orf43 cr14 74183215 A 11 3' UTR
4 C16orf45 cr16 15680717 C 9 3' UTR
4 C16orf87 cr16 46836142 T 12 3' UTR
4 C17orf78 cr17 35749617 A 11 3' UTR
4 C18orf25 cr18 43846502 A 9 3' UTR
4 C3orf70 cr3 184795851 A 10 3' UTR
4 C6orf170 cr6 121401361 T 21 3' UTR
4 C6orf62 cr6 24705738 A 10 3' UTR
4 C7orf45 cr7 129856476 A 11 3' UTR
4 C7orf69 cr7 47859241 A 11 3' UTR
4 C8orf48 cr8 13425580 T 9 3' UTR
4 C9 cr5 39285017 T 9 3' UTR
4 CA5B crX 15801003 T 10 3' UTR
4 CABLES2 cr20 60965113 A 10 3' UTR
4 CAPRIN1 cr11 34121880 T 8 3' UTR
4 CBFA2T2 cr20 32236969 T 11 3' UTR
4 CBL cr11 119172610 A 10 3' UTR
4 CBY1 cr22 39069285 T 9 3' UTR
4 CC2D1B cr1 52817555 A 22 3' UTR
4 CCND1 cr11 69466274 A 9 3' UTR
4 CD59 cr11 33730438 T 8 3' UTR
4 CD96 cr3 111368930 A 9 3' UTR
4 CDH13 cr16 83828683 A 11 3' UTR
4 CDH4 cr20 60512276 A 19 3' UTR
4 CEP164 cr11 117283967 T 11 3' UTR
4 CEP57L1 cr6 109484935 T 10 3' UTR
4 CHMP4C cr8 82671242 A 12 3' UTR
4 CLCN5 crX 49858223 A 9 3' UTR
4 CLDN14 cr21 37833059 T 10 3' UTR
4 CLEC3A cr16 78065330 T 12 3' UTR
4 CMTM8 cr3 32411483 A 9 3' UTR
4 CNNM1 cr10 101153279 A 9 3' UTR
4 CNNM3 cr2 97499281 A 12 3' UTR
4 CORO2B cr15 69020046 T 10 3' UTR

78
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 CPSF2 cr14 92630061 T 9 3' UTR
4 CREBBP cr16 3776240 G 10 3' UTR
4 CRTC1 cr19 18890340 A 9 3' UTR
4 CSMD3 cr8 113236641 T 9 3' UTR
4 CTTN cr11 70281530 T 10 3' UTR
4 CYP1B1 cr2 38296985 T 10 3' UTR
4 CYP20A1 cr2 204163758 A 10 3' UTR
4 CYP2C18 cr10 96495747 A 9 3' UTR
4 CYP4F22 cr19 15662704 C 9 3' UTR
4 DACH1 cr13 72014288 T 11 3' UTR
4 DCUN1D3 cr16 20870892 A 10 3' UTR
4 DCUN1D5 cr11 102928449 A 11 3' UTR
4 DDHD1 cr14 53513329 T 10 3' UTR
4 DDX18 cr2 118589332 A 9 3' UTR
4 DDX3X crX 41207099 T 10 3' UTR
4 DFFB cr1 3801133 T 11 3' UTR
4 DGCR8 cr22 20099229 C 16 3' UTR
4 DICER1 cr14 95554259 T 10 3' UTR
4 DLGAP4 cr20 35156622 T 10 3' UTR
4 DPP8 cr15 65738415 A 11 3' UTR
4 DSE cr6 116758558 A 11 3' UTR
4 DSTYK cr1 205115701 T 16 3' UTR
4 DUT cr15 48634591 A 10 3' UTR
4 DUT cr15 48634443 A 9 3' UTR
4 EAPP cr14 34985335 A 10 3' UTR
4 EDEM1 cr3 5260540 T 10 3' UTR
4 EEF2K cr16 22299309 T 19 3' UTR
4 EIF2B2 cr14 75476004 A 10 3' UTR
4 EIF4G3 cr1 21133145 T 12 3' UTR
4 ELAVL3 cr19 11564674 T 11 3' UTR
4 ERLIN2 cr8 37614867 T 10 3' UTR
4 ESRRB cr14 76967818 G 8 3' UTR
4 ETNK1 cr12 22839785 T 28 3' UTR
4 ETS1 cr11 128329018 A 9 3' UTR
4 FADS1 cr11 61567668 T 14 3' UTR
4 FAIM3 cr1 207077642 T 18 3' UTR
4 FAM101B cr17 292360 T 10 3' UTR
4 FAM116A cr3 57612436 A 13 3' UTR
4 FAM117B cr2 203633341 T 10 3' UTR
4 FAM126B cr2 201845397 G 7 3' UTR
4 FAM160B1 cr10 116621715 A 9 3' UTR

79
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 FAM189A1 cr15 29414906 G 8 3' UTR
4 FANCD2 cr3 10143061 T 25 3' UTR
4 FBN2 cr5 127594650 A 8 3' UTR
4 FBXO27 cr19 39515468 T 11 3' UTR
4 FGD4 cr12 32798227 T 12 3' UTR
4 FGD5 cr3 14976010 T 9 3' UTR
4 FGF12 cr3 191859718 T 11 3' UTR
4 FGFR1OP2 cr12 27118562 T 10 3' UTR
4 FLCN cr17 17115789 A 26 3' UTR
4 FMNL3 cr12 50033467 A 10 3' UTR
4 FOXN2 cr2 48603079 T 10 3' UTR
4 FOXO1 cr13 41132503 A 9 3' UTR
4 FOXP1 cr3 71005222 T 9 3' UTR
4 FPGT cr1 74672686 T 9 3' UTR
4 FTSJD1 cr16 71317151 A 10 3' UTR
4 FUT8 cr14 66209673 T 13 3' UTR
4 FZD7 cr2 202902385 A 11 3' UTR
4 GADL1 cr3 30769514 T 11 3' UTR
4 GAL3ST4 cr7 99757342 A 13 3' UTR
4 GAN cr16 81413521 T 12 3' UTR
4 GAPVD1 cr9 128127210 T 10 3' UTR
4 GATAD2A cr19 19617715 T 10 3' UTR
4 GATAD2B cr1 153781275 A 20 3' UTR
4 GDAP2 cr1 118411744 T 10 3' UTR
4 GDAP2 cr1 118408218 A 10 3' UTR
4 GFPT1 cr2 69549530 A 9 3' UTR
4 GLCCI1 cr7 8127832 T 11 3' UTR
4 GLDN cr15 51697574 T 21 3' UTR
4 GLYR1 cr16 4853902 T 10 3' UTR
4 GOLT1B cr12 21669842 A 9 3' UTR
4 GPM6A cr4 176555451 T 10 3' UTR
4 GPR124 cr8 37701260 A 10 3' UTR
4 GPR155 cr2 175299037 T 13 3' UTR
4 GPR161 cr1 168054505 T 10 3' UTR
4 GPR180 cr13 95279582 A 8 3' UTR
4 GPX8 cr5 54460112 T 10 3' UTR
4 GRAMD3 cr5 125829168 T 10 3' UTR
4 GSTCD cr4 106767825 T 20 3' UTR
4 GXYLT1 cr12 42477780 A 10 3' UTR
4 HCCS crX 11140989 T 11 3' UTR
4 HCN1 cr5 45260992 T 9 3' UTR

80
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 HDAC4 cr2 239971996 A 11 3' UTR
4 HELZ cr17 65067696 T 8 3' UTR
4 HEY2 cr6 126081692 T 10 3' UTR
4 HIF3A cr19 46843765 T 12 3' UTR
4 HNRNPA1L2 cr13 53217847 T 11 3' UTR
4 HNRNPK cr9 86584095 C 9 3' UTR
4 HOOK1 cr1 60338642 A 8 3' UTR
4 HP1BP3 cr1 21070971 A 10 3' UTR
4 HS3ST5 cr6 114376959 A 10 3' UTR
4 HUWE1 crX 53559518 A 12 3' UTR
4 IKZF4 cr12 56431620 A 10 3' UTR
4 IL7R cr5 35876844 A 10 3' UTR
4 IMPG2 cr3 100945663 A 9 3' UTR
4 INSR cr19 7112871 A 10 3' UTR
4 IRGQ cr19 44094353 A 11 3' UTR
4 IRS1 cr2 227600758 T 11 3' UTR
4 ISL1 cr5 50689706 A 9 3' UTR
4 ITPRIPL1 cr2 96994050 A 10 3' UTR
4 JAKMIP1 cr4 6055625 A 11 3' UTR
4 KBTBD7 cr13 41766026 A 9 3' UTR
4 KBTBD8 cr3 67059954 T 10 3' UTR
4 KCNMA1 cr10 78646910 A 9 3' UTR
4 KDELR2 cr7 6501817 A 10 3' UTR
4 KDM5A cr12 393295 T 11 3' UTR
4 KDSR cr18 60998042 T 15 3' UTR
4 KIAA0182 cr16 85706942 A 10 3' UTR
4 KIAA0494 cr1 47142711 T 9 3' UTR
4 KIAA0825 cr5 93487128 A 28 3' UTR
4 KIF1B cr1 10438932 T 10 3' UTR
4 KIF1B cr1 10437995 A 13 3' UTR
4 KLF12 cr13 74261703 T 11 3' UTR
4 KLHL4 crX 86922592 A 12 3' UTR
4 KPNA6 cr1 32639763 C 9 3' UTR
4 KREMEN1 cr22 29539729 A 14 3' UTR
4 L1CAM crX 153127125 T 9 3' UTR
4 LARP4B cr10 856761 A 9 3' UTR
4 LATS2 cr13 21547830 A 9 3' UTR
4 LBR cr1 225590887 A 10 3' UTR
4 LEF1 cr4 108969352 A 9 3' UTR
4 LIAS cr4 39478848 A 11 3' UTR
4 LIMS1 cr2 109300693 A 10 3' UTR

81
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 LIN7C cr11 27517538 A 10 3' UTR
4 LIX1 cr5 96428100 A 10 3' UTR
4 LMTK2 cr7 97837420 A 11 3' UTR
4 LRCH2 crX 114346112 T 10 3' UTR
4 LRRC8A cr9 131679397 A 11 3' UTR
4 LUZP2 cr11 25102964 A 12 3' UTR
4 LYRM7 cr5 130540369 A 15 3' UTR
4 MAP1B cr5 71502852 A 10 3' UTR
4 MAP4 cr3 48016254 A 13 3' UTR
4 MAP6 cr11 75316787 A 11 3' UTR
4 MAPK1IP1L cr14 55534134 T 10 3' UTR
4 MB21D2 cr3 192516152 A 10 3' UTR
4 MDM2 cr12 69233886 T 11 3' UTR
4 MEF2C cr5 88017643 A 7 3' UTR
4 MEGF9 cr9 123366681 T 10 3' UTR
4 METAP2 cr12 95908545 A 11 3' UTR
4 METTL8 cr2 172174950 T 8 3' UTR
4 MEX3A cr1 156044195 T 17 3' UTR
4 MFN2 cr1 12073251 A 11 3' UTR
4 MGAT4A cr2 99236361 T 10 3' UTR
4 MIDN cr19 1258791 A 10 3' UTR
4 MKLN1 cr7 131181200 T 10 3' UTR
4 MKRN3 cr15 23812682 T 8 3' UTR
4 MLL2 cr12 49413198 A 10 3' UTR
4 MLLT6 cr17 36883386 T 16 3' UTR
4 MMP2 cr16 55539895 T 10 3' UTR
4 MOSPD1 crX 134022551 A 9 3' UTR
4 MRPL44 cr2 224831951 T 11 3' UTR
4 MTMR4 cr17 56567367 A 9 3' UTR
4 MTSS1 cr8 125564840 A 9 3' UTR
4 MYCL1 cr1 40361307 A 10 3' UTR
4 NAPB cr20 23355923 A 9 3' UTR
4 NARG2 cr15 60714335 T 11 3' UTR
4 NCS1 cr9 132996076 T 12 3' UTR
4 NDFIP1 cr5 141533930 T 10 3' UTR
4 NEGR1 cr1 71869847 T 11 3' UTR
4 NEIL3 cr4 178283942 T 10 3' UTR
4 NF2 cr22 30092784 T 14 3' UTR
4 NLK cr17 26523190 T 10 3' UTR
4 NPC2 cr14 74946724 A 10 3' UTR
4 NR2F2 cr15 96882212 G 8 3' UTR

82
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 NRSN1 cr6 24147583 T 10 3' UTR
4 OSBP2 cr22 31302451 T 10 3' UTR
4 OSBPL3 cr7 24837354 A 10 3' UTR
4 OTUD4 cr4 146058513 T 8 3' UTR
4 OTUD4 cr4 146057615 G 13 3' UTR
4 OXR1 cr8 107764095 A 10 3' UTR
4 PABPC5 crX 90691818 T 9 3' UTR
4 PAICS cr4 57327144 A 10 3' UTR
4 PAK1IP1 cr6 10709747 T 12 3' UTR
4 PALM2 cr9 112706843 A 11 3' UTR
4 PAPD4 cr5 78982336 T 10 3' UTR
4 PAPOLA cr14 97033430 A 10 3' UTR
4 PCDH17 cr13 58300047 A 10 3' UTR
4 PCNP cr3 101312474 A 10 3' UTR
4 PDE4C cr19 18320061 T 12 3' UTR
4 PDGFA cr7 537622 A 11 3' UTR
4 PDGFA cr7 536908 T 11 3' UTR
4 PGM2L1 cr11 74047320 T 11 3' UTR
4 PIGW cr17 34894609 T 11 3' UTR
4 PIK3R1 cr5 67595054 A 10 3' UTR
4 PIM1 cr6 37143155 T 11 3' UTR
4 PIP5K1A cr1 151220867 T 11 3' UTR
4 PKD2 cr4 88998190 A 11 3' UTR
4 PKN2 cr1 89301773 T 11 3' UTR
4 PLA2G12A cr4 110633665 T 10 3' UTR
4 PLAGL2 cr20 30784138 T 11 3' UTR
4 PLCB1 cr20 8863118 A 10 3' UTR
4 PLCL1 cr2 199013907 T 9 3' UTR
4 PLCXD3 cr5 41307606 A 9 3' UTR
4 PLK2 cr5 57749858 A 9 3' UTR
4 PODNL1 cr19 14042032 G 8 3' UTR
4 PODXL cr7 131185943 A 11 3' UTR
4 POLH cr6 43584323 A 14 3' UTR
4 PPAP2B cr1 56962088 T 10 3' UTR
4 PPARA cr22 46633507 A 16 3' UTR
4 PPARGC1B cr5 149227267 A 14 3' UTR
4 PPM1E cr17 57060351 A 10 3' UTR
4 PPP1R3A cr7 113517422 A 9 3' UTR
4 PPP3CA cr4 101946069 T 10 3' UTR
4 PRDM15 cr21 43220664 A 12 3' UTR
4 PROSC cr8 37636576 A 10 3' UTR

83
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 PRTG cr15 55907920 T 10 3' UTR
4 PTP4A2 cr1 32374021 A 10 3' UTR
4 PTPN22 cr1 114357118 T 10 3' UTR
4 PTPRF cr1 44088117 T 11 3' UTR
4 PTRF cr17 40554683 A 15 3' UTR
4 PUM1 cr1 31405680 T 10 3' UTR
4 QRICH1 cr3 49067797 A 11 3' UTR
4 RAB39B crX 154488466 T 11 3' UTR
4 RAB7L1 cr1 205738564 T 10 3' UTR
4 RAB8B cr15 63559206 T 12 3' UTR
4 RASAL2 cr1 178447287 T 11 3' UTR
4 RBM12B cr8 94745547 A 10 3' UTR
4 RBM38 cr20 55983973 G 8 3' UTR
4 RBMS3 cr3 30045473 T 10 3' UTR
4 RDX cr11 110102325 A 10 3' UTR
4 RGS18 cr1 192154126 T 8 3' UTR
4 RGS6 cr14 73030606 A 11 3' UTR
4 RND2 cr17 41181921 A 24 3' UTR
4 RNF122 cr8 33405498 A 26 3' UTR
4 RNGTT cr6 89320667 T 10 3' UTR
4 ROCK1 cr18 18530891 A 10 3' UTR
4 RPRD2 cr1 150447772 T 10 3' UTR
4 RPRD2 cr1 150445907 T 10 3' UTR
4 RRM2 cr2 10269544 T 10 3' UTR
4 RSBN1L cr7 77408705 A 9 3' UTR
4 RSL1D1 cr16 11930997 T 11 3' UTR
4 SALL3 cr18 76757543 A 10 3' UTR
4 SAMD4A cr14 55257700 A 10 3' UTR
4 SASH1 cr6 148872287 T 10 3' UTR
4 SATB1 cr3 18390227 T 12 3' UTR
4 SCN1A cr2 166846936 T 10 3' UTR
4 SDC4 cr20 43955023 A 24 3' UTR
4 SEC63 cr6 108190403 A 10 3' UTR
4 SENP5 cr3 196658083 A 10 3' UTR
4 SEPHS1 cr10 13360740 A 11 3' UTR
4 SFXN1 cr5 174954918 T 22 3' UTR
4 SGK223 cr8 8175297 T 12 3' UTR
4 SH2B3 cr12 111887735 T 14 3' UTR
4 SHC1 cr1 154935862 G 8 3' UTR
4 SHC4 cr15 49117721 T 10 3' UTR
4 SHCBP1 cr16 46614658 T 14 3' UTR

84
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 SHOC2 cr10 112773341 T 10 3' UTR
4 SIPA1L3 cr19 38698929 T 10 3' UTR
4 SIPA1L3 cr19 38698868 T 10 3' UTR
4 SIX4 cr14 61178202 A 10 3' UTR
4 SLAIN2 cr4 48426160 T 9 3' UTR
4 SLC17A5 cr6 74303467 A 10 3' UTR
4 SLC22A5 cr5 131730903 T 17 3' UTR
4 SLC25A36 cr3 140696772 A 11 3' UTR
4 SLC2A2 cr3 170715683 T 10 3' UTR
4 SLC39A9 cr14 69928356 T 10 3' UTR
4 SLC6A15 cr12 85253350 T 10 3' UTR
4 SLC9A6 crX 135128103 T 11 3' UTR
4 SMAD3 cr15 67485102 A 9 3' UTR
4 SMAD4 cr18 48605007 T 10 3' UTR
4 SMAD7 cr18 46447623 A 10 3' UTR
4 SORL1 cr11 121502077 T 11 3' UTR
4 SORL1 cr11 121501334 T 9 3' UTR
4 SOST cr17 41831941 T 10 3' UTR
4 SOX30 cr5 157053271 T 10 3' UTR
4 SPATA13 cr13 24878597 T 11 3' UTR
4 SPATS2 cr12 49921053 T 10 3' UTR
4 SPINK7 cr5 147695440 T 10 3' UTR
4 SPOP cr17 47676672 A 13 3' UTR
4 SPRED1 cr15 38648129 A 9 3' UTR
4 SPTBN1 cr2 54898095 T 10 3' UTR
4 SRRM4 cr12 119599690 A 10 3' UTR
4 SRRM4 cr12 119596858 T 9 3' UTR
4 STAT2 cr12 56736372 A 13 3' UTR
4 STK4 cr20 43708275 A 10 3' UTR
4 STMN2 cr8 80577224 A 13 3' UTR
4 SUMO2 cr17 73164056 T 11 3' UTR
4 SYT13 cr11 45264120 A 9 3' UTR
4 TACC1 cr8 38708293 A 25 3' UTR
4 TAOK1 cr17 27871502 A 11 3' UTR
4 TBL1X crX 9684635 A 9 3' UTR
4 TFAP2B cr6 50814917 T 9 3' UTR
4 TFCP2L1 cr2 121975868 T 11 3' UTR
4 THAP2 cr12 72073229 T 10 3' UTR
4 THSD4 cr15 72072880 A 10 3' UTR
4 THSD7A cr7 11411520 T 10 3' UTR
4 TLCD2 cr17 1606349 T 13 3' UTR

85
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 TM9SF4 cr20 30754878 T 11 3' UTR
4 TMEM14C cr6 10731011 A 9 3' UTR
4 TMEM169 cr2 216966376 T 10 3' UTR
4 TMEM192 cr4 165997961 T 10 3' UTR
4 TMEM40 cr3 12775743 T 9 3' UTR
4 TNFAIP8 cr5 118729618 A 10 3' UTR
4 TNRC6C cr17 76104332 C 9 3' UTR
4 TPM4 cr19 16212343 T 9 3' UTR
4 TRAK2 cr2 202244537 T 11 3' UTR
4 TRIM33 cr1 114940229 T 13 3' UTR
4 TRIM56 cr7 100733606 A 9 3' UTR
4 TRIM9 cr14 51442832 T 10 3' UTR
4 TRPC1 cr3 142525356 T 9 3' UTR
4 TRPS1 cr8 116424772 T 10 3' UTR
4 TRPS1 cr8 116423510 A 12 3' UTR
4 TSPAN31 cr12 58141530 T 13 3' UTR
4 TTC14 cr3 180326182 T 15 3' UTR
4 TULP4 cr6 158929910 T 27 3' UTR
4 TXNDC9 cr2 99936109 A 9 3' UTR
4 U2AF1 cr21 44513110 T 11 3' UTR
4 UBE2G1 cr17 4173433 A 10 3' UTR
4 UBE2K cr4 39780193 A 11 3' UTR
4 UBE3C cr7 157060934 T 10 3' UTR
4 UBE4B cr1 10240859 T 10 3' UTR
4 UBFD1 cr16 23582355 T 10 3' UTR
4 UBN2 cr7 138992059 T 9 3' UTR
4 USF2 cr19 35770658 A 10 3' UTR
4 USP31 cr16 23077020 T 11 3' UTR
4 USP43 cr17 9632696 T 12 3' UTR
4 USP43 cr17 9632427 T 13 3' UTR
4 USP43 cr17 9632418 A 9 3' UTR
4 VEZF1 cr17 56051105 T 14 3' UTR
4 VGLL3 cr3 86990599 T 11 3' UTR
4 VPS53 cr17 422006 A 27 3' UTR
4 VTI1A cr10 114575744 T 10 3' UTR
4 WDR3 cr1 118502087 T 11 3' UTR
4 WDR82 cr3 52288956 T 19 3' UTR
4 WHSC1 cr4 1945453 A 9 3' UTR
4 XKR6 cr8 10755309 T 10 3' UTR
4 XKR6 cr8 10755102 T 11 3' UTR
4 ZBTB16 cr11 114121371 A 11 3' UTR

86
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 ZBTB4 cr17 7363093 A 10 3' UTR
4 ZC3HAV1L cr7 138710878 A 11 3' UTR
4 ZCCHC13 crX 73524759 A 9 3' UTR
4 ZCCHC2 cr18 60244188 A 10 3' UTR
4 ZFHX4 cr8 77778696 T 14 3' UTR
4 ZFP36L1 cr14 69255309 T 12 3' UTR
4 ZFP36L2 cr2 43450053 C 8 3' UTR
4 ZMIZ1 cr10 81075616 A 10 3' UTR
4 ZNF498 cr7 99229241 T 11 3' UTR
4 ZNF528 cr19 52920874 T 12 3' UTR
4 ZNF594 cr17 5084035 A 10 3' UTR
4 ZNF618 cr9 116812463 A 9 3' UTR
4 ZNF629 cr16 30792783 T 10 3' UTR
4 ZNF681 cr19 23925293 A 13 3' UTR
4 ZNF737 cr19 20726934 A 11 3' UTR
4 ZNF740 cr12 53584463 T 14 3' UTR
4 ZSCAN30 cr18 32831761 T 12 3' UTR
13 GABRG2 cr5 161494990 A 12 5' UTR
12 ARHGEF11 cr1 157014811 A 12 5' UTR
12 CCT6B cr17 33288433 A 11 5' UTR
12 LRMP cr12 25205380 A 11 5' UTR
11 TMEM177 cr2 120437061 A 11 5' UTR
11 ZNF781 cr19 38161161 T 11 5' UTR
10 EPHB6 cr7 142560576 A 13 5' UTR
10 LMOD3 cr3 69171664 T 13 5' UTR
10 MBNL1 cr3 152017897 T 11 5' UTR
9 ARHGEF9 crX 62974288 T 12 5' UTR
9 BDNF cr11 27741184 A 10 5' UTR
9 CBLN2 cr18 70211389 A 14 5' UTR
9 OIT3 cr10 74653468 A 10 5' UTR
8 BMP5 cr6 55739711 A 14 5' UTR
8 LOC642587 cr1 209602342 T 13 5' UTR
8 OMD cr9 95179844 T 11 5' UTR
8 SEMA6A cr5 115910134 A 11 5' UTR
8 TCF4 cr18 53255634 A 12 5' UTR
7 ASPH cr8 62602295 A 11 5' UTR
7 CNTNAP2 cr7 145813627 T 11 5' UTR
7 DIO2 cr14 80678323 T 14 5' UTR
7 DIO2 cr14 80678077 T 25 5' UTR
7 GSDMC cr8 130798567 A 14 5' UTR
7 PTP4A2 cr1 32384716 A 11 5' UTR

87
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
7 ZXDB crX 57618380 T 9 5' UTR
6 AMD1 cr6 111196178 A 11 5' UTR
6 DDX3X crX 41192964 A 10 5' UTR
6 ESCO1 cr18 19164371 A 11 5' UTR
6 GEN1 cr2 17935494 T 11 5' UTR
6 LPHN1 cr19 14316982 A 15 5' UTR
6 LRRC70 cr5 61874619 A 18 5' UTR
6 MEIS1 cr2 66662690 T 13 5' UTR
6 SATB1 cr3 18465613 A 13 5' UTR
6 ST7L cr1 113162029 C 10 5' UTR
6 TMEM31 crX 102965989 T 10 5' UTR
6 TOX cr8 60031707 A 14 5' UTR
5 AAK1 cr2 69870217 T 24 5' UTR
5 ARHGEF11 cr1 157014870 A 11 5' UTR
5 CBLN2 cr18 70211440 A 9 5' UTR
5 CEPT1 cr1 111690319 A 9 5' UTR
5 EMP1 cr12 13364426 A 10 5' UTR
5 GTF2A1 cr14 81686922 A 13 5' UTR
5 L3MBTL3 cr6 130339785 A 10 5' UTR
5 LMO7 cr13 76195056 A 9 5' UTR
5 LPAR4 crX 78003392 A 31 5' UTR
5 LRRC4C cr11 40314470 A 10 5' UTR
5 MCF2 crX 138724841 A 15 5' UTR
5 NDE1 cr16 15737427 T 11 5' UTR
5 PBX1 cr1 164528904 T 10 5' UTR
5 PRMT8 cr12 3600691 T 11 5' UTR
5 PTPRB cr12 71031210 A 10 5' UTR
5 SCN2B cr11 118047234 A 9 5' UTR
5 TIGD7 cr16 3350676 A 10 5' UTR
5 TSHZ1 cr18 72922942 T 10 5' UTR
5 XRRA1 cr11 74656098 T 10 5' UTR
5 ZXDA crX 57936946 A 9 5' UTR
4 ABCC10 cr6 43399532 T 10 5' UTR
4 C1QL3 cr10 16563613 T 10 5' UTR
4 CPLX4 cr18 56985739 A 10 5' UTR
4 DHRS3 cr1 12677525 A 21 5' UTR
4 FAM65B cr6 24877343 A 8 5' UTR
4 GRIA2 cr4 158142151 A 9 5' UTR
4 HEXIM1 cr17 43226461 T 10 5' UTR
4 HRH2 cr5 175110094 A 21 5' UTR
4 HYLS1 cr11 125753769 A 10 5' UTR

88
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero Región
inicial
afectadas afectada afectado
4 IL18RAP cr2 103035368 T 11 5' UTR
4 MBNL1 cr3 152017452 A 10 5' UTR
4 NLRP3 cr1 247581609 T 12 5' UTR
4 NR2F2 cr15 96874920 T 11 5' UTR
4 NRXN3 cr14 79746442 T 10 5' UTR
4 OBFC2A cr2 192543129 T 24 5' UTR
4 PDGFB cr22 39640806 T 16 5' UTR
4 PIK3R1 cr5 67584512 T 12 5' UTR
4 PPP2R5C cr14 102276205 T 11 5' UTR
4 RALYL cr8 85095860 T 11 5' UTR
4 RFWD2 cr1 176176257 T 9 5' UTR
4 RGS4 cr1 163038838 T 10 5' UTR
4 SCN2A cr2 166150520 A 28 5' UTR
4 SEMA3E cr7 83278198 A 16 5' UTR
4 SETBP1 cr18 42260910 G 8 5' UTR
4 SIAE,SPA17 cr11 124543762 T 15 5' UTR
4 SKIV2L2 cr5 54603686 A 13 5' UTR
4 SLC38A5 crX 48327811 T 12 5' UTR
4 STIM2 cr4 26862546 T 18 5' UTR
4 STK11 cr19 1206796 T 10 5' UTR
4 TGFB3 cr14 76447771 A 11 5' UTR
4 TRIP6 cr7 100464995 A 10 5' UTR
4 ZNF107 cr7 64152284 A 8 5' UTR

Se ha aplicado el mismo filtrado adicional a los marcadores de la tabla 2; los resultados se enumeran en la tabla 5.
5
Tabla 5. Indeles recurrentes más comunes en regiones exónicas para 16 muestras de tumores deficientes en MMR,
después de una etapa de filtrado adicional.

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero
inicial
afectadas afectada afectado
11 SETD1B cr12 122242657 C 8
10 OR7E24 cr19 9361740 T 11
10 SEC31A cr4 83785564 T 9
9 ASTE1 cr3 130733046 T 11
9 CASP5 cr11 104879686 T 10
9 RPL22 cr1 6257784 T 8
8 CNOT2 cr12 70747693 A 25
8 LTN1 cr21 30339205 T 11
8 TTK cr6 80751896 A 9
7 CCDC150 cr2 197531518 A 11
7 KIAA2018 cr3 113377481 T 11

89
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero
inicial
afectadas afectada afectado
7 MBD4 cr3 129155547 T 10
7 MSH6 cr2 48030639 C 8
7 PHF2 cr9 96422611 A 8
7 RNF145 cr5 158630629 T 11
7 RNPC3 cr1 104076466 A 12
7 SLC22A9 cr11 63149670 A 11
7 TMBIM4 cr12 66531936 A 10
6 AIM2 cr1 159032486 T 10
6 ATR cr3 142274739 T 10
6 CASP5 cr11 104878040 T 10
6 CDH26 cr20 58587783 A 10
6 CLOCK cr4 56336953 A 9
6 CTCF cr16 67645338 A 7
6 GRIK2 cr6 102503431 A 8
6 KIAA0182 cr16 85682289 C 8
6 MIS18BP1 cr14 45716018 T 11
6 MLL3 cr7 151874147 T 9
6 NDUFC2 cr11 77784146 A 9
6 RBMXL1 cr1 89449508 T 11
6 SLC35F5 cr2 114500276 A 10
6 TAF1B cr2 9989570 A 11
6 TGFBR2 cr3 30691871 A 10
6 TMEM60 cr7 77423459 T 9
5 ACVR2A cr2 148683685 A 8
5 BRD3 cr9 136918528 G 8
5 C13orf40 cr13 103381995 A 9
5 COBLL1 cr2 165551295 A 9
5 DDX27 cr20 47858503 A 8
5 DOCK3 cr3 51417603 C 7
5 FAM111B cr11 58892376 A 10
5 FAM18A cr16 10867202 A 9
5 FETUB cr3 186362543 A 9
5 IGF2R cr6 160485487 G 8
5 KIAA1919 cr6 111587360 T 9
5 MAP3K4 cr6 161469775 A 8
5 NRIP1 cr21 16338329 T 8
5 PRKDC cr8 48866909 T 10
5 PRRG1 crX 37312610 C 8
5 PRRT2 cr16 29825015 C 9
5 RFFL cr17 33336605 A 14
5 RGS12 cr4 3430398 A 9

90
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero
inicial
afectadas afectada afectado
5 SLMO2-ATP5E cr20 57603795 T 11
5 SMC6 cr2 17898125 T 9
5 SNAR-G1 cr19 49540383 A 14
5 SRSF3 cr6 36570853 T 14
5 TSIX crX 73039404 A 13
5 UBR5 cr8 103289348 T 8
5 UVRAG cr11 75694430 A 10
4 C14orf39 cr14 60903564 A 8
4 C15orf5 cr15 77516475 T 11
4 CEP164 cr11 117222647 A 11
4 CYHR1 cr8 145689658 C 9
4 DCAF17 cr2 172339178 T 11
4 ELAVL3 cr19 11577604 C 9
4 EXOSC9 cr4 122723893 T 8
4 FAM20A cr17 66531810 T 13
4 FU90757 cr17 79005507 C 9
4 FOXO3B cr17 18570304 T 16
4 GBP3 cr1 89473441 T 10
4 GLTSCR1 cr19 48197890 C 8
4 HPS1 cr10 100186986 G 8
4 INO80E cr16 30016652 C 9
4 INTS2 cr17 59944673 A 11
4 JAK1 cr1 65325832 G 7
4 KIAA0664L3 cr16 31718743 A 15
4 LOC284023 cr17 7818450 A 14
4 LOC645431 cr14 65877626 A 11
4 MIAT cr22 27067793 A 13
4 MYO10 cr5 16694605 C 8
4 OSBPL2 cr20 60854257 C 7
4 PAR-SN cr15 25227494 A 11
4 PRR11 cr17 57247170 A 9
4 RBM27 cr5 145647319 A 9
4 RBM43 cr2 152108087 T 10
4 RFC3 cr13 34398062 A 10
4 RG9MTD1 cr3 101284008 A 10
4 RPS26P11 crX 71264809 A 15
4 SEC63 cr6 108214754 T 10
4 SLC23A2 cr20 4850568 G 9
4 SPECC1 cr17 20108262 A 8
4 SRPR cr11 126137086 T 8
4 TESC cr12 117476741 T 14

91
ES 2 906 023 T3

(continuación)

Nº de Base de Longitud del


Posición
muestras Gen Cromosoma homopolímero homopolímero
inicial
afectadas afectada afectado
4 TEX11 crX 70127617 A 8
4 TMCC1 cr3 129407106 A 13
4 TSIX crX 73017534 A 12
4 WDTC1 cr1 27621107 G 8
4 XPA cr9 100437633 T 10
4 ZBTB20 cr3 114058002 G 7
4 ZDHHC8 cr22 20130521 C 6
4 ZMAT1 crX 101138438 T 11
4 ZNF273 cr7 64390205 T 13
4 ZNF831 cr20 57766219 C 8

Según formas de realización particulares, los genes en los que está presente más de un indel recurrente en las
5 regiones UTR son particularmente adecuados como marcador. En estas formas de realización, al menos uno de los
genes se selecciona de la lista de ARHGEF11, CBLN2, DIO2, MBNL1 (todos los marcadores 5’UTR), ACVR1C,
ANKIB1, ATXN1, BCL11A, BCL11B, BCL7A, BOD1L, BTBD7, C11orf58, C14orf101, CACNB4, CALN1, CANX,
CASK, CBFB, CBL, CBX5, CCND1, CCND2, CLCN5, CRTC1, CSNK1E, CYP1B1, DCUN1D5, DDHD1, DLGAP2,
DSTYK, DTNA, DUT, DYRK2, EBF1, EFNA5, EIF4G3, ELAVL3, EPS15, ERBB2IP, ERBB4, EVI5, FAM116A,
10 FAM126B, FAM20B, FAM46A, FBN2, FBXO27, FGF9, FGFR1OP2, FOXN2, FOXN3, FOXP1, GABRB2, GDAP2,
GNAI2, GSK3B, HAS2, HDAC4, HELZ, HIPK2, HNRNPA3, HNRNPK, HUWE1, IGFBP5, INSR, KDM5A, KIAA0825,
KIAA1324, KIF1B, KLHL4, LARP4B, LIN7C, LMO4, LPHN3, LYRM7, MAP1B, MAPK1IP1L, MDM2, MED1, MED13,
MED28, MESDC1, MEX3A, MGAT4A, MKLN1, MLL2, NARG2, NCEH1, NPNT, NPR3, NR2F2, NUFIP2, OPA3,
OTUD4, OXR1, PALM2, PAPD5, PDGFA, PIGM, PLAGL2, PPP2R3A, PRPF40A, PRTG, RAB11FIP2, RAB8B,
15 RBM12B, RBMS3, RC3H1, RORA, RPRD2, RUNDC3B, SAMD12, SAR1A, SATB2, SDC4, SENP1, SENP5,
SH3KBP1, SH3RF1, SIPA1L3, SLAIN2, SLC7A11, SMAD3, SMAD4, SMAD5, SORL1, SOST, SOX4, SPCS3,
SRRM4, ST7L, SYNJ2BP, TACC1, TFAP2B, TLCD2, TMEM57, TMTC3, TNRC6B, TNRC6C, TRIM66, TRPS1,
UBN2, USP43, VEZF1, WDR82, XKR6, XYLT1, ZBTB7A, ZNF238, ZNF737, ZNF740 (todos los marcadores 3’UTR),
CPLX4, DDX3X, GABRG2, PIK3R1, PTP4A2, SATB1, SEMA6A, y STK11 (afectados en 5’ y 3’ UTR).
20
No obstante, téngase en cuenta que los genes en los que solo un homopolímero se ve afectado de forma recurrente
en las regiones UTR pueden ser igualmente buenos como marcadores, por ejemplo porque solo hay una región
homopolimérica en la UTR, o porque hay una clara preferencia por la aparición de indeles en un homopolímero con
respecto al otro. Este último se observa, por ejemplo, en UTR de genes tales como CACNB4, EIF4G3, FAM20B,
25 LPHN3 o PRTG, en los que más de un homopolímero se ve afectado de forma recurrente, pero un homopolímero se
ve afectado con más frecuencia que el o los otros, aunque la longitud del homopolímero y la composición son
comparables.

También los genes con regiones exónicas que se ven afectados de forma recurrente por más de un indel están
30 particularmente previstos como marcadores. Por lo tanto, según formas de realización específicas, CASP5, MIAT,
TROVE2 y TSIX se prevén particularmente como marcadores exónicos; más particularmente se prevén CASP5 y TSIX.

Otra lista particular de marcadores UTR previstos son los que se identificaron en los primeros 11 tumores deficientes
en MMR sólidos. Esta lista se proporciona en la tabla 6, los indeles recurrentes comunes se definen como los que se
35 producen en al menos 3 de las 11 muestras.

Tabla 6. Indeles recurrentes más comunes en las regiones 5' y 3' UTR
para 11 muestras tumorales deficientes en MMR.

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
9 ARHGEF11 cr1 157014811 A 12 5'
UTR
9 LRMP cr12 25205380 A 11 5'
UTR
40
92
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
5'
8 GABRG2 cr5 161494990 A 12
UTR
5'
8 MBNL1 cr3 152017897 T 11
UTR
5'
7 ARHGEF9 crX 62974288 T 12
UTR
5'
7 CCT6B cr17 33288433 A 11
UTR
5'
7 GRIA2 cr4 158142151 A 9
UTR
5'
7 TRPS1 cr8 116681041 A 14
UTR
5'
7 ZNF781 cr19 38161161 T 11
UTR
5'
6 AMD1 cr6 111196178 A 11
UTR
5'
6 ASPH cr8 62602295 A 11
UTR
5'
6 EPHB6 cr7 142560576 A 13
UTR
5'
6 LMOD3 cr3 69171664 T 13
UTR
5'
6 OMD cr9 95179844 T 11
UTR
5'
6 SEMA6A cr5 115910134 A 11
UTR
5'
6 TMEM177 cr2 120437061 A 11
UTR
5'
5 BMP5 cr6 55739711 A 14
UTR
5'
5 CBLN2 cr18 70211389 A 14
UTR
5'
5 CEPT1 cr1 111690319 A 9
UTR
5'
5 LRRC70 cr5 61874619 A 18
UTR
5'
5 MCF2 crX 138724841 A 15
UTR
5'
5 MEIS1 cr2 66662690 T 13
UTR
5'
5 NDE1 cr16 15737427 T 11
UTR
5'
5 OIT3 cr10 74653468 A 10
UTR
5'
5 RCC2 cr1 17766108 T 10
UTR
5'
5 RUFY3 cr4 71588131 T 14
UTR

93
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
5'
5 ZXDA crX 57936946 A 9
UTR
5'
4 BDNF cr11 27741184 A 10
UTR
5'
4 EBF1 cr5 158526596 T 11
UTR
5'
4 EIF4E cr4 99851375 T 11
UTR
5'
4 ESCO1 cr18 19164371 A 11
UTR
5'
4 GEN1 cr2 17935494 T 11
UTR
5'
4 HEMGN cr9 100700505 A 11
UTR
5'
4 HRH2 cr5 175110094 A 21
UTR
5'
4 L3MBTL3 cr6 130339785 A 10
UTR
5'
4 LMO7 cr13 76195056 A 9
UTR
5'
4 LOC642587 cr1 209602342 T 13
UTR
5'
4 LRRC4C cr11 40314470 A 10
UTR
5'
4 NR3C1 cr5 142814523 T 12
UTR
5'
4 PTP4A2 cr1 32384716 A 11
UTR
5'
4 RAPGEF2 cr4 160189200 T 11
UTR
5'
4 RGS4 cr1 163038838 T 10
UTR
5'
4 SATB1 cr3 18465613 A 13
UTR
5'
4 SETBP1 cr18 42260910 G 8
UTR
5'
4 ST7L cr1 113162029 C 10
UTR
5'
4 TCF4 cr18 53255634 A 12
UTR
5'
4 TCF7L2 cr10 114710208 T 14
UTR
5'
4 TSHZ1 cr18 72922942 T 10
UTR
5'
4 USP53 cr4 120135275 A 18
UTR
5'
4 ZNF107 cr7 64152284 A 8
UTR

94
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
5'
3 AAK1 cr2 69870217 T 24
UTR
5'
3 ABCC10 cr6 43399532 T 10
UTR
5'
3 C10orf140 cr10 21806928 G 10
UTR
5'
3 C1QL3 cr10 16563613 T 10
UTR
5'
3 CCDC126 cr7 23650854 T 10
UTR
5'
3 CCDC99 cr5 169015403 A 8
UTR
5'
3 CNTNAP2 cr7 145813627 T 11
UTR
5'
3 CPLX4 cr18 56985739 A 10
UTR
5'
3 DDX3X crX 41192964 A 10
UTR
5'
3 DIO2 cr14 80678323 T 14
UTR
5'
3 DIO2 cr14 80678077 T 25
UTR
5'
3 EBP crX 48382099 T 18
UTR
5'
3 EMP1 cr12 13364426 A 10
UTR
5'
3 FAM65B cr6 24877343 A 8
UTR
5'
3 FLRT2 cr14 86087801 T 10
UTR
5'
3 GSDMC cr8 130798567 A 14
UTR
5'
3 HOXD3 cr2 177028841 A 10
UTR
5'
3 HYLS1 cr11 125753769 A 10
UTR
5'
3 JAKMIP2 cr5 147162132 T 10
UTR
5'
3 LPAR4 crX 78003392 A 31
UTR
5'
3 LPHN1 cr19 14316982 A 15
UTR
5'
3 MARCKS cr6 114178627 T 9
UTR
5'
3 MRGPRF cr11 68780847 C 8
UTR
5'
3 NCAM1 cr11 112832276 G 10
UTR

95
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
5'
3 NR2F2 cr15 96874920 T 11
UTR
5'
3 P2RY14 cr3 150937331 T 8
UTR
5'
3 PBX1 cr1 164528904 T 10
UTR
5'
3 PKN2 cr1 89150150 T 13
UTR
5'
3 PPP2R5C cr14 102276205 T 11
UTR
5'
3 PTPRB cr12 71031210 A 10
UTR
5'
3 RFWD2 cr1 176176257 T 9
UTR
5'
3 SCN2B cr11 118047234 A 9
UTR
5'
3 SLC38A5 crX 48327811 T 12
UTR
5'
3 TBC1D5 cr3 17781827 A 14
UTR
5'
3 TMEM31 crX 102965989 T 10
UTR
5'
3 TOX cr8 60031707 A 14
UTR
5'
3 TRIP6 cr7 100464995 A 10
UTR
5'
3 XRRA1 cr11 74656098 T 10
UTR
5'
3 ZXDB crX 57618380 T 9
UTR
3'
11 WIPF2 cr17 38436904 T 13
UTR
3'
10 NARG2 cr15 60712503 T 13
UTR
3'
9 AHCYL1 cr1 110566210 A 14
UTR
3'
9 C17orf63 cr17 27083744 T 12
UTR
3'
9 CD5L cr1 157801230 A 13
UTR
3'
9 CEP170 cr1 243288181 T 11
UTR
3'
9 COL5A2 cr2 189898205 T 13
UTR
3'
9 CSNK1G3 cr5 122950254 T 13
UTR
3'
9 DIDO1 cr20 61536691 A 11
UTR

96
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
9 EIF4G3 cr1 21133496 T 13
UTR
3'
9 GSK3B cr3 119542766 A 11
UTR
3'
9 KCNMB4 cr12 70824838 A 14
UTR
3'
9 MAPK1IP1L crl4 55535728 T 13
UTR
3'
9 NPR3 cr5 32787131 A 11
UTR
3'
9 PI15 cr8 75766071 T 10
UTR
3'
9 PRTG cr15 55903921 A 11
UTR
3'
9 RASGRP1 cr15 38781450 T 13
UTR
3'
9 SH3KBP1 crX 19552231 T 13
UTR
3'
9 SHROOM3 cr4 77701305 A 12
UTR
3'
9 SLC5A3 cr21 35470291 T 11
UTR
3'
9 UBE2Z cr17 47005701 A 11
UTR
3'
9 ZBTB33 crX 119390643 T 14
UTR
3'
9 ZNF275 crX 152617043 A 12
UTR
3'
8 AGPAT3 cr21 45405278 A 15
UTR
3'
8 APH1B cr15 63600287 T 12
UTR
3'
8 BCL11A cr2 60685409 T 12
UTR
3'
8 BMPR1B cr4 96076113 T 13
UTR
3'
8 CALN1 cr7 71245682 A 12
UTR
3'
8 CASK crX 41379131 A 13
UTR
3'
8 CBFB cr16 67133068 T 11
UTR
3'
8 CBX5 cr12 54628041 T 13
UTR
3'
8 CCDC85C cr14 99978765 A 12
UTR
3'
8 CNOT7 cr8 17088039 T 11
UTR

97
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
8 CYP1B1 cr2 38297055 T 12
UTR
3'
8 DRAM2 cr1 111660181 A 11
UTR
3'
8 EDA2R crX 65815929 T 12
UTR
3'
8 EDEM3 cr1 184660755 A 14
UTR
3'
8 EGR1 cr5 137804274 A 12
UTR
3'
8 EIF4G3 cr1 21133286 A 13
UTR
3'
8 FAM20B cr1 179044906 A 12
UTR
3'
8 FCHSD2 cr11 72549649 A 10
UTR
3'
8 FLT1 cr13 28877146 A 12
UTR
3'
8 FMO2 cr1 171178335 A 11
UTR
3'
8 G3BP2 cr4 76568663 A 12
UTR
3'
8 HELZ cr17 65070976 A 14
UTR
3'
8 HRNR cr1 152184856 T 11
UTR
3'
8 IER3IP1 cr18 44682385 A 11
UTR
3'
8 KCNG1 cr20 49620212 T 14
UTR
3'
8 KCNK1 cr1 233807667 A 11
UTR
3'
8 KLF3 cr4 38699104 T 14
UTR
3'
8 LHX9 cr1 197898395 T 12
UTR
3'
8 LRRC8D cr1 90401405 T 11
UTR
3'
8 LYRM1 cr16 20935842 T 11
UTR
3'
8 MED13 cr17 60023567 A 10
UTR
3'
8 MYO5B cr18 47351784 A 12
UTR
3'
8 NCEH1 cr3 172348807 A 12
UTR
3'
8 PPP1R12A cr12 80169697 T 13
UTR

98
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
8 PPP1R3D cr20 58512721 T 13
UTR
3'
8 RAB11FIP1 cr8 37718707 A 13
UTR
3'
8 RAB6C cr2 130739712 T 13
UTR
3'
8 SAMD12 cr8 119209320 A 11
UTR
3'
8 SEMA6A cr5 115779928 A 13
UTR
3'
8 SLAIN2 cr4 48428163 T 11
UTR
3'
8 SMAD4 cr18 48609831 T 11
UTR
3'
8 TMED7 cr5 114950622 A 14
UTR
3'
8 TMEM57 cr1 25826052 T 12
UTR
3'
8 TMEM65 cr8 125325217 A 11
UTR
3'
8 TNPO1 cr5 72204773 A 13
UTR
3'
8 TOR1AIP2 cr1 179814857 A 12
UTR
3'
8 TRAK2 cr2 202242603 A 12
UTR
3'
8 TRIP11 cr14 92435633 A 12
UTR
3'
8 UST cr6 149398012 T 13
UTR
3'
8 VEGFA cr6 43754176 A 12
UTR
3'
8 ZBTB7A cr19 4046571 T 11
UTR
3'
8 ZKSCAN1 cr7 99633041 T 12
UTR
3'
8 ZNF12 cr7 6730082 T 12
UTR
3'
8 ZNF169 cr9 97063725 A 11
UTR
3'
7 ABAT cr16 8876792 T 11
UTR
3'
7 AEN cr15 89174888 T 12
UTR
3'
7 AIDA cr1 222841524 T 10
UTR
3'
7 ALG9 cr11 111655441 A 11
UTR

99
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
7 ANK2 cr4 114303782 T 11
UTR
3'
7 ANKS1B cr12 99138457 T 12
UTR
3'
7 ARFIP1 cr4 153832102 T 11
UTR
3'
7 ARHGAP18 cr6 129898731 A 11
UTR
3'
7 ARID1A cr1 27107950 A 12
UTR
3'
7 ASPN cr9 95218905 A 12
UTR
3'
7 ATP11A cr13 113540850 T 12
UTR
3'
7 BCL11B cr14 99637947 T 12
UTR
3'
7 BTBD7 cr14 93708030 A 10
UTR
3'
7 Cllorf87 cr11 109296012 A 12
UTR
3'
7 C14orf101 crl4 57114799 A 13
UTR
3'
7 C15orf2 cr15 24927891 A 10
UTR
3'
7 C15orf29 cr15 34434105 T 12
UTR
3'
7 C5orf33 cr5 36194227 A 11
UTR
3'
7 C5orf51 cr5 41921535 T 13
UTR
3'
7 CAMK2A cr5 149600684 T 11
UTR
3'
7 CANX cr5 179158477 A 12
UTR
3'
7 CBLN4 cr20 54572755 A 12
UTR
3'
7 CD1E cr1 158327025 T 13
UTR
3'
7 CD47 cr3 107762288 A 11
UTR
3'
7 CDC23 cr5 137524388 A 11
UTR
3'
7 CDKN2AIPNL cr5 133738313 A 11
UTR
3'
7 CEP44 cr4 175238738 T 13
UTR
3'
7 CMIP cr16 81744987 A 10
UTR

100
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
7 CMTM6 cr3 32523862 A 12
UTR
3'
7 CNR1 cr6 88853530 A 11
UTR
3'
7 CPNE3 cr8 87571865 T 11
UTR
3'
7 CREB3L2 cr7 137561927 A 11
UTR
3'
7 CRTAP cr3 33187520 A 12
UTR
3'
7 CSDA cr12 10851811 T 14
UTR
3'
7 DLGAP2 cr8 1652939 A 11
UTR
3'
7 DLGAP4 cr20 35156539 T 11
UTR
3'
7 EBF1 cr5 158123905 T 13
UTR
3'
7 ENAM cr4 71511776 T 15
UTR
3'
7 EPS15 cr1 51821385 A 13
UTR
3'
7 EPT1 cr2 26617514 T 11
UTR
3'
7 ERBB2IP cr5 65375200 T 15
UTR
3'
7 FAM104A cr17 71204073 A 13
UTR
3'
7 FAM126B cr2 201844251 A 11
UTR
3'
7 FAM126B cr2 201838933 A 13
UTR
3'
7 FGF9 crl3 22278024 T 13
UTR
3'
7 FGFBP3 cr10 93666830 A 11
UTR
3'
7 FLRT2 cr14 86090074 A 12
UTR
3'
7 FLRT3 cr20 14305760 T 12
UTR
3'
7 FLT1 cr13 28875309 A 14
UTR
3'
7 FYN cr6 111982555 T 12
UTR
3'
7 GABPB1 cr15 50570604 A 13
UTR
3'
7 GABRG2 cr5 161581834 A 11
UTR

101
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
7 GBP1 cr1 89518865 T 13
UTR
3'
7 GLUD1 cr10 88810337 A 15
UTR
3'
7 HCRTR2 cr6 55147361 T 12
UTR
3'
7 HIPK2 cr7 139249947 A 14
UTR
3'
7 INSR cr19 7116555 A 12
UTR
3'
7 KIAA2018 cr3 113371321 A 11
UTR
3'
7 KLHL4 crX 86922591 A 13
UTR
3'
7 KRT8 cr12 53291007 A 11
UTR
3'
7 LARP4B cr10 856116 A 13
UTR
3'
7 LRAT cr4 155673737 A 10
UTR
3'
7 MAT2A cr2 85772061 T 12
UTR
3'
7 MED28 cr4 17626082 T 11
UTR
3'
7 METTL9 cr16 21667438 A 12
UTR
3'
7 MEX3A cr1 156043944 T 11
UTR
3'
7 MITF cr3 70014804 A 11
UTR
3'
7 MLL3 cr7 151832596 T 11
UTR
3'
7 MSR1 cr8 15997800 A 11
UTR
3'
7 NEK5 cr13 52639268 A 13
UTR
3'
7 NFIX cr19 13208001 T 13
UTR
3'
7 NRXN3 cr14 80328831 A 11
UTR
3'
7 OXR1 cr8 107763507 T 13
UTR
3'
7 PEX13 cr2 61276332 T 15
UTR
3'
7 PGK1 crX 77381770 T 13
UTR
3'
7 PHACTR2 cr6 144151003 T 10
UTR

102
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
7 PLEKHA2 cr8 38830288 T 13
UTR
3'
7 POFUT1 cr20 30826323 A 11
UTR
3'
7 PPP2R3A cr3 135865826 T 11
UTR
3'
7 PRKD3 cr2 37479023 A 11
UTR
3'
7 PRKD3 cr2 37478759 T 12
UTR
3'
7 PSEN1 cr14 73688298 T 13
UTR
3'
7 PTEN cr10 89725293 T 11
UTR
3'
7 RAB6A cr11 73387527 A 12
UTR
3'
7 RBM25 cr14 73587904 T 14
UTR
3'
7 RBM45 cr2 178994205 T 11
UTR
3'
7 RBMS1 cr2 161128989 T 13
UTR
3'
7 RCC2 cr1 17735285 A 14
UTR
3'
7 RELL1 cr4 37613352 A 12
UTR
3'
7 RORA cr15 60788653 A 12
UTR
3'
7 RSPO2 cr8 108912568 A 11
UTR
3'
7 SEC61G cr7 54819993 A 11
UTR
3'
7 SEPT7 cr7 35944036 T 11
UTR
3'
7 SLC35D1 cr1 67465371 A 13
UTR
3'
7 SMAD3 cr15 67486032 T 13
UTR
3'
7 SNAPC1 cr14 62262575 T 12
UTR
3'
7 SNRNP40 cr1 31732677 A 11
UTR
3'
7 SNX31 cr8 101585895 T 11
UTR
3'
7 SPIN1 cr9 91090830 A 12
UTR
3'
7 STX11 cr6 144511720 T 12
UTR

103
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
7 SUCNR1 cr3 151599651 A 14
UTR
3'
7 SUMO2 cr17 73164055 T 12
UTR
3'
7 TACC1 cr8 38705639 A 11
UTR
3'
7 TAF4B cr18 23971326 A 13
UTR
3'
7 TBC1D24 cr16 2553486 A 13
UTR
3'
7 TMC1 cr9 75451136 T 15
UTR
3'
7 TMTC3 cr12 88591979 T 13
UTR
3'
7 TOB2 cr22 41832049 A 12
UTR
3'
7 TRA2A cr7 23544783 A 11
UTR
3'
7 TRIM66 cr11 8637072 T 13
UTR
3'
7 TRIM66 cr11 8635430 A 9
UTR
3'
7 TTBK2 cr15 43037302 A 12
UTR
3'
7 UBA6 cr4 68481877 T 12
UTR
3'
7 UBE2W cr8 74703502 A 14
UTR
3'
7 USP44 cr12 95911789 A 11
UTR
3'
7 USP9X crX 41093298 T 15
UTR
3'
7 VGLL4 cr3 11599949 T 13
UTR
3'
7 VPS26A cr10 70931260 T 11
UTR
3'
7 WHSC1L1 cr8 38175279 A 11
UTR
3'
7 WSB1 crl7 25640280 T 15
UTR
3'
7 WWP1 cr8 87479625 A 13
UTR
3'
7 ZBTB3 cr11 62519422 A 12
UTR
3'
7 ZDHHC9 crX 128939304 T 13
UTR
3'
7 ZNF185 crX 152140995 C 10
UTR

104
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
7 ZNF217 cr20 52185289 A 13
UTR
3'
7 ZNF238 cr1 244220229 T 10
UTR
3'
7 ZNF264 cr19 57730525 A 14
UTR
3'
7 ZNF281 cr1 200375822 T 12
UTR
3'
7 ZNF549 cr19 58050715 T 14
UTR
3'
7 ZNF740 cr12 53582896 T 11
UTR
3'
6 ACTR2 cr2 65498035 A 12
UTR
3'
6 ACVR1C cr2 158387581 T 14
UTR
3'
6 AES cr19 3053066 T 13
UTR
3'
6 AJAP1 cr1 4843660 T 11
UTR
3'
6 ALDH8A1 cr6 135238907 T 10
UTR
3'
6 ANKRD28 cr3 15709862 T 13
UTR
3'
6 ANP32B cr9 100777784 A 14
UTR
3'
6 APPBP2 cr17 58524281 A 12
UTR
3'
6 ARAP2 cr4 36068192 A 12
UTR
3'
6 ARHGAP17 cr16 24930800 A 14
UTR
3'
6 ARHGAP5 cr14 32627034 T 11
UTR
3'
6 ARID4A cr14 58840119 T 10
UTR
3'
6 ARL4C cr2 235403511 A 11
UTR
3'
6 ARL5B cr10 18964315 T 11
UTR
3'
6 ATRX crX 76763679 A 13
UTR
3'
6 ATXN7 cr3 63987679 A 15
UTR
3'
6 BCL7A cr12 122498799 A 12
UTR
3'
6 BMPR1B cr4 96077805 A 12
UTR

105
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
6 BRAP cr12 112080129 T 12
UTR
3'
6 C14orf104 cr14 50092077 A 13
UTR
3'
6 C3orf62 cr3 49308391 A 11
UTR
3'
6 C3orf72 cr3 138671354 T 13
UTR
3'
6 C4orf49 cr4 140187661 T 11
UTR
3'
6 C5orf42 cr5 37107311 T 11
UTR
3'
6 C6orf145 cr6 3723315 A 11
UTR
3'
6 CACNB4 cr2 152694131 T 11
UTR
3'
6 CADPS cr3 62384481 T 10
UTR
3'
6 CALN1 cr7 71249416 T 10
UTR
3'
6 CAMKK2 cr12 121676365 A 11
UTR
3'
6 CANX cr5 179155907 T 12
UTR
3'
6 CCDC89 cr11 85395559 T 10
UTR
3'
6 CCDC93 cr2 118675891 A 11
UTR
3'
6 CCND2 cr12 4411082 T 11
UTR
3'
6 CCND2 cr12 4410638 T 16
UTR
3'
6 CD36 cr7 80306123 T 12
UTR
3'
6 CDC73 cr1 193220974 T 12
UTR
3'
6 CDK2 cr12 56366445 A 11
UTR
3'
6 CDK4 cr12 58142004 A 14
UTR
3'
6 CHMP2B cr3 87303064 A 14
UTR
3'
6 CISD1 cr10 60048285 T 11
UTR
3'
6 COIL cr17 55016354 A 14
UTR
3'
6 COPS7A cr12 6840953 A 11
UTR

106
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
6 COX18 cr4 73923142 A 12
UTR
3'
6 CSMD2 cr1 33979967 T 12
UTR
3'
6 CSNK1E cr22 38686864 A 11
UTR
3'
6 CSNK1E cr22 38686807 T 12
UTR
3'
6 DCBLD2 cr3 98516119 A 13
UTR
3'
6 DCP2 cr5 112351058 T 11
UTR
3'
6 DENND5B cr12 31535650 T 12
UTR
3'
6 DIEXF cr1 210026704 T 15
UTR
3'
6 DNAJA2 cr16 46989766 T 10
UTR
3'
6 DSC3 cr18 28573880 A 12
UTR
3'
6 DTNA cr18 32446839 T 12
UTR
3'
6 DUSP9 crX 152916312 T 12
UTR
3'
6 DUT cr15 48634319 A 15
UTR
3'
6 EDA2R crX 65815870 A 13
UTR
3'
6 EFNA5 cr5 106714693 A 12
UTR
3'
6 EHD4 cr15 42191704 A 12
UTR
3'
6 ELTD1 cr1 79356149 T 11
UTR
3'
6 EMCN cr4 101318099 T 12
UTR
3'
6 EPB41L1 cr20 34818694 T 14
UTR
3'
6 EPHA4 cr2 222290623 T 11
UTR
3'
6 ERBB4 cr2 212247967 A 18
UTR
3'
6 ERGIC2 cr12 29493722 T 11
UTR
3'
6 ESRP1 cr8 95719492 A 11
UTR
3'
6 FAM103A1 cr15 83659295 T 14
UTR

107
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
6 FAM116A cr3 57611367 A 11
UTR
3'
6 FAM120A cr9 96327976 A 13
UTR
3'
6 FAM46A cr6 82458103 A 13
UTR
3'
6 FAM46C cr1 118167727 T 12
UTR
3'
6 FAM60A cr12 31435608 T 11
UTR
3'
6 FAM60A cr12 31435556 A 10
UTR
3'
6 FBLN7 cr2 112945284 T 11
UTR
3'
6 FGF9 cr13 22277774 T 10
UTR
3'
6 FOXL2 cr3 138663653 T 13
UTR
3'
6 FOXN3 cr14 89622979 T 13
UTR
3'
6 GLI3 cr7 42001569 A 11
UTR
3'
6 GNRHR cr4 68604166 A 12
UTR
3'
6 GOLGA7B cr10 99627458 T 14
UTR
3'
6 GPAM cr10 113910871 T 12
UTR
3'
6 GRIN2A cr16 9849712 A 11
UTR
3'
6 H3F3C cr12 31944217 T 12
UTR
3'
6 HAS2 cr8 122625936 A 12
UTR
3'
6 HIP1 cr7 75166838 A 11
UTR
3'
6 HMGCS1 cr5 43290194 A 16
UTR
3'
6 HN1L cr16 1751589 T 11
UTR
3'
6 HNRNPA3 cr2 178088002 T 10
UTR
3'
6 HNRNPK cr9 86583189 T 12
UTR
3'
6 HS3ST1 cr4 11400430 T 13
UTR
3'
6 HSPC159 cr2 64687147 T 16
UTR

108
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
6 HUS1B cr6 656079 A 10
UTR
3'
6 IGF2BP1 cr17 47129195 T 12
UTR
3'
6 IL33 cr9 6256984 T 12
UTR
3'
6 IQGAP1 cr15 91044621 A 14
UTR
3'
6 IRF2BP2 cr1 234742204 A 13
UTR
3'
6 KCNJ2 cr17 68175917 A 10
UTR
3'
6 KCTD9 cr8 25286171 A 12
UTR
3'
6 KDM5A cr12 389523 T 11
UTR
3'
6 KHDRBS1 cr1 32508883 A 11
UTR
3'
6 KIAA1671 cr22 25592399 T 12
UTR
3'
6 KIF3A cr5 132029672 A 14
UTR
3'
6 KLF9 cr9 73002115 T 11
UTR
3'
6 LACE1 cr6 108844116 T 11
UTR
3'
6 LANCL1 cr2 211297865 T 9
UTR
3'
6 LDB3 cr10 88495759 T 11
UTR
3'
6 LHFPL4 cr3 9543422 A 13
UTR
3'
6 LPHN3 cr4 62936763 T 12
UTR
3'
6 LRCH1 cr13 47325657 A 10
UTR
3'
6 LRIG2 cr1 113667282 T 11
UTR
3'
6 LRRC4 cr7 127668232 T 9
UTR
3'
6 LRRN3 cr7 110764988 A 13
UTR
3'
6 LSM14A cr19 34718607 T 12
UTR
3'
6 LYPLA1 cr8 54959960 T 12
UTR
3'
6 MAGEB3 crX 30255422 A 11
UTR

109
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
6 MAK16 cr8 33357516 T 11
UTR
3'
6 MAP3K5 cr6 136878751 T 14
UTR
3'
6 MDM2 cr12 69236873 T 13
UTR
3'
6 MED1 cr17 37561712 T 13
UTR
3'
6 MESDC1 cr15 81296262 T 9
UTR
3'
6 MESDC1 cr15 81296129 T 12
UTR
3'
6 METTL21B cr12 58175145 T 15
UTR
3'
6 MKLN1 cr7 131175980 A 10
UTR
3'
6 MLL5 cr7 104754047 T 14
UTR
3'
6 MRE11A cr11 94151547 T 13
UTR
3'
6 MTF2 cr1 93602675 A 14
UTR
3'
6 MTMR9 cr8 11185354 A 10
UTR
3'
6 NAA35 cr9 88637203 A 10
UTR
3'
6 NAALAD2 cr11 89925062 T 10
UTR
3'
6 NAF1 cr4 164049985 A 11
UTR
3'
6 NANP cr20 25595951 A 13
UTR
3'
6 NANP cr20 25595618 A 11
UTR
3'
6 NEDD1 cr12 97346987 A 13
UTR
3'
6 NHLH1 cr1 160341680 A 11
UTR
3'
6 NPAS3 cr14 34271068 A 12
UTR
3'
6 NUS1 cr6 118029805 T 11
UTR
3'
6 OXSR1 cr3 38296209 T 12
UTR
3'
6 PAPD5 cr16 50264031 A 13
UTR
3'
6 PCDH9 cr13 66878392 A 26
UTR

110
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
6 PCGF3 cr4 761102 T 11
UTR
3'
6 PCGF5 cr10 93043932 T 11
UTR
3'
6 PEG3 crl9 57323786 T 13
UTR
3'
6 PHF6 crX 133561520 T 10
UTR
3'
6 PLCH1 cr3 155197737 A 12
UTR
3'
6 PM20D2 cr6 89874860 T 11
UTR
3'
6 PMEPA1 cr20 56226891 T 11
UTR
3'
6 POGZ cr1 151377008 A 13
UTR
3'
6 POLR2D cr2 128604217 A 15
UTR
3'
6 POMT2 cr14 77741349 T 11
UTR
3'
6 POU2F2 cr19 42595246 T 17
UTR
3'
6 POU2F2 cr19 42594356 T 13
UTR
3'
6 PPM1A cr14 60761433 T 10
UTR
3'
6 PPP2R3A cr3 135865709 A 14
UTR
3'
6 PRCC cr1 156770552 T 12
UTR
3'
6 PROK2 cr3 71821522 A 14
UTR
3'
6 PRPF40A cr2 153512044 T 15
UTR
3'
6 PTP4A1 cr6 64290633 T 15
UTR
3'
6 PURB cr7 44920830 A 9
UTR
3'
6 RAP2A cr13 98118463 A 14
UTR
3'
6 RASSF3 cr12 65088985 T 11
UTR
3'
6 RBM12B cr8 94745437 A 11
UTR
3'
6 RBM24 cr6 17292448 A 11
UTR
3'
6 RBM33 cr7 155569742 T 13
UTR

111
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
6 RGS16 cr1 182569291 T 26
UTR
3'
6 RIMKLB cr12 8926680 T 11
UTR
3'
6 RPIA cr2 89049874 A 12
UTR
3'
6 RSPO2 cr8 108911856 A 10
UTR
3'
6 RUNDC3B cr7 87460421 T 12
UTR
3'
6 RUNX1T1 cr8 92972022 T 12
UTR
3'
6 RYR3 cr15 34157541 A 10
UTR
3'
6 SAMD5 cr6 147887423 T 12
UTR
3'
6 SATB2 cr2 200136194 T 12
UTR
3'
6 SCD5 cr4 83552278 A 11
UTR
3'
6 SCML4 cr6 108025850 T 13
UTR
3'
6 SEC24A cr5 134063499 A 14
UTR
3'
6 SEMA4D cr9 91992883 A 13
UTR
3'
6 SEMA6A cr5 115781801 T 10
UTR
3'
6 SENP1 cr12 48436768 T 11
UTR
3'
6 SETX cr9 135139195 T 11
UTR
3'
6 SFXN2 cr10 104498056 T 14
UTR
3'
6 SGK196 cr8 42978200 T 13
UTR
3'
6 SH3BP5 cr3 15297082 T 13
UTR
3'
6 SH3RF1 cr4 170017405 A 14
UTR
3'
6 SH3RF1 cr4 170016066 A 11
UTR
3'
6 SLAIN2 cr4 48426783 A 11
UTR
3'
6 SLC16A7 cr12 60173983 A 11
UTR
3'
6 SLC2A3 cr12 8072022 T 13
UTR

112
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
6 SLC30A7 cr1 101446221 T 11
UTR
3'
6 SLITRK3 cr3 164905648 A 11
UTR
3'
6 SNX27 cr1 151666826 T 11
UTR
3'
6 SOCS4 cr14 55512747 T 10
UTR
3'
6 SOX4 cr6 21597192 A 11
UTR
3'
6 SOX6 cr11 15988219 A 11
UTR
3'
6 SPTB cr14 65213610 A 13
UTR
3'
6 SRC cr20 36033633 T 13
UTR
3'
6 ST7L cr1 113067470 A 10
UTR
3'
6 STARD7 cr2 96851899 A 14
UTR
3'
6 STXBP5 cr6 147708451 A 10
UTR
3'
6 SULF2 cr20 46286320 A 10
UTR
3'
6 SYK cr9 93658485 A 12
UTR
3'
6 TAF4B cr18 23971176 A 14
UTR
3'
6 TBC1D22B cr6 37299299 T 12
UTR
3'
6 TFAP2C cr20 55213320 T 11
UTR
3'
6 TGIF2 cr20 35220571 A 14
UTR
3'
6 THAP1 cr8 42692467 A 12
UTR
3'
6 TIGD6 cr5 149373143 T 13
UTR
3'
6 TMC7 cr16 19073947 A 10
UTR
3'
6 TMEM106B cr7 12273303 A 13
UTR
3'
6 TMEM14B cr6 10756863 A 11
UTR
3'
6 TMEM33 cr4 41959614 T 14
UTR
3'
6 TMEM57 cr1 25825931 T 13
UTR

113
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
6 TNFAIP3 cr6 138204003 A 12
UTR
3'
6 TNRC6B cr22 40723852 T 12
UTR
3'
6 TNRC6B cr22 40722031 A 10
UTR
3'
6 TNRC6B cr22 40719790 A 14
UTR
3'
6 TSGA10 cr2 99614595 A 13
UTR
3'
6 TTL cr2 113289264 A 11
UTR
3'
6 TTLL5 cr14 76420881 T 11
UTR
3'
6 UBE2M cr19 59067290 A 13
UTR
3'
6 UBXN7 cr3 196080741 T 11
UTR
3'
6 UFM1 cr13 38935214 T 11
UTR
3'
6 USP14 cr18 212029 A 9
UTR
3'
6 VCP cr9 35056078 T 12
UTR
3'
6 VEZF1 cr17 56049540 T 11
UTR
3'
6 WDR82 cr3 52289627 A 11
UTR
3'
6 XPO4 cr13 21356029 A 10
UTR
3'
6 ZBTB43 cr9 129596297 A 11
UTR
3'
6 ZBTB44 cr11 130102910 A 11
UTR
3'
6 ZCCHC5 crX 77911813 A 12
UTR
3'
6 ZFHX3 cr16 72820314 T 15
UTR
3'
6 ZIC5 cr13 100616014 A 11
UTR
3'
6 ZNF136 cr19 12299608 A 13
UTR
3'
6 ZNF2 cr2 95848209 T 11
UTR
3'
6 ZNF347 cr19 53643153 T 12
UTR
3'
6 ZNF407 cr18 72516095 T 11
UTR

114
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
6 ZNF563 cr19 12428823 T 15
UTR
3'
6 ZNF621 cr3 40575421 A 11
UTR
3'
6 ZNF704 cr8 81550824 A 12
UTR
3'
6 ZNF716 cr7 57529811 A 10
UTR
3'
6 ZNF737 cr19 20722094 A 14
UTR
3'
5 A1CF cr10 52566432 T 12
UTR
3'
5 ABHD2 cr15 89739843 T 10
UTR
3'
5 ABI1 cr10 27037487 A 11
UTR
3'
5 ADAP2 cr17 29285905 A 14
UTR
3'
5 ADCY9 cr16 4013843 A 11
UTR
3'
5 ADRBK2 cr22 26121915 A 11
UTR
3'
5 AKIRIN1 cr1 39471672 A 10
UTR
3'
5 ANAPC16 cr10 73993363 T 10
UTR
3'
5 ARID1B cr6 157530262 A 14
UTR
3'
5 ARL1 cr12 101787092 T 11
UTR
3'
5 ARL10 cr5 175800426 T 10
UTR
3'
5 ASB7 cr15 101191402 T 13
UTR
3'
5 ASB7 cr15 101189293 T 10
UTR
3'
5 ATF2 cr2 175939223 A 12
UTR
3'
5 ATP7A crX 77302385 A 11
UTR
3'
5 ATXN1 cr6 16300902 T 11
UTR
3'
5 BACE1 cr11 117159733 T 11
UTR
3'
5 BEND2 crX 18183097 A 15
UTR
3'
5 BOD1L cr4 13570453 A 11
UTR

115
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
5 Clorf9 cr1 172580460 T 9
UTR
3'
5 C2orf3 cr2 75890030 A 16
UTR
3'
5 C3orf58 cr3 143709141 T 11
UTR
3'
5 C5orf43 cr5 60453908 A 9
UTR
3'
5 C6orf47 cr6 31626580 A 14
UTR
3'
5 CACNB4 cr2 152695481 T 11
UTR
3'
5 CACNB4 cr2 152695178 T 12
UTR
3'
5 CALML4 cr15 68483096 A 12
UTR
3'
5 CAMTA1 cr1 7827963 A 10
UTR
3'
5 CASK crX 41377809 A 11
UTR
3'
5 CCDC43 cr17 42754916 T 13
UTR
3'
5 CCND1 cr11 69466273 A 10
UTR
3'
5 CCND2 cr12 4409520 T 10
UTR
3'
5 CD300LB cr17 72518440 A 11
UTR
3'
5 CDC25A cr3 48199852 T 12
UTR
3'
5 CDK19 cr6 110932988 A 12
UTR
3'
5 CELF2 cr10 11373567 A 11
UTR
3'
5 CELSR1 cr22 46756848 A 11
UTR
3'
5 CFL1 cr11 65622295 T 12
UTR
3'
5 CHM crX 85118100 T 13
UTR
3'
5 CLEC3A cr16 78065330 T 12
UTR
3'
5 CLN8 cr8 1729701 T 14
UTR
3'
5 COPS7B cr2 232673378 T 13
UTR
3'
5 COQ7 cr16 19089610 T 13
UTR

116
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
5 CPEB3 cr10 93809826 A 11
UTR
3'
5 CREB3L2 cr7 137563914 A 10
UTR
3'
5 CREB3L2 cr7 137559830 T 14
UTR
3'
5 CRTC1 cr19 18890267 T 14
UTR
3'
5 CTNND2 cr5 10972888 T 14
UTR
3'
5 DAG1 cr3 49571620 T 11
UTR
3'
5 DCUN1D5 cr11 102930486 G 7
UTR
3'
5 DDHD1 cr14 53513439 A 12
UTR
3'
5 DIXDC1 cr11 111892703 A 18
UTR
3'
5 DLG3 crX 69722274 T 13
UTR
3'
5 DLGAP2 cr8 1653883 T 11
UTR
3'
5 DNAJC27 cr2 25167221 T 14
UTR
3'
5 DNMT3B cr20 31395997 T 11
UTR
3'
5 DPP8 cr15 65738042 A 11
UTR
3'
5 DSEL cr18 65174583 A 26
UTR
3'
5 DUSP10 cr1 221875661 A 11
UTR
3'
5 DUSP10 cr1 221874929 A 16
UTR
3'
5 EGR1 cr5 137804475 T 15
UTR
3'
5 EGR3 cr8 22545637 T 11
UTR
3'
5 EIF2S1 cr14 67851084 T 13
UTR
3'
5 EIF5A2 cr3 170607962 A 11
UTR
3'
5 ENTPD1 cr10 97628618 A 10
UTR
3'
5 ENTPD4 cr8 23289680 A 11
UTR
3'
5 EP300 cr22 41575537 A 15
UTR

117
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
5 EPM2AIP1 cr3 37030780 T 11
UTR
3'
5 ERBB2IP cr5 65376306 A 11
UTR
3'
5 EVI5 cr1 92977467 T 11
UTR
3'
5 EXOSC2 cr9 133579920 A 11
UTR
3'
5 EYA1 cr8 72110673 A 12
UTR
3'
5 FAM118A cr22 45736689 T 11
UTR
3'
5 FAM122A cr9 71396662 T 11
UTR
3'
5 FAM168B cr2 131805979 G 9
UTR
3'
5 FAM169A cr5 74075446 T 12
UTR
3'
5 FAM178A cr10 102724795 T 14
UTR
3'
5 FAM91A1 cr8 124826583 T 12
UTR
3'
5 FBRSL1 cr12 133160562 A 9
UTR
3'
5 FBXO21 cr12 117582872 T 15
UTR
3'
5 FGF12 cr3 191861010 A 16
UTR
3'
5 FOXC1 cr6 1612419 A 12
UTR
3'
5 FOXN2 cr2 48604358 T 10
UTR
3'
5 FOXO3 cr6 109005013 A 11
UTR
3'
5 FOXP1 cr3 71007140 T 11
UTR
3'
5 FRMD4A cr10 13686797 A 12
UTR
3'
5 FRYL cr4 48500088 T 15
UTR
3'
5 FXR1 cr3 180694863 T 14
UTR
3'
5 GABRB2 cr5 160717254 T 12
UTR
3'
5 GAL cr11 68458592 T 12
UTR
3'
5 GALNT7 cr4 174244278 A 13
UTR

118
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
5 GBP6 cr1 89851722 A 13
UTR
3'
5 GDA cr9 74866560 T 12
UTR
3'
5 GLS cr2 191828629 T 12
UTR
3'
5 GNAI2 cr3 50296405 C 9
UTR
3'
5 GNB1 cr1 1717242 T 12
UTR
3'
5 GPC3 crX 132670054 A 13
UTR
3'
5 GPR137B cr1 236372038 T 10
UTR
3'
5 GPR4 cr19 46093443 A 11
UTR
3'
5 GRSF1 cr4 71686216 A 11
UTR
3'
5 GSR cr8 30536666 A 19
UTR
3'
5 GTF3C1 cr16 27471985 T 11
UTR
3'
5 H3F3B cr17 73774199 T 13
UTR
3'
5 HAS2 cr8 122625490 T 10
UTR
3'
5 HDAC4 cr2 239974109 A 9
UTR
3'
5 HELZ cr17 65073603 A 11
UTR
3'
5 HERPUD2 cr7 35672678 T 14
UTR
3'
5 HEXA cr15 72636197 T 10
UTR
3'
5 HIATL1 cr9 97221877 T 11
UTR
3'
5 HIPK1 cr1 114519857 T 14
UTR
3'
5 HIPK2 cr7 139257355 T 11
UTR
3'
5 HIPK2 cr7 139250450 T 11
UTR
3'
5 HNRNPUL1 cr19 41812943 A 12
UTR
3'
5 HS3ST5 cr6 114378233 T 12
UTR
3'
5 HYOU1 cr11 118915072 A 16
UTR

119
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
5 IFNGR1 cr6 137518966 A 14
UTR
3'
5 IGF1 cr12 102790566 T 13
UTR
3'
5 ILF3 cr19 10796313 T 10
UTR
3'
5 IPCEF1 cr6 154476149 A 12
UTR
3'
5 KCTD6 cr3 58487415 T 11
UTR
3'
5 KCTD7 cr7 66105589 T 11
UTR
3'
5 KDM5A cr12 393804 T 11
UTR
3'
5 KHNYN cr14 24908391 T 11
UTR
3'
5 KHSRP cr19 6413217 A 13
UTR
3'
5 KIAA0825 cr5 93489194 T 8
UTR
3'
5 KIAA1267 cr17 44107956 A 14
UTR
3'
5 KIF5C cr2 149879665 T 10
UTR
3'
5 KLHDC5 cr12 27954136 T 13
UTR
3'
5 KLHL24 cr3 183400567 T 10
UTR
3'
5 KLHL28 cr14 45398006 T 11
UTR
3'
5 LDHAL6A cr11 18500557 T 12
UTR
3'
5 LENG8 cr19 54972801 T 9
UTR
3'
5 LILRB3 cr19 54720558 T 11
UTR
3'
5 LMO4 cr1 87813143 A 11
UTR
3'
5 LONRF2 cr2 100898347 T 12
UTR
3'
5 LRP6 cr12 12272288 A 12
UTR
3'
5 MAGI1 cr3 65340577 T 11
UTR
3'
5 MAK cr6 10764372 T 9
UTR
3'
5 MAL cr2 95719330 A 10
UTR

120
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
5 MAL2 cr8 120256100 A 8
UTR
3'
5 MAP1B cr5 71504719 T 11
UTR
3'
5 MAP3K13 cr3 185200599 A 11
UTR
3'
5 MAPK1 cr22 22114660 T 12
UTR
3'
5 MAPK1IP1L cr14 55532698 A 11
UTR
3'
5 MED1 cr17 37562164 T 11
UTR
3'
5 MED13 cr17 60022040 A 11
UTR
3'
5 MEIS2 cr15 37183446 T 10
UTR
3'
5 MGAT4A cr2 99235842 A 11
UTR
3'
5 MID1IP1 crX 38664817 T 13
UTR
3'
5 MLL2 cr12 49413580 A 12
UTR
3'
5 MS4A7 cr11 60161438 A 12
UTR
3'
5 MTDH cr8 98740104 A 10
UTR
3'
5 NAP1L4 cr11 2966276 A 15
UTR
3'
5 NEGR1 cr1 71869847 T 11
UTR
3'
5 NFIB cr9 14082667 T 12
UTR
3'
5 NIPAL3 cr1 24799398 A 12
UTR
3'
5 NPNT cr4 106892254 T 13
UTR
3'
5 NR2F2 cr15 96881909 T 10
UTR
3'
5 NR2F2 cr15 96881216 T 10
UTR
3'
5 NRXN1 cr2 50146697 A 11
UTR
3'
5 NTM cr11 132205623 T 14
UTR
3'
5 NTRK2 cr9 87487518 T 11
UTR
3'
5 NUCKS1 cr1 205683626 A 10
UTR

121
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
5 ORAI3 cr16 30965549 T 15
UTR
3'
5 OTUD1 cr10 23730496 T 10
UTR
3'
5 PALM2 cr9 112708967 A 25
UTR
3'
5 PAPSS2 cr10 89507276 A 11
UTR
3'
5 PDP2 cr16 66920308 T 10
UTR
3'
5 PHF17 cr4 129783593 T 13
UTR
3'
5 PID1 cr2 229889188 A 9
UTR
3'
5 PIGM cr1 159998798 T 11
UTR
3'
5 PIGN cr18 59712451 A 11
UTR
3'
5 PIK3R1 cr5 67594399 A 12
UTR
3'
5 PLAA cr9 26904508 T 10
UTR
3'
5 PLAGL2 cr20 30781644 A 11
UTR
3'
5 PLXNA4 cr7 131809795 A 13
UTR
3'
5 PNPLA3 cr22 44342941 A 13
UTR
3'
5 POLR3B cr12 106903452 A 9
UTR
3'
5 PRKCQ cr10 6469109 T 13
UTR
3'
5 PRKDC cr8 48685753 A 11
UTR
3'
5 PRKX crX 3525721 T 9
UTR
3'
5 PRPF4 cr9 116054493 A 14
UTR
3'
5 PRR23A cr3 138723892 A 9
UTR
3'
5 PRR3 cr6 30531427 T 16
UTR
3'
5 PSMD11 cr17 30807996 A 11
UTR
3'
5 PTAFR cr1 28475836 T 27
UTR
3'
5 PTPN11 cr12 112944240 T 12
UTR

122
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
5 RAB11FIP2 cr10 119766958 A 12
UTR
3'
5 RAD51L1 cr14 68964202 T 12
UTR
3'
5 RB1CC1 cr8 53536112 A 11
UTR
3'
5 RBM25 cr14 73586613 T 12
UTR
3'
5 RBMS3 cr3 30046424 A 11
UTR
3'
5 RC3H1 cr1 173901043 T 11
UTR
3'
5 RDH10 cr8 74236678 T 10
UTR
3'
5 RECK cr9 36123172 T 11
UTR
3'
5 REPS2 crX 17169995 T 13
UTR
3'
5 RHOQ cr2 46809063 T 12
UTR
3'
5 RNF10 cr12 121014987 T 11
UTR
3'
5 RNF149 cr2 101893233 A 10
UTR
3'
5 RNF2 cr1 185070964 T 22
UTR
3'
5 RNLS cr10 90034667 A 11
UTR
3'
5 RRM2B cr8 103216874 A 9
UTR
3'
5 RS1 crX 18659977 A 13
UTR
3'
5 RXRA cr9 137331937 A 12
UTR
3'
5 RYBP cr3 72424549 T 9
UTR
3'
5 SAMD10 cr20 62605493 T 12
UTR
3'
5 SAR1A cr10 71911798 A 12
UTR
3'
5 SASS6 cr1 100549698 A 16
UTR
3'
5 SCAF11 cr12 46314390 A 13
UTR
3'
5 SEC31A cr4 83740163 T 11
UTR
3'
5 SENP1 cr12 48437910 T 11
UTR

123
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
5 SENP5 cr3 196658083 A 10
UTR
3'
5 SERBP1 cr1 67878789 T 11
UTR
3'
5 SFPQ cr1 35649754 A 13
UTR
3'
5 SGCD cr5 156190730 A 12
UTR
3'
5 SGK223 cr8 8175297 T 12
UTR
3'
5 SLC12A2 cr5 127523981 T 24
UTR
3'
5 SLC16A6 cr17 66265042 A 11
UTR
3'
5 SLC30A5 cr5 68399959 T 11
UTR
3'
5 SLC35B4 cr7 133977008 T 10
UTR
3'
5 SLC44A5 cr1 75668544 A 11
UTR
3'
5 SLC7A11 cr4 139092374 A 11
UTR
3'
5 SLC9A2 cr2 103326258 T 10
UTR
3'
5 SLMAP cr3 57913669 T 13
UTR
3'
5 SMAD4 cr18 48609102 T 12
UTR
3'
5 SMAD4 cr18 48606335 T 14
UTR
3'
5 SMARCC2 cr12 56556167 A 14
UTR
3'
5 SMEK1 cr14 91924528 A 11
UTR
3'
5 SMG1 cr16 18819070 T 11
UTR
3'
5 SMU1 cr9 33047210 A 14
UTR
3'
5 SMU1 cr9 33046890 A 15
UTR
3'
5 SNAPC1 cr14 62262433 A 11
UTR
3'
5 SORCS1 cr10 108333635 A 11
UTR
3'
5 SOX4 cr6 21596500 A 12
UTR
3'
5 SPOCK1 cr5 136313113 A 11
UTR

124
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
5 SSBP3 cr1 54692319 T 12
UTR
3'
5 STX1B cr16 31000674 G 8
UTR
3'
5 TARDBP cr1 11084333 T 11
UTR
3'
5 TBC1D1 cr4 38140081 A 10
UTR
3'
5 TBC1D5 cr3 17201870 T 11
UTR
3'
5 TBL1XR1 cr3 176741889 A 13
UTR
3'
5 TBP cr6 170881389 T 13
UTR
3'
5 TCERG1 cr5 145890609 T 12
UTR
3'
5 TFAP2A cr6 10397893 A 11
UTR
3'
5 TLE3 cr15 70340967 A 11
UTR
3'
5 TMEM108 cr3 133116233 A 14
UTR
3'
5 TMEM161B cr5 87491917 T 10
UTR
3'
5 TMEM178 cr2 39944921 T 13
UTR
3'
5 TMEM209 cr7 129805893 A 12
UTR
3'
5 TMEM26 cr10 63166725 A 12
UTR
3'
5 TMEM47 crX 34646666 T 12
UTR
3'
5 TMTC3 cr12 88590177 T 12
UTR
3'
5 TNFAIP1 cr17 26672324 A 10
UTR
3'
5 TNRC6B cr22 40731027 T 10
UTR
3'
5 TNRC6B cr22 40720294 T 15
UTR
3'
5 TNRC6C cr17 76101834 T 9
UTR
3'
5 TOB1 cr17 48940256 A 11
UTR
3'
5 TOMM20 cr1 235275027 T 12
UTR
3'
5 TPH1 cr11 18042321 A 11
UTR

125
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
5 TRPS1 cr8 116424407 A 12
UTR
3'
5 TRPS1 cr8 116423510 A 12
UTR
3'
5 TSPAN14 cr10 82279557 T 14
UTR
3'
5 TSR2 crX 54471045 T 10
UTR
3'
5 UACA cr15 70946988 A 12
UTR
3'
5 UGT2B28 cr4 70160632 A 11
UTR
3'
5 USP28 cr11 113669136 A 11
UTR
3'
5 WASL cr7 123323428 A 12
UTR
3'
5 WDFY1 cr2 224742022 T 12
UTR
3'
5 WIF1 cr12 65444595 T 13
UTR
3'
5 XYLT1 cr16 17199775 A 11
UTR
3'
5 ZNF238 cr1 244219573 A 9
UTR
3'
5 ZNF430 cr19 21241252 A 14
UTR
3'
5 ZNF521 cr18 22642386 T 13
UTR
3'
5 ZNF536 cr19 31048941 A 11
UTR
3'
5 ZNF652 cr17 47369576 T 11
UTR
3'
5 ZNF737 cr19 20723566 A 11
UTR
3'
5 ZNF80 cr3 113954690 A 12
UTR
3'
4 ACLY cr17 40023617 A 13
UTR
3'
4 ACOX1 cr17 73941869 A 10
UTR
3'
4 ADSS cr1 244571936 T 10
UTR
3'
4 AFTPH cr2 64819249 A 20
UTR
3'
4 AICDA cr12 8755425 T 16
UTR
3'
4 AK4 cr1 65692499 T 11
UTR

126
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
4 ANKIB1 cr7 92028647 A 15
UTR
3'
4 ANKRD40 cr17 48770711 A 10
UTR
3'
4 ANXA11 cr10 81915055 T 9
UTR
3'
4 AP1AR cr4 113190822 A 11
UTR
3'
4 APOL1 cr22 36662141 T 12
UTR
3'
4 ARF5 cr7 127231635 T 10
UTR
3'
4 ARHGAP28 cr18 6914974 A 10
UTR
3'
4 ARID1B cr6 157529243 T 10
UTR
3'
4 ARPP19 cr15 52841555 A 10
UTR
3'
4 ATP2B1 cr12 89984601 T 12
UTR
3'
4 ATP9A cr20 50214427 A 10
UTR
3'
4 ATXN1 cr6 16301824 A 13
UTR
3'
4 ATXN7 cr3 63985894 T 11
UTR
3'
4 B3GNT7 cr2 232264806 T 26
UTR
3'
4 BAG1 cr9 33253979 T 12
UTR
3'
4 BBX cr3 107529758 T 12
UTR
3'
4 BCL11A cr2 60685736 T 13
UTR
3'
4 BCL7A cr12 122499827 T 14
UTR
3'
4 BCL7A cr12 122498867 A 11
UTR
3'
4 BCLAF1 cr6 136581674 T 11
UTR
3'
4 BIN1 cr2 127805622 T 10
UTR
3'
4 BMPR2 cr2 203426176 T 8
UTR
3'
4 BNIP3L cr8 26268445 A 10
UTR
3'
4 BTBD11 cr12 108052115 T 12
UTR

127
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
4 BTBD7 cr14 93708432 A 12
UTR
3'
4 C12orf12 cr12 91346439 A 11
UTR
3'
4 C12orf5 cr12 4463524 T 10
UTR
3'
4 C14orf37 cr14 58471378 T 11
UTR
3'
4 C16orf53 cr16 29833642 A 13
UTR
3'
4 C17orf96 cr17 36829265 T 8
UTR
3'
4 C20orf12 cr20 18364708 T 12
UTR
3'
4 C2orf29 cr2 101886538 T 12
UTR
3'
4 C2orf67 cr2 210886727 T 14
UTR
3'
4 C6orf47 cr6 31626545 T 14
UTR
3'
4 C7orf46 cr7 23741876 T 11
UTR
3'
4 C9orf123 cr9 7797700 T 12
UTR
3'
4 CAMLG cr5 134086670 A 13
UTR
3'
4 CBFA2T2 cr20 32236969 T 11
UTR
3'
4 CBFB cr16 67133969 T 9
UTR
3'
4 CBL cr11 119175340 T 14
UTR
3'
4 CBLN1 cr16 49312880 A 10
UTR
3'
4 CCDC102B cr18 66722368 A 9
UTR
3'
4 CCND2 cr12 4411110 T 12
UTR
3'
4 CCNE2 cr8 95892992 A 11
UTR
3'
4 CDH1 cr16 68867611 T 12
UTR
3'
4 CELF2 cr10 11375889 A 10
UTR
3'
4 CEP68 cr2 65312945 A 12
UTR
3'
4 CGGBP1 cr3 88104472 T 10
UTR

128
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
4 CHD7 cr8 61778758 T 11
UTR
3'
4 CIT cr12 120123939 T 11
UTR
3'
4 CLCN5 crX 49862213 A 12
UTR
3'
4 CLIC5 cr6 45869504 T 10
UTR
3'
4 CLSPN cr1 36201819 A 17
UTR
3'
4 CNTN3 cr3 74312679 T 11
UTR
3'
4 COL19A1 cr6 70918737 T 12
UTR
3'
4 COPG cr3 128996444 T 19
UTR
3'
4 CORO2B cr15 69020046 T 10
UTR
3'
4 CPLX4 cr18 56963029 A 10
UTR
3'
4 CPSF2 cr14 92630061 T 9
UTR
3'
4 CTDSPL cr3 38025453 A 11
UTR
3'
4 CTNNB1 cr3 41281477 T 25
UTR
3'
4 CUL5 cr11 107975795 T 13
UTR
3'
4 CYB5B cr16 69499981 T 9
UTR
3'
4 DACH1 cr13 72014288 T 11
UTR
3'
4 DCAF10 cr9 37865073 T 12
UTR
3'
4 DCAF16 cr4 17804263 A 15
UTR
3'
4 DCP1A cr3 53321360 T 27
UTR
3'
4 DCUN1D1 cr3 182662347 A 12
UTR
3'
4 DCUN1D5 cr11 102928449 A 11
UTR
3'
4 DDAH1 cr1 85786201 A 12
UTR
3'
4 DDN cr12 49389156 A 11
UTR
3'
4 DDX5 cr17 62495664 A 10
UTR

129
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
4 DDX52 cr17 35974148 A 10
UTR
3'
4 DDX6 cr11 118622141 A 10
UTR
3'
4 DLGAP4 cr20 35156622 T 10
UTR
3'
4 DNAJB7 cr22 41256660 T 14
UTR
3'
4 DNAJB9 cr7 108213938 T 12
UTR
3'
4 DNAJC15 cr13 43681779 T 9
UTR
3'
4 DOPEY2 cr21 37666277 A 14
UTR
3'
4 DUSP4 cr8 29193728 T 10
UTR
3'
4 DYRK2 cr12 68055576 T 10
UTR
3'
4 DYRK2 cr12 68054141 A 11
UTR
3'
4 EBF1 cr5 158125829 A 12
UTR
3'
4 EDEM1 cr3 5260540 T 10
UTR
3'
4 EFNA5 cr5 106716350 A 11
UTR
3'
4 EFNA5 cr5 106716281 A 12
UTR
3'
4 EFNB1 crX 68061978 A 12
UTR
3'
4 EGFR cr7 55273591 A 13
UTR
3'
4 EIF2B2 cr14 75476004 A 10
UTR
3'
4 EIF4B cr12 53434572 T 12
UTR
3'
4 EIF4EBP2 cr10 72188037 A 11
UTR
3'
4 ELAVL3 cr19 11563289 T 12
UTR
3'
4 ENC1 cr5 73923281 A 13
UTR
3'
4 EPB41L5 cr2 120932994 T 14
UTR
3'
4 EPM2AIP1 cr3 37032033 A 10
UTR
3'
4 EPS15 cr1 51822219 A 12
UTR

130
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
4 ERCC6 cr10 50666628 A 13
UTR
3'
4 EVI5 cr1 92975050 T 14
UTR
3'
4 EXTL2 cr1 101338118 A 10
UTR
3'
4 FADS1 cr11 61569354 T 16
UTR
3'
4 FAF2 cr5 175935960 T 10
UTR
3'
4 FAM105A cr5 14611814 T 10
UTR
3'
4 FAM120C crX 54098998 A 12
UTR
3'
4 FAM13B cr5 137274915 A 11
UTR
3'
4 FAM164A cr8 79631105 T 10
UTR
3'
4 FAM189A1 cr15 29414906 G 8
UTR
3'
4 FAM46A cr6 82457992 T 10
UTR
3'
4 FAM76A cr1 28087457 T 17
UTR
3'
4 FAM8A1 cr6 17609273 T 11
UTR
3'
4 FANCD2 cr3 10143061 T 25
UTR
3'
4 FBXO21 cr12 117582899 T 11
UTR
3'
4 FBXO27 cr19 39514872 T 12
UTR
3'
4 FBXO36 cr2 230876985 A 11
UTR
3'
4 FCGR3A cr1 161512430 T 9
UTR
3'
4 FGD5 cr3 14976010 T 9
UTR
3'
4 FGF12 cr3 191859718 T 11
UTR
3'
4 FGFBP3 cr10 93667293 A 15
UTR
3'
4 FGFR1OP2 cr12 27118594 A 11
UTR
3'
4 FICD cr12 108913292 A 11
UTR
3'
4 FKBP2 cr11 64011554 A 10
UTR

131
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
4 FKBP5 cr6 35554624 T 12
UTR
3'
4 FOXN2 cr2 48603079 T 10
UTR
3'
4 FOXO3 cr6 109004889 A 16
UTR
3'
4 FPGT cr1 74672686 T 9
UTR
3'
4 G3BP1 cr5 151184779 T 11
UTR
3'
4 GABRA4 cr4 46923150 T 11
UTR
3'
4 GABRB1 cr4 47428211 A 10
UTR
3'
4 GABRB2 cr5 160719907 A 9
UTR
3'
4 GADL1 cr3 30769514 T 11
UTR
3'
4 GAL3ST4 cr7 99757342 A 13
UTR
3'
4 GALNT1 cr18 33290437 A 9
UTR
3'
4 GDAP2 cr1 118420019 T 11
UTR
3'
4 GDAP2 cr1 118411744 T 10
UTR
3'
4 GJC1 cr17 42876925 A 14
UTR
3'
4 GNAI2 cr3 50296330 A 12
UTR
3'
4 GPR12 cr13 27330332 T 10
UTR
3'
4 GRAMD2 cr15 72452633 A 10
UTR
3'
4 GRIA4 cr11 105783203 A 11
UTR
3'
4 GRIK2 cr6 102517011 T 11
UTR
3'
4 GRIN2A cr16 9851215 T 15
UTR
3'
4 GRIN3A cr9 104331901 A 9
UTR
3'
4 GXYLT1 cr12 42477780 A 10
UTR
3'
4 HBEGF cr5 139713520 T 11
UTR
3'
4 HBS1L cr6 135357535 A 10
UTR

132
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
4 HCCS crX 11140989 T 11
UTR
3'
4 HIF3A cr19 46843765 T 12
UTR
3'
4 HLCS cr21 38123320 A 11
UTR
3'
4 HNRNPA3 cr2 178088125 A 12
UTR
3'
4 HNRNPH2 crX 100668932 T 13
UTR
3'
4 HNRNPR cr1 23636874 T 11
UTR
3'
4 HNRNPU cr1 245014280 T 11
UTR
3'
4 HOOK3 cr8 42876247 A 29
UTR
3'
4 HSDL1 cr16 84155968 T 13
UTR
3'
4 HSPA9 cr5 137891047 A 13
UTR
3'
4 HTR2A cr13 47408902 T 11
UTR
3'
4 IGDCC4 cr15 65674432 A 12
UTR
3'
4 IGF1 cr12 102790988 A 11
UTR
3'
4 IKZF2 cr2 213869993 A 11
UTR
3'
4 IPO9 cr1 201847055 A 12
UTR
3'
4 IRGQ cr19 44094353 A 11
UTR
3'
4 KBTBD7 cr13 41766026 A 9
UTR
3'
4 KCNH3 cr12 49952059 A 12
UTR
3'
4 KCNK2 cr1 215408898 T 10
UTR
3'
4 KDELR2 cr7 6501817 A 10
UTR
3'
4 KDM5A cr12 393489 T 12
UTR
3'
4 KDM5A cr12 393295 T 11
UTR
3'
4 KDSR cr18 60998042 T 15
UTR
3'
4 KHSRP cr19 6413651 T 10
UTR

133
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
4 KIAA0494 cr1 47142711 T 9
UTR
3'
4 KIAA1267 cr17 44107738 A 9
UTR
3'
4 KIAA1324 cr1 109749368 T 11
UTR
3'
4 KIAA1324 cr1 109748644 T 11
UTR
3'
4 KIAA1586 cr6 56919727 T 12
UTR
3'
4 KIAA1737 cr14 77582032 T 14
UTR
3'
4 KIAA2026 cr9 5919249 T 11
UTR
3'
4 KIF1B cr1 10438932 T 10
UTR
3'
4 LATS2 cr13 21548562 T 13
UTR
3'
4 LATS2 cr13 21547830 A 9
UTR
3'
4 LBR cr1 225590887 A 10
UTR
3'
4 LCOR cr10 98715988 T 9
UTR
3'
4 LCORL cr4 17882781 T 11
UTR
3'
4 LHFP cr13 39917691 A 12
UTR
3'
4 LIN7C cr11 27517703 A 14
UTR
3'
4 LLGL1 cr17 18147555 T 14
UTR
3'
4 LMNB2 cr19 2428236 A 10
UTR
3'
4 LMO4 cr1 87811174 A 11
UTR
3'
4 LRRC27 cr10 134193076 T 9
UTR
3'
4 LTN1 cr21 30301899 T 10
UTR
3'
4 MAGEB18 crX 26158459 T 10
UTR
3'
4 MAP3K7 cr6 91225524 A 9
UTR
3'
4 MAP6 cr11 75316787 A 11
UTR
3'
4 MAP6 cr11 75315642 T 10
UTR

134
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
4 1/mrt cr4 164446860 T 9
UTR
3'
4 MAX cr14 65543065 A 10
UTR
3'
4 MCTS1 crX 119754487 A 14
UTR
3'
4 MDM2 cr12 69233886 T 11
UTR
3'
4 MED19 cr11 57471199 T 13
UTR
3'
4 METAP2 cr12 95908545 A 11
UTR
3'
4 MIER3 cr5 56216451 A 10
UTR
3'
4 MKL1 cr22 40806781 C 9
UTR
3'
4 MKLN1 cr7 131181200 T 10
UTR
3'
4 MKX cr10 27962805 A 10
UTR
3'
4 MMAA cr4 146578529 T 9
UTR
3'
4 MNT cr17 2287533 T 13
UTR
3'
4 MOBKL1A cr4 71853812 T 13
UTR
3'
4 MORC1 cr3 108677146 A 10
UTR
3'
4 MOSPD1 crX 134022551 A 9
UTR
3'
4 MSI1 cr12 120779455 A 14
UTR
3'
4 MTF1 cr1 38278949 A 11
UTR
3'
4 NCEH1 cr3 172349171 T 12
UTR
3'
4 NCOA3 cr20 46282984 T 11
UTR
3'
4 NCOA5 cr20 44689693 A 10
UTR
3'
4 NFIB cr9 14082769 A 14
UTR
3'
4 NKAIN2 cr6 125146684 T 9
UTR
3'
4 NMNAT1 cr1 10044969 T 8
UTR
3'
4 NPC2 cr14 74946724 A 10
UTR

135
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
4 NPNT cr4 106890724 T 10
UTR
3'
4 NPR3 cr5 32786465 T 11
UTR
3'
4 NR2F2 cr15 96882212 G 8
UTR
3'
4 NUFIP2 cr17 27584536 T 12
UTR
3'
4 OGFOD1 cr16 56510333 T 12
UTR
3'
4 ONECUT2 cr18 55144549 A 11
UTR
3'
4 OSBP cr11 59341900 T 12
UTR
3'
4 OSBP2 cr22 31302451 T 10
UTR
3'
4 OTUB2 cr14 94512841 A 11
UTR
3'
4 PABPC5 crX 90691818 T 9
UTR
3'
4 PAPOLA crl4 97033430 A 10
UTR
3'
4 PAPSS2 cr10 89506162 A 11
UTR
3'
4 PAQR7 cr1 26188503 A 31
UTR
3'
4 PCDHB3 cr5 140482943 T 10
UTR
3'
4 PCM1 cr8 17886665 A 26
UTR
3'
4 PCSK2 cr20 17463028 T 11
UTR
3'
4 PDE4D cr5 58266735 A 15
UTR
3'
4 PDPK1 cr16 2653089 T 11
UTR
3'
4 PELI2 cr14 56764821 T 11
UTR
3'
4 PGR cr11 100902321 T 15
UTR
3'
4 PHKB cr16 47734578 A 10
UTR
3'
4 PHLDA1 cr12 76421757 T 12
UTR
3'
4 PIGM cr1 159997525 A 10
UTR
3'
4 PIM1 cr6 37143155 T 11
UTR

136
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
4 PIM2 crX 48770831 A 20
UTR
3'
4 PKD2 cr4 88998190 A 11
UTR
3'
4 PKP4 cr2 159537312 T 10
UTR
3'
4 PLCB1 cr20 8863118 A 10
UTR
3'
4 PLEKHA6 cr1 204190022 A 13
UTR
3'
4 PNPT1 cr2 55861395 T 16
UTR
3'
4 POLH cr6 43586698 G 10
UTR
3'
4 POP1 cr8 99172000 A 12
UTR
3'
4 PPARGC1B cr5 149227267 A 14
UTR
3'
4 PPIC cr5 122359467 A 12
UTR
3'
4 PPP1R10 cr6 30568234 A 11
UTR
3'
4 PRDM1 cr6 106557171 T 10
UTR
3'
4 PRPF40A cr2 153509691 A 11
UTR
3'
4 PSMD5 cr9 123578376 A 10
UTR
3'
4 PTCD3 cr2 86366926 A 11
UTR
3'
4 PTPN18 cr2 131131908 T 14
UTR
3'
4 PTPRJ cr11 48189153 T 13
UTR
3'
4 RAB11FIP2 cr10 119766677 A 16
UTR
3'
4 RAB11FIP2 cr10 119765266 T 11
UTR
3'
4 RAB22A cr20 56941068 T 10
UTR
3'
4 RAB39B crX 154488466 T 11
UTR
3'
4 RAB8B cr15 63559206 T 12
UTR
3'
4 RALYL cr8 85833388 T 10
UTR
3'
4 RANBP10 cr16 67757024 T 10
UTR

137
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
4 RAP2B cr3 152883481 T 10
UTR
3'
4 RAP2B cr3 152883395 T 12
UTR
3'
4 RAPH1 cr2 204300244 A 12
UTR
3'
4 RBM12B cr8 94744118 T 11
UTR
3'
4 RBM15B cr3 51431679 T 11
UTR
3'
4 RBMS3 cr3 30045473 T 10
UTR
3'
4 RBMXL1 cr1 89446107 T 14
UTR
3'
4 RCOR3 cr1 211487676 T 10
UTR
3'
4 RDX cr11 110102325 A 10
UTR
3'
4 RGS18 cr1 192154126 T 8
UTR
3'
4 RGS6 cr14 73030606 A 11
UTR
3'
4 RNF41 cr12 56599353 G 10
UTR
3'
4 RP1 cr8 55543160 T 14
UTR
3'
4 RPL27A cr11 8711061 A 13
UTR
3'
4 RPP14 cr3 58304719 A 14
UTR
3'
4 RPRD2 cr1 150447772 T 10
UTR
3'
4 RPRD2 cr1 150446032 A 23
UTR
3'
4 RPS6KA2 cr6 166824706 T 13
UTR
3'
4 RPS6KB1 cr17 58024908 A 10
UTR
3'
4 RRAGD cr6 90077647 T 12
UTR
3'
4 RRM2 cr2 10269544 T 10
UTR
3'
4 RRP15 cr1 218506526 A 10
UTR
3'
4 RTF1 cr15 41775015 T 10
UTR
3'
4 RUFY3 cr4 71655520 A 12
UTR

138
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
4 RUNDC3B cr7 87459581 A 13
UTR
3'
4 SAR1A cr10 71910315 A 10
UTR
3'
4 SATB2 cr2 200135086 T 10
UTR
3'
4 SCAI cr9 127706579 T 16
UTR
3'
4 SCUBE3 cr6 35216591 A 10
UTR
3'
4 SDC4 cr20 43955023 A 24
UTR
3'
4 SDC4 cr20 43954848 A 9
UTR
3'
4 SELT cr3 150345688 T 10
UTR
3'
4 SENP5 cr3 196660478 T 11
UTR
3'
4 SERPINE1 cr7 100781987 G 8
UTR
3'
4 SFXN1 cr5 174954918 T 22
UTR
3'
4 SGK3 cr8 67772690 A 11
UTR
3'
4 SHANK2 cr11 70317369 A 12
UTR
3'
4 SHCBP1 cr16 46614658 T 14
UTR
3'
4 SHOX2 cr3 157814199 A 11
UTR
3'
4 SIX1 cr14 61111921 A 11
UTR
3'
4 SLC17A5 cr6 74303467 A 10
UTR
3'
4 SLC25A20 cr3 48894565 A 12
UTR
3'
4 SLC2A12 cr6 134312045 T 11
UTR
3'
4 SLC2A2 cr3 170715683 T 10
UTR
3'
4 SLC35F1 cr6 118636596 T 24
UTR
3'
4 SLC36A4 cr11 92881233 T 12
UTR
3'
4 SLC6A17 cr1 110743671 A 10
UTR
3'
4 SLC6A4 cr17 28523382 T 12
UTR

139
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
4 SLC6A6 cr3 14530419 T 12
UTR
3'
4 SLC6A6 cr3 14526824 T 11
UTR
3'
4 SMAD5 cr5 135517921 A 14
UTR
3'
4 SMAD5 cr5 135515014 A 10
UTR
3'
4 SMAD7 cr18 46447623 A 10
UTR
3'
4 SMEK1 cr14 91924425 A 10
UTR
3'
4 SMS crX 22012649 T 10
UTR
3'
4 SORL1 cr11 121500400 A 14
UTR
3'
4 SOST cr17 41831941 T 10
UTR
3'
4 SOST cr17 41831361 T 11
UTR
3'
4 SOX1 cr13 112724861 A 10
UTR
3'
4 SOX11 cr2 5834918 A 11
UTR
3'
4 SPIRE1 cr18 12449300 T 11
UTR
3'
4 SPRED1 cr15 38648129 A 9
UTR
3'
4 SPTLC2 cr14 77975645 A 11
UTR
3'
4 SRCIN1 cr17 36687785 T 12
UTR
3'
4 SRGAP1 cr12 64537560 A 14
UTR
3'
4 SRGAP2 cr1 206636489 T 12
UTR
3'
4 SS18 cr18 23596687 A 11
UTR
3'
4 ST3GAL5 cr2 86067101 A 9
UTR
3'
4 STEAP3 cr2 120023163 T 12
UTR
3'
4 STK11 cr19 1228058 T 11
UTR
3'
4 STX12 cr1 28150575 T 10
UTR
3'
4 STX3 cr11 59569295 A 11
UTR

140
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
4 STX6 cr1 180945093 A 9
UTR
3'
4 SUZ12 cr17 30326763 T 12
UTR
3'
4 SYNJ2BP cr14 70834868 A 10
UTR
3'
4 SYT11 cr1 155851834 T 12
UTR
3'
4 TAF8 cr6 42045495 T 11
UTR
3'
4 TCF20 cr22 42556646 A 12
UTR
3'
4 TCF4 cr18 52894479 A 13
UTR
3'
4 TCF4 cr18 52891868 A 11
UTR
3'
4 TCP11L1 cr11 33094799 T 11
UTR
3'
4 TFAP2B cr6 50814900 A 10
UTR
3'
4 TMEM119 cr12 108984472 A 11
UTR
3'
4 TMEM14C cr6 10731011 A 9
UTR
3'
4 TMEM14E cr3 152058228 T 10
UTR
3'
4 TMEM201 cr1 9674449 T 10
UTR
3'
4 TMEM213 cr7 138490613 T 13
UTR
3'
4 TMEM64 cr8 91637753 A 12
UTR
3'
4 TMOD3 cr15 52201130 T 10
UTR
3'
4 TNFAIP8 cr5 118729618 A 10
UTR
3'
4 TNIP3 cr4 122052756 T 22
UTR
3'
4 TNRC6B cr22 40724536 T 10
UTR
3'
4 TOPORS cr9 32541245 A 10
UTR
3'
4 TOR1AIP1 cr1 179888400 A 12
UTR
3'
4 TP53INP1 cr8 95941646 A 13
UTR
3'
4 TRIM56 cr7 100733606 A 9
UTR

141
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
4 TRIM66 cr11 8636480 T 13
UTR
3'
4 TRIP10 cr19 6751495 A 12
UTR
3'
4 TRPM1 cr15 31293995 A 11
UTR
3'
4 TRRAP cr7 98610830 T 11
UTR
3'
4 TSC22D2 cr3 150177375 T 13
UTR
3'
4 TTC30B cr2 178415366 T 10
UTR
3'
4 TTC39C cr18 21715264 T 11
UTR
3'
4 UBASH3B cr11 122681008 T 13
UTR
3'
4 UBE2G1 cr17 4173433 A 10
UTR
3'
4 UBLCP1 cr5 158712401 A 11
UTR
3'
4 UBN2 cr7 138992059 T 9
UTR
3'
4 UBN2 cr7 138989574 T 10
UTR
3'
4 UGT8 cr4 115598050 T 11
UTR
3'
4 UGT8 cr4 115598017 A 12
UTR
3'
4 USP43 cr17 9632427 T 13
UTR
3'
4 UTP15 cr5 72876582 T 12
UTR
3'
4 VAX1 cr10 118893337 A 10
UTR
3'
4 WDR17 cr4 177100754 T 11
UTR
3'
4 WDTC1 cr1 27633121 C 9
UTR
3'
4 WNK3 crX 54224160 A 16
UTR
3'
4 WSB1 cr17 25640066 A 15
UTR
3'
4 WSB2 cr12 118470668 T 10
UTR
3'
4 XKR6 cr8 10755309 T 10
UTR
3'
4 XKR7 cr20 30585884 G 10
UTR

142
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
4 XYLT1 cr16 17199280 T 8
UTR
3'
4 ZADH2 cr18 72910475 T 13
UTR
3'
4 ZBTB34 cr9 129646763 T 11
UTR
3'
4 ZBTB38 cr3 141164925 A 14
UTR
3'
4 ZBTB41 cr1 197124441 A 11
UTR
3'
4 ZBTB7A cr19 4046340 T 11
UTR
3'
4 ZC3HAV1L cr7 138711008 A 11
UTR
3'
4 ZCCHC2 cr18 60244188 A 10
UTR
3'
4 ZDBF2 cr2 207177005 T 8
UTR
3'
4 ZDHHC13 cr11 19197719 A 10
UTR
3'
4 ZDHHC7 cr16 85009055 A 12
UTR
3'
4 ZFP36L2 cr2 43450053 C 8
UTR
3'
4 ZFP36L2 cr2 43449809 A 9
UTR
3'
4 ZNF154 cr19 58212530 A 12
UTR
3'
4 ZNF238 cr1 244219033 T 11
UTR
3'
4 ZNF24 cr18 32917176 T 12
UTR
3'
4 ZNF287 cr17 16454419 T 9
UTR
3'
4 ZNF322A cr6 26636980 T 11
UTR
3'
4 ZNF395 cr8 28205776 T 27
UTR
3'
4 ZNF451 cr6 57033558 A 8
UTR
3'
4 ZNF498 cr7 99229241 T 11
UTR
3'
4 ZNF518B cr4 10442494 A 9
UTR
3'
4 ZNF527 cr19 37880936 T 12
UTR
3'
4 ZNF572 cr8 125990551 T 11
UTR

143
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
4 ZNF578 cr19 53018984 T 12
UTR
3'
4 ZNF585A cr19 37641928 T 11
UTR
3'
4 ZNF594 cr17 5084035 A 10
UTR
3'
4 ZNF658 cr9 40771887 T 12
UTR
3'
4 ZNF740 cr12 53584463 T 14
UTR
3'
3 AASDHPPT cr11 105967764 A 11
UTR
3'
3 ABI2 cr2 204292194 T 10
UTR
3'
3 ACOX1 cr17 73941980 T 9
UTR
3'
3 ACTBL2 cr5 56777006 T 10
UTR
3'
3 ACVR1C cr2 158390343 A 10
UTR
3'
3 ACVR2A cr2 148687300 A 10
UTR
3'
3 ADAMTS18 cr16 77316279 T 11
UTR
3'
3 ADAMTSL5 cr19 1505368 A 13
UTR
3'
3 ADRA1D cr20 4201344 T 10
UTR
3'
3 AFF1 cr4 88057269 T 11
UTR
3'
3 AFF2 crX 148080911 A 8
UTR
3'
3 AFF2 crX 148080284 T 10
UTR
3'
3 AGMAT cr1 15899314 T 18
UTR
3'
3 AGPAT5 cr8 6617153 A 11
UTR
3'
3 AGR2 cr7 16832295 T 11
UTR
3'
3 AHCTF1 cr1 247002534 A 7
UTR
3'
3 AK5 cr1 78025528 T 13
UTR
3'
3 AKAP11 cr13 42896913 T 9
UTR
3'
3 AKAP5 cr14 64940497 A 9
UTR

144
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
3 AKAP8 cr19 15465362 A 11
UTR
3'
3 AKAP8 cr19 15465302 A 9
UTR
3'
3 AKIRIN2 cr6 88384713 A 11
UTR
3'
3 AKT2 cr19 40736623 T 14
UTR
3'
3 ALS2CR8 cr2 203849779 A 14
UTR
3'
3 ANKH cr5 14711208 A 8
UTR
3'
3 ANKH cr5 14705393 A 13
UTR
3'
3 ANKRD12 cr18 9282855 A 10
UTR
3'
3 ANKRD13B cr17 27941253 T 19
UTR
3'
3 ANKRD13C cr1 70727638 A 12
UTR
3'
3 ANKS1B cr12 99138573 T 13
UTR
3'
3 ARCN1 cr11 118473732 T 8
UTR
3'
3 ARHGAP12 cr10 32096465 A 9
UTR
3'
3 ARHGAP42 cr11 100859972 T 10
UTR
3'
3 ARID1B cr6 157530011 A 10
UTR
3'
3 ARID5B cr10 63855130 A 10
UTR
3'
3 ARIH1 cr15 72877867 A 12
UTR
3'
3 ARL2BP cr16 57287376 T 12
UTR
3'
3 ARL8A cr1 202102526 C 8
UTR
3'
3 ARMC8 cr3 137964255 T 9
UTR
3'
3 ARPP21 cr3 35726292 T 9
UTR
3'
3 ASB8 cr12 48541711 A 10
UTR
3'
3 ASPHD2 cr22 26840193 T 13
UTR
3'
3 ASPRV1 cr2 70187727 C 8
UTR

145
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
3 ATP11C crX 138809822 A 10
UTR
3'
3 ATP1B2 cr17 7560698 A 10
UTR
3'
3 ATP2A2 cr12 110786506 A 9
UTR
3'
3 ATP6V0D1 cr16 67472221 G 9
UTR
3'
3 ATP6V1G1 cr9 117360666 T 10
UTR
3'
3 ATRX crX 76762662 A 10
UTR
3'
3 AUTS2 cr7 70257601 T 15
UTR
3'
3 AXIN1 cr16 337827 G 9
UTR
3'
3 BAG1 cr9 33254142 T 20
UTR
3'
3 BCL11A cr2 60685168 T 10
UTR
3'
3 BCL11B cr14 99638830 A 9
UTR
3'
3 BCL11B cr14 99637754 T 10
UTR
3'
3 BEND4 cr4 42114856 A 10
UTR
3'
3 BFAR cr116 14762692 A 16
UTR
3'
3 BLOC1S2 cr10 102035182 A 10
UTR
3'
3 BMP7 cr20 55744815 T 10
UTR
3'
3 BMPR2 cr2 203426266 T 8
UTR
3'
3 BOD1L cr4 13571144 A 10
UTR
3'
3 BRAF cr7 140434294 A 9
UTR
3'
3 C11orf41 cr11 33690228 T 8
UTR
3'
3 C11orf58 cr11 16777810 T 24
UTR
3'
3 C12orf5 cr12 4463524 T 10
UTR
3'
3 C12orf66 cr12 64587315 A 10
UTR
3'
3 C12orf76 cr12 110479725 A 11
UTR

146
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
3 C14orf101 cr14 57116192 A 10
UTR
3'
3 C14orf126 cr14 31917025 A 10
UTR
3'
3 C14orf28 cr14 45376124 A 12
UTR
3'
3 C16orf45 cr16 15680717 C 9
UTR
3'
3 C16orf52 cr16 22092814 A 15
UTR
3'
3 C18orf25 cr18 43846502 A 9
UTR
3'
3 C18orf25 cr18 43844098 A 9
UTR
3'
3 C2orf18 cr2 27001810 T 13
UTR
3'
3 C2orf29 cr2 101886150 T 10
UTR
3'
3 C3orf63 cr3 56657045 A 9
UTR
3'
3 C3orf70 cr3 184795851 A 10
UTR
3'
3 C5orf41 cr5 172563230 A 11
UTR
3'
3 C6orf106 cr6 34558017 T 7
UTR
3'
3 C6orf62 cr6 24705738 A 10
UTR
3'
3 C7orf68 cr7 128097963 A 10
UTR
3'
3 C7orf69 cr7 47859241 A 11
UTR
3'
3 C8orf48 cr8 13425580 T 9
UTR
3'
3 C8orf85 cr8 117955238 A 22
UTR
3'
3 C9orf167 cr9 140176659 T 10
UTR
3'
3 C9orf66 cr9 214453 T 9
UTR
3'
3 CA12 cr15 63616886 T 19
UTR
3'
3 CABLES2 cr20 60965113 A 10
UTR
3'
3 CABP4 cr11 67226510 T 14
UTR
3'
3 CAMKK2 cr12 121678327 T 13
UTR

147
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
3 CAPRIN1 cr11 34121880 T 8
UTR
3'
3 CASP2 cr7 143003342 T 25
UTR
3'
3 CBFB cr16 67133322 T 14
UTR
3'
3 CBL cr11 119172610 A 10
UTR
3'
3 CBX5 cr12 54630019 T 10
UTR
3'
3 CBY1 cr22 39069285 T 9
UTR
3'
3 CCDC67 cr11 93170909 C 9
UTR
3'
3 CCDC8 cr19 46914112 T 12
UTR
3'
3 CCNL2 cr1 1327869 T 9
UTR
3'
3 CD59 cr11 33728097 A 21
UTR
3'
3 CD96 cr3 111368930 A 9
UTR
3'
3 CDH13 cr16 83828683 A 11
UTR
3'
3 CDH2 cr18 25531057 T 10
UTR
3'
3 CDH2 cr18 25531044 T 10
UTR
3'
3 CDH3 cr16 68732679 T 11
UTR
3'
3 CDKN1C cr11 2904845 T 10
UTR
3'
3 CELF1 cr11 47490243 A 9
UTR
3'
3 CELSR2 cr1 109816863 C 8
UTR
3'
3 CEP164 cr11 117283967 T 11
UTR
3'
3 CHD1 cr5 98191372 T 13
UTR
3'
3 CHP cr15 41572703 T 27
UTR
3'
3 CIB2 cr15 78397503 T 10
UTR
3'
3 CKAP4 cr12 106632374 A 10
UTR
3'
3 CLCN5 crX 49858223 A 9
UTR

148
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
3 CLDN14 cr21 37833059 T 10
UTR
3'
3 CLIC5 cr6 45868268 A 11
UTR
3'
3 CLMN cr14 95650666 A 8
UTR
3'
3 CMTM8 cr3 32411483 A 9
UTR
3'
3 CNNM1 cr10 101153279 A 9
UTR
3'
3 CNNM3 cr2 97499281 A 12
UTR
3'
3 CNST cr1 246830426 A 10
UTR
3'
3 COL8A2 cr1 36561052 A 10
UTR
3'
3 COQ10B cr2 198339541 T 17
UTR
3'
3 COQ2 cr4 84185003 A 8
UTR
3'
3 COX16 cr14 70793015 A 14
UTR
3'
3 CPD cr17 28792026 A 9
UTR
3'
3 CPEB2 cr4 15070967 A 9
UTR
3'
3 CPSF2 cr14 92629266 T 9
UTR
3'
3 CR1 cr1 207813472 T 9
UTR
3'
3 CREB1 cr2 208464929 G 8
UTR
3'
3 CREBBP cr16 3776240 G 10
UTR
3'
3 CRLF3 cr17 29111121 T 9
UTR
3'
3 CRTC1 cr19 18890340 A 9
UTR
3'
3 CSMD3 cr8 113236641 T 9
UTR
3'
3 CSNK1A1 cr5 148875717 T 9
UTR
3'
3 CSNK1G1 cr15 64461432 T 12
UTR
3'
3 CSNK1G1 cr15 64461259 A 9
UTR
3'
3 CTIF cr18 46388423 T 10
UTR

149
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
3 CTNNA2 cr2 80875614 T 7
UTR
3'
3 CX3CR1 cr3 39305465 A 8
UTR
3'
3 CYP17A1 cr10 104590293 A 11
UTR
3'
3 CYP1B1 cr2 38296985 T 10
UTR
3'
3 DBT cr1 100653256 T 17
UTR
3'
3 DCAF7 cr17 61668717 A 9
UTR
3'
3 DCUN1D3 cr16 20870892 A 10
UTR
3'
3 DDHD1 cr14 53513329 T 10
UTR
3'
3 DDHD2 cr8 38119445 T 7
UTR
3'
3 DDX18 cr2 118589332 A 9
UTR
3'
3 DDX3X crX 41207099 T 10
UTR
3'
3 DDX6 cr11 118620973 A 10
UTR
3'
3 DFFA cr1 10521379 A 10
UTR
3'
3 DFFB cr1 3801133 T 11
UTR
3'
3 DGKG cr3 185866704 T 10
UTR
3'
3 DHTKD1 cr10 12163218 A 19
UTR
3'
3 DLG3 crX 69723685 C 8
UTR
3'
3 DLG3 crX 69723447 T 13
UTR
3'
3 DNAJC17 cr15 41060070 A 14
UTR
3'
3 DNAL1 cr14 74166011 T 15
UTR
3'
3 DNM3 cr1 172380678 A 15
UTR
3'
3 DPF3 cr14 73137761 A 8
UTR
3'
3 DPP4 cr2 162849045 T 9
UTR
3'
3 DPY19L4 cr8 95802923 T 10
UTR

150
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
3 DPYSL2 cr8 26515559 T 10
UTR
3'
3 DSTYK cr1 205115701 T 16
UTR
3'
3 DSTYK cr1 205112278 T 14
UTR
3'
3 DUT cr15 48634591 A 10
UTR
3'
3 DYNC1LI2 cr16 66757487 T 16
UTR
3'
3 DYNC1LI2 cr16 66755235 T 11
UTR
3'
3 E2F2 cr1 23834007 A 15
UTR
3'
3 EAPP cr14 34985335 A 10
UTR
3'
3 ECE1 cr1 21546032 A 10
UTR
3'
3 EFR3B cr2 25378726 T 13
UTR
3'
3 EIF2A cr3 150302798 A 10
UTR
3'
3 ELAVL1 cr19 8023995 T 11
UTR
3'
3 ELOVL6 cr4 110971043 T 11
UTR
3'
3 ENGASE cr17 77083686 G 10
UTR
3'
3 EPHA3 cr3 89529769 A 11
UTR
3'
3 EPHA7 cr6 93951343 A 9
UTR
3'
3 EPHB1 cr3 134978889 A 10
UTR
3'
3 ERBB4 cr2 212243952 T 11
UTR
3'
3 ERGIC2 cr12 29493585 T 12
UTR
3'
3 ERLIN2 cr8 37614867 T 10
UTR
3'
3 ESRRB cr14 76967818 G 8
UTR
3'
3 ETNK1 cr12 22839785 T 28
UTR
3'
3 FADS1 cr11 61567668 T 14
UTR
3'
3 FAM101B cr17 292360 T 10
UTR

151
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
3 FAM105B cr5 14695377 T 9
UTR
3'
3 FAM117B cr2 203633341 T 10
UTR
3'
3 FAM126B cr2 201845397 G 7
UTR
3'
3 FAM160B1 cr10 116621715 A 9
UTR
3'
3 FAM19A4 cr3 68781684 A 10
UTR
3'
3 FAM20B cr1 179044326 A 13
UTR
3'
3 FBLIM1 cr1 16112130 A 10
UTR
3'
3 FBN2 cr5 127594650 A 8
UTR
3'
3 FBN2 cr5 127594063 A 10
UTR
3'
3 FBXO27 cr19 39515468 T 11
UTR
3'
3 FBXW2 cr9 123524089 A 12
UTR
3'
3 FECH cr18 55215482 A 15
UTR
3'
3 FERMT1 cr20 6055696 T 15
UTR
3'
3 FGD1 crX 54471920 A 13
UTR
3'
3 FGD4 cr12 32798227 T 12
UTR
3'
3 FGD6 cr12 95470673 A 10
UTR
3'
3 FGFR1OP2 cr12 27118562 T 10
UTR
3'
3 FLCN cr17 17116100 A 10
UTR
3'
3 FLCN cr17 17115789 A 26
UTR
3'
3 FMNL3 cr12 50038887 A 25
UTR
3'
3 FMNL3 cr12 50033467 A 10
UTR
3'
3 FNDC3B cr3 172117183 A 10
UTR
3'
3 FOXJ2 cr12 8208083 A 13
UTR
3'
3 FOXK1 cr7 4809074 T 13
UTR

152
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
3 FOXO1 cr13 41132503 A 9
UTR
3'
3 FOXP1 cr3 71007462 T 10
UTR
3'
3 FOXP1 cr3 71005883 T 41
UTR
3'
3 FTSJD1 cr16 71317151 A 10
UTR
3'
3 FUT8 cr14 66209673 T 13
UTR
3'
3 FZD7 cr2 202902385 A 11
UTR
3'
3 GAPVD1 cr9 128127210 T 10
UTR
3'
3 GATAD2B cr1 153781275 A 20
UTR
3'
3 GCNT1 cr9 79119829 T 11
UTR
3'
3 GDAP2 cr1 118408218 A 10
UTR
3'
3 GFPT1 cr2 69549530 A 9
UTR
3'
3 GIPC2 cr1 78601920 T 9
UTR
3'
3 GIT1 cr17 27901146 A 12
UTR
3'
3 GLCCI1 cr7 8127832 T 11
UTR
3'
3 GLT25D2 cr1 183905658 A 10
UTR
3'
3 GNA13 cr17 63005677 A 10
UTR
3'
3 GNPNAT1 cr14 53242966 A 11
UTR
3'
3 GOLGA2 cr9 131018793 T 14
UTR
3'
3 GOLPH3L cr1 150619971 A 15
UTR
3'
3 GPM6A cr4 176555451 T 10
UTR
3'
3 GPR155 cr2 175299037 T 13
UTR
3'
3 GPR180 cr13 95279582 A 8
UTR
3'
3 GPR37L1 cr1 202098133 T 21
UTR
3'
3 GPRC5A cr12 13065679 T 13
UTR

153
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
3 GPX8 cr5 54460112 T 10
UTR
3'
3 GRAMD3 cr5 125829168 T 10
UTR
3'
3 GRB2 cr17 73314260 T 10
UTR
3'
3 GRID1 cr10 87359476 T 11
UTR
3'
3 GSK3B cr3 119544323 A 9
UTR
3'
3 GTF2A2 cr15 59930716 T 7
UTR
3'
3 GTF2H5 cr6 158615020 A 21
UTR
3'
3 GTF2H5 cr6 158614314 A 10
UTR
3'
3 H2AFX cr11 118964586 A 10
UTR
3'
3 H2AFY cr5 134670602 T 10
UTR
3'
3 HAPLN1 cr5 82937251 A 10
UTR
3'
3 HCN1 cr5 45260992 T 9
UTR
3'
3 HELZ cr17 65067696 T 8
UTR
3'
3 HEPHL1 cr11 93846820 T 9
UTR
3'
3 HEY2 cr6 126081692 T 10
UTR
3'
3 HIAT1 cr1 100548278 A 11
UTR
3'
3 HIPK1 cr1 114518139 T 9
UTR
3'
3 HMGN2 cr1 26801737 T 15
UTR
3'
3 HNRNPA3 cr2 178087793 A 11
UTR
3'
3 HNRNPK cr9 86584095 C 9
UTR
3'
3 HNRNPK cr9 86583800 A 10
UTR
3'
3 HOMEZ cr14 23744114 A 14
UTR
3'
3 HOOK1 cr1 60338642 A 8
UTR
3'
3 HOXB3 cr17 46627000 A 9
UTR

154
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
3 HOXC9 cr12 54396883 A 12
UTR
3'
3 HP1BP3 cr1 21070971 A 10
UTR
3'
3 HRH1 cr3 11303522 A 11
UTR
3'
3 HS2ST1 cr1 87575244 T 10
UTR
3'
3 HS3ST5 cr6 114376959 A 10
UTR
3'
3 HUNK cr21 33373431 A 9
UTR
3'
3 HUWE1 crX 53559710 T 11
UTR
3'
3 HUWE1 crX 53559518 A 12
UTR
3'
3 IFI6 cr1 27992800 A 23
UTR
3'
3 IFT81 cr12 110656332 T 9
UTR
3'
3 IGF2BP3 cr7 23350733 T 12
UTR
3'
3 IGF2BP3 cr7 23350408 T 10
UTR
3'
3 IGFBP5 cr2 217537045 T 14
UTR
3'
3 IKZF2 cr2 213865040 A 8
UTR
3'
3 IL7R cr5 35876844 A 10
UTR
3'
3 IMPG2 cr3 100945663 A 9
UTR
3'
3 INSC cr11 15267955 T 10
UTR
3'
3 INSR cr19 7112347 A 9
UTR
3'
3 INTS6 cr13 51937816 T 10
UTR
3'
3 IRS1 cr2 227600758 T 11
UTR
3'
3 IRS1 cr2 227596558 A 10
UTR
3'
3 ISL1 cr5 50690278 A 11
UTR
3'
3 ITGA4 cr2 182400811 T 8
UTR
3'
3 ITPRIPL1 cr2 96994050 A 10
UTR

155
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
3 JAKMIP1 cr4 6055625 A 11
UTR
3'
3 JAM3 cr11 134020535 T 12
UTR
3'
3 JARID2 cr6 15520768 T 9
UTR
3'
3 KCTD1 cr18 24035448 T 12
UTR
3'
3 KIAA0182 cr16 85706942 A 10
UTR
3'
3 KIAA1456 cr8 12883488 A 9
UTR
3'
3 KIAA1671 cr22 25588892 T 9
UTR
3'
3 KIF1B cr1 10437995 A 13
UTR
3'
3 KLF12 cr13 74261703 T 11
UTR
3'
3 KLHL20 cr1 173754885 A 12
UTR
3'
3 KNDC1 cr10 135039706 T 8
UTR
3'
3 KPNA6 cr1 32639763 C 9
UTR
3'
3 KPNB1 cr17 45760525 T 12
UTR
3'
3 LARP4B cr10 856761 A 9
UTR
3'
3 LCA5 cr6 80194766 A 9
UTR
3'
3 LEF1 cr4 108969352 A 9
UTR
3'
3 LHFP cr13 39917881 T 8
UTR
3'
3 LIAS cr4 39478848 A 11
UTR
3'
3 LIMS1 cr2 109300693 A 10
UTR
3'
3 LIN7C cr11 27517538 A 10
UTR
3'
3 LMAN1 cr18 56995800 T 10
UTR
3'
3 LMAN1 cr18 56995128 A 10
UTR
3'
3 LMO4 cr1 87812341 A 10
UTR
3'
3 LMO4 cr1 87811634 A 9
UTR

156
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
3 LMTK2 cr7 97837420 A 11
UTR
3'
3 LPL cr8 19823634 A 11
UTR
3'
3 LRCH2 crX 114346112 T 10
UTR
3'
3 LRIF1 cr1 111489900 A 13
UTR
3'
3 LRP12 cr8 105502451 T 10
UTR
3'
3 LRRC14 cr8 145747418 T 9
UTR
3'
3 LSM1 cr8 38021012 A 10
UTR
3'
3 LUZP2 cr11 25102964 A 12
UTR
3'
3 LYN cr8 56923131 A 15
UTR
3'
3 LYRM7 cr5 130537006 A 12
UTR
3'
3 MAFB cr20 39314997 G 8
UTR
3'
3 MAFG cr17 79879435 T 12
UTR
3'
3 MAGI3 cr1 114227223 A 10
UTR
3'
3 MAP1B cr5 71505347 A 11
UTR
3'
3 MAP1B cr5 71502852 A 10
UTR
3'
3 MAP4 cr3 48016254 A 13
UTR
3'
3 MARK1 cr1 220837099 T 10
UTR
3'
3 MCM10 cr10 13252313 A 16
UTR
3'
3 MED1 cr17 37560884 A 9
UTR
3'
3 MEF2C cr5 88017643 A 7
UTR
3'
3 MEF2D cr1 156436092 A 9
UTR
3'
3 METTL8 cr2 172174950 T 8
UTR
3'
3 MFN2 cr1 12073251 A 11
UTR
3'
3 MGAT4A cr2 99236361 T 10
UTR

157
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
3 MIER3 cr5 56216276 A 9
UTR
3'
3 MKLN1 cr7 131176677 A 9
UTR
3'
3 MKRN3 cr15 23812682 T 8
UTR
3'
3 MLEC cr12 121138251 T 11
UTR
3'
3 MMP2 cr16 55539895 T 10
UTR
3'
3 MOBKL1A cr4 71851985 T 9
UTR
3'
3 MPP7 cr10 28341712 T 9
UTR
3'
3 MRPL2 cr6 43021910 A 10
UTR
3'
3 MRPL44 cr2 224831951 T 11
UTR
3'
3 MRPS10 cr6 42175651 A 9
UTR
3'
3 MTAP cr9 21862262 A 9
UTR
3'
3 MTHFR cr1 11846483 T 10
UTR
3'
3 MTMR3 cr22 30422037 T 14
UTR
3'
3 MTMR6 cr13 25821349 A 10
UTR
3'
3 MXD1 cr2 70166270 T 6
UTR
3'
3 MYBL1 cr8 67476407 A 10
UTR
3'
3 MYCL1 cr1 40361307 A 10
UTR
3'
3 MYCN cr2 16086264 T 10
UTR
3'
3 MYEF2 cr15 48434757 A 6
UTR
3'
3 MYLK cr3 123332875 T 16
UTR
3'
3 NAA38 cr7 117832209 A 9
UTR
3'
3 NAP1L1 cr12 76440268 A 11
UTR
3'
3 NAPEPLD cr7 102742595 A 10
UTR
3'
3 NAPG cr18 10551001 T 11
UTR

158
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
3 NARG2 cr15 60715037 A 14
UTR
3'
3 NCCRP1 cr19 39691952 T 16
UTR
3'
3 NCS1 cr9 132996076 T 12
UTR
3'
3 NDFIP1 cr5 141533930 T 10
UTR
3'
3 NEBL cr10 21073429 A 9
UTR
3'
3 NEBL cr10 21072104 T 9
UTR
3'
3 NEURL1B cr5 172118507 A 7
UTR
3'
3 NFAM1 cr22 42776800 A 11
UTR
3'
3 NFAT5 cr16 69731363 A 10
UTR
3'
3 NFIB cr9 14087579 T 9
UTR
3'
3 NIPAL1 cr4 48038330 T 7
UTR
3'
3 NIPAL3 cr1 24798068 A 20
UTR
3'
3 NKAIN4 cr20 61872616 T 12
UTR
3'
3 NLGN4X crX 5808268 T 11
UTR
3'
3 NPLOC4 cr17 79525610 A 9
UTR
3'
3 NR3C1 cr5 142657694 T 9
UTR
3'
3 NSL1 cr1 212911280 A 9
UTR
3'
3 NT5C1B cr2 18744332 T 14
UTR
3'
3 NUCKS1 cr1 205687213 A 19
UTR
3'
3 NUFIP2 cr17 27585085 T 12
UTR
3'
3 ODZ4 cr11 78367062 T 9
UTR
3'
3 OGFOD1 crl6 56510316 A 11
UTR
3'
3 OLFM3 cr1 102269548 T 11
UTR
3'
3 OMA1 cr1 58946539 T 10
UTR

159
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
3 ONECUT2 cr18 55153928 T 7
UTR
3'
3 OPA3 cr19 46052745 T 12
UTR
3'
3 OSBPL3 cr7 24837354 A 10
UTR
3'
3 OTUD4 cr4 146058513 T 8
UTR
3'
3 OTUD4 cr4 146057615 G 13
UTR
3'
3 OTUD7B cr1 149914740 A 10
UTR
3'
3 OXR1 cr8 107764239 A 10
UTR
3'
3 OXR1 cr8 107764095 A 10
UTR
3'
3 PAICS cr4 57327144 A 10
UTR
3'
3 PAK1IP1 cr6 10709747 T 12
UTR
3'
3 PALM2 cr9 112706843 A 11
UTR
3'
3 PAPD5 cr16 50264179 T 10
UTR
3'
3 PAPD5 cr16 50263692 T 10
UTR
3'
3 PAPD5 cr16 50263454 A 8
UTR
3'
3 PBRM1 cr3 52579628 A 10
UTR
3'
3 PCDH7 cr4 31146675 T 12
UTR
3'
3 PCDH7 cr4 31144759 A 9
UTR
3'
3 PCLO cr7 82451412 T 12
UTR
3'
3 PCLO cr7 82383474 T 9
UTR
3'
3 PCNP cr3 101312474 A 10
UTR
3'
3 PCNP cr3 101312179 T 10
UTR
3'
3 PCYOX1L cr5 148748459 T 8
UTR
3'
3 PDCL cr9 125581889 A 10
UTR
3'
3 PDCL cr9 125581558 A 13
UTR

160
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
3 PDGFA cr7 537622 A 11
UTR
3'
3 PDGFA cr7 536908 T 11
UTR
3'
3 PEX6 cr6 42931666 C 7
UTR
3'
3 PFN1 cr17 4848972 A 10
UTR
3'
3 PGPEP1 cr19 18477965 A 20
UTR
3'
3 PHTF2 cr7 77586547 T 11
UTR
3'
3 PIGM cr1 159998080 T 11
UTR
3'
3 PIGW cr17 34894609 T 11
UTR
3'
3 PIK3R1 cr5 67595054 A 10
UTR
3'
3 PIP5K1A cr1 151220867 T 11
UTR
3'
3 PKN2 cr1 89301773 T 11
UTR
3'
3 PLA2G12A cr4 110633665 T 10
UTR
3'
3 PLCL1 cr2 199013907 T 9
UTR
3'
3 PLCXD3 cr5 41307606 A 9
UTR
3'
3 PLK2 cr5 57749858 A 9
UTR
3'
3 PLXDC2 cr10 20569078 A 10
UTR
3'
3 POLH cr6 43584323 A 14
UTR
3'
3 POU2F2 cr19 42595122 T 14
UTR
3'
3 PPAP2B cr1 56962088 T 10
UTR
3'
3 PPAT cr4 57261372 A 12
UTR
3'
3 PPM1E cr17 57060351 A 10
UTR
3'
3 PPP1R3A cr7 113517422 A 9
UTR
3'
3 PPP3CA cr4 101946069 T 10
UTR
3'
3 PPPDE1 cr1 244869241 A 12
UTR

161
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
3 PRELP cr1 203457654 A 10
UTR
3'
3 PRKCB cr16 24226979 A 9
UTR
3'
3 PRKCE cr2 46414854 A 12
UTR
3'
3 PRKD3 cr2 37477691 A 9
UTR
3'
3 PRPF40A cr2 153512705 T 9
UTR
3'
3 PRRC2B cr9 134374365 T 9
UTR
3'
3 PRRG1 crX 37313537 T 10
UTR
3'
3 PTCD3 cr2 86365336 T 9
UTR
3'
3 PTCH1 cr9 98208010 A 10
UTR
3'
3 PTGS2 cr1 186642025 T 9
UTR
3'
3 PTP4A1 cr6 64292097 T 10
UTR
3'
3 PTP4A2 cr1 32374021 A 10
UTR
3'
3 PTPN22 cr1 114357118 T 10
UTR
3'
3 PTPRF cr1 44088117 T 11
UTR
3'
3 PUM1 cr1 31405680 T 10
UTR
3'
3 QKI cr6 163985925 T 8
UTR
3'
3 QRICH1 cr3 49067797 A 11
UTR
3'
3 RAB18 cr10 27827928 A 8
UTR
3'
3 RAB36 cr22 23505793 C 10
UTR
3'
3 RAB3GAP2 cr1 220324482 A 9
UTR
3'
3 RAB3IP cr12 70214638 A 17
UTR
3'
3 RAB3IP cr12 70211224 A 11
UTR
3'
3 RAB7L1 cr1 205738564 T 10
UTR
3'
3 RAB8A cr19 16244263 T 13
UTR

162
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
3 RAB8B cr15 63557574 T 13
UTR
3'
3 RAD23B cr9 110092642 T 10
UTR
3'
3 RAP2B cr3 152881852 T 12
UTR
3'
3 RASGRP4 cr19 38900377 A 11
UTR
3'
3 RBL1 cr20 35632028 A 13
UTR
3'
3 RBM12B cr8 94745547 A 10
UTR
3'
3 RBM12B cr8 94745279 A 10
UTR
3'
3 RBM38 cr20 55983973 G 8
UTR
3'
3 RC3H1 cr1 173905652 A 25
UTR
3'
3 RCC2 cr1 17734207 A 10
UTR
3'
3 RCN1 cr11 32126284 T 10
UTR
3'
3 RFT1 cr3 53125729 C 8
UTR
3'
3 RGS20 cr8 54871209 A 11
UTR
3'
3 RHOB cr2 20648933 T 12
UTR
3'
3 RHOBTB3 cr5 95129188 A 12
UTR
3'
3 RIF1 cr2 152331769 T 10
UTR
3'
3 RIMBP2 cr12 130882589 A 11
UTR
3'
3 RIMS1 cr6 73111857 A 12
UTR
3'
3 RIMS2 cr8 105264755 A 14
UTR
3'
3 RNF152 cr18 59482618 A 10
UTR
3'
3 RNF2 cr1 185069838 T 9
UTR
3'
3 RNGTT cr6 89320667 T 10
UTR
3'
3 RORA cr15 60785852 T 11
UTR
3'
3 RPE65 cr1 68895273 T 10
UTR

163
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
3 RPRD2 cr1 150445907 T 10
UTR
3'
3 RRP15 cr1 218506210 A 17
UTR
3'
3 RSBN1 cr1 114307995 A 8
UTR
3'
3 RSBN1L cr7 77408705 A 9
UTR
3'
3 RSL1D1 cr16 11930997 T 11
UTR
3'
3 S100A4 cr1 153516162 A 10
UTR
3'
3 SALL3 cr18 76757543 A 10
UTR
3'
3 SAMD4A cr14 55257700 A 10
UTR
3'
3 SARM1 cr17 26726913 T 12
UTR
3'
3 SASH1 cr6 148872287 T 10
UTR
3'
3 SASH1 cr6 148870950 T 12
UTR
3'
3 SATB1 cr3 18390227 T 12
UTR
3'
3 SBK1 cr16 28334644 A 13
UTR
3'
3 SCAI cr9 127707832 A 13
UTR
3'
3 SCAMP1 cr5 77772627 A 10
UTR
3'
3 SCN1A cr2 166846936 T 10
UTR
3'
3 SCO1 cr17 10583834 T 8
UTR
3'
3 SDR16C5 cr8 57212734 T 12
UTR
3'
3 SEH1L cr18 12986726 T 14
UTR
3'
3 SENP6 cr6 76425956 A 10
UTR
3'
3 SEPT11 cr4 77957803 T 10
UTR
3'
3 SETD1B cr12 122269303 T 9
UTR
3'
3 SFXN1 cr5 174954579 T 10
UTR
3'
3 SGK494 cr17 26937070 A 16
UTR

164
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
3 SGOL2 cr2 201448283 T 10
UTR
3'
3 SH2B3 cr12 111887735 T 14
UTR
3'
3 SH3KBP1 crX 19553810 T 12
UTR
3'
3 SHANK2 cr11 70315627 T 14
UTR
3'
3 SHISA2 cr13 26619921 A 11
UTR
3'
3 SHOC2 cr10 112773341 T 10
UTR
3'
3 SIK1 cr21 44835578 A 10
UTR
3'
3 SIPA1L3 cr19 38698868 T 10
UTR
3'
3 SIPA1L3 cr19 38698671 T 17
UTR
3'
3 SIX4 cr14 61178202 A 10
UTR
3'
3 SKI cr1 2240043 T 10
UTR
3'
3 SLC12A6 cr15 34523172 A 10
UTR
3'
3 SLC14A1 cr18 43332169 A 8
UTR
3'
3 SLC15A2 cr3 121660272 T 11
UTR
3'
3 SLC16A1 cr1 113455427 A 13
UTR
3'
3 SLC16A10 cr6 111544547 T 9
UTR
3'
3 SLC16A4 cr1 110906247 A 19
UTR
3'
3 SLC17A6 cr11 22400904 A 10
UTR
3'
3 SLC22A5 cr5 131730903 T 17
UTR
3'
3 SLC25A36 cr3 140696772 A 11
UTR
3'
3 SLC31A1 cr9 116026594 A 14
UTR
3'
3 SLC35E1 cr19 16663158 T 11
UTR
3'
3 SLC35E3 cr12 69158739 A 12
UTR
3'
3 SLC38A1 cr12 46579255 T 9
UTR

165
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
3 SLC38A1 cr12 46576941 A 10
UTR
3'
3 SLC39A9 cr14 69928356 T 10
UTR
3'
3 SLC4A10 cr2 162840706 T 10
UTR
3'
3 SLC6A15 cr12 85253350 T 10
UTR
3'
3 SLC6A6 cr3 14530588 A 10
UTR
3'
3 SLC7A11 cr4 139090880 A 10
UTR
3'
3 SLC7A14 cr3 170182342 T 10
UTR
3'
3 SLC7A6 cr16 68335452 T 10
UTR
3'
3 SLC9A6 crX 135128103 T 11
UTR
3'
3 SMAD3 cr15 67485102 A 9
UTR
3'
3 SMAD4 cr18 48605007 T 10
UTR
3'
3 SMPDL3A cr6 123130673 T 11
UTR
3'
3 SMURF2 cr17 62541185 T 13
UTR
3'
3 SNAP23 cr15 42824292 T 14
UTR
3'
3 SNAPC3 cr9 15461137 A 13
UTR
3'
3 SNX30 cr9 115632450 T 10
UTR
3'
3 SOCS3 cr17 76353185 C 9
UTR
3'
3 SOX1 cr13 112725171 C 9
UTR
3'
3 SOX1 cr13 112724720 T 10
UTR
3'
3 SOX11 cr2 5834751 T 9
UTR
3'
3 SPATS2 cr12 49921053 T 10
UTR
3'
3 SPATS2L cr2 201343614 T 12
UTR
3'
3 SPCS3 cr4 177250844 T 10
UTR
3'
3 SPTBN1 cr2 54898095 T 10
UTR

166
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
3 SRRM2 cr16 2821013 T 10
UTR
3'
3 SRRM4 cr12 119599690 A 10
UTR
3'
3 SRRM4 cr12 119596858 T 9
UTR
3'
3 SSBP3 cr1 54692340 T 15
UTR
3'
3 SSR3 cr3 156259169 T 10
UTR
3'
3 ST7L cr1 113066620 A 11
UTR
3'
3 STC2 cr5 172744019 T 12
UTR
3'
3 STK17B cr2 197000501 A 23
UTR
3'
3 STK4 cr20 43708275 A 10
UTR
3'
3 STRN3 cr14 31364300 A 11
UTR
3'
3 SUSD5 cr3 33193040 T 10
UTR
3'
3 SYNJ2 cr6 158519568 A 14
UTR
3'
3 SYNRG cr17 35879008 A 10
UTR
3'
3 SYT13 cr11 45264120 A 9
UTR
3'
3 TACC1 cr8 38706479 T 15
UTR
3'
3 TAF12 cr1 28929961 A 11
UTR
3'
3 TBC1D8B crX 106118337 A 13
UTR
3'
3 TBL1X crX 9684635 A 9
UTR
3'
3 TBX18 cr6 85445736 A 11
UTR
3'
3 TFAP2B cr6 50814917 T 9
UTR
3'
3 TFCP2L1 cr2 121975868 T 11
UTR
3'
3 TGOLN2 cr2 85549225 T 9
UTR
3'
3 THAP2 cr12 72073229 T 10
UTR
3'
3 THSD7A cr7 11411520 T 10
UTR

167
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
3 TIA1 cr2 70439448 T 11
UTR
3'
3 TIAL1 cr10 121335156 T 9
UTR
3'
3 TIGD5 cr8 144682449 T 9
UTR
3'
3 TLCD2 cr17 1609267 T 12
UTR
3'
3 TLCD2 cr17 1608003 T 11
UTR
3'
3 TLL1 cr4 167022770 T 8
UTR
3'
3 TLL2 cr10 98124863 A 11
UTR
3'
3 TMBIM4 cr12 66531178 T 16
UTR
3'
3 TMEM169 cr2 216966376 T 10
UTR
3'
3 TMEM192 cr4 165997961 T 10
UTR
3'
3 TMEM194B cr2 191372383 A 10
UTR
3'
3 TMEM86A cr11 18725436 T 9
UTR
3'
3 TMSL3 cr4 91759710 A 10
UTR
3'
3 TMTC1 cr12 29656466 A 8
UTR
3'
3 TNFRSF11B cr8 119936330 T 12
UTR
3'
3 TNFRSF9 cr1 7980708 A 15
UTR
3'
3 TNRC18 cr7 5346838 T 9
UTR
3'
3 TNRC6C cr17 76104332 C 9
UTR
3'
3 TNRC6C cr17 76101194 T 16
UTR
3'
3 TOMM20 cr1 235274461 A 8
UTR
3'
3 TOX4 cr14 21965677 T 12
UTR
3'
3 TPM3 cr1 154134840 A 21
UTR
3'
3 TPM4 cr19 16212343 T 9
UTR
3'
3 TRAK2 cr2 202244537 T 11
UTR

168
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
3 TRIM33 cr1 114940229 T 13
UTR
3'
3 TRIM68 cr11 4620726 A 9
UTR
3'
3 TRIM9 cr14 51442832 T 10
UTR
3'
3 TRIOBP cr22 38171794 A 9
UTR
3'
3 TRPC1 cr3 142525356 T 9
UTR
3'
3 TRPS1 cr8 116424772 T 10
UTR
3'
3 TSGA14 cr7 130038411 A 9
UTR
3'
3 TSHZ1 cr18 73001306 A 10
UTR
3'
3 TSHZ3 cr19 31766335 T 13
UTR
3'
3 TSPAN31 cr12 58141530 T 13
UTR
3'
3 TTC14 cr3 180327407 T 8
UTR
3'
3 TTLL2 cr6 167755564 T 9
UTR
3'
3 TXLNA cr1 32663414 T 11
UTR
3'
3 TXNDC9 cr2 99936109 A 9
UTR
3'
3 U2AF1 cr21 44513110 T 11
UTR
3'
3 UBAP2L cr1 154242977 T 8
UTR
3'
3 UBE2G2 cr21 46191155 A 12
UTR
3'
3 UBE2O cr17 74385876 T 9
UTR
3'
3 UBE2W cr8 74704584 T 10
UTR
3'
3 UBE3C cr7 157060934 T 10
UTR
3'
3 UGDH cr4 39500884 A 10
UTR
3'
3 UGT2B7 cr4 69978554 A 13
UTR
3'
3 UNC5D cr8 35649346 T 11
UTR
3'
3 UQCRB cr8 97242317 T 10
UTR

169
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
3 UQCRC1 cr3 48636506 G 9
UTR
3'
3 UQCRHL cr1 16133663 T 15
UTR
3'
3 USP11 crX 47107350 A 16
UTR
3'
3 USP13 cr3 179501981 A 11
UTR
3'
3 USP14 crl8 213518 A 12
UTR
3'
3 USP43 crl7 9632696 T 12
UTR
3'
3 USP46 cr4 53461199 T 10
UTR
3'
3 USP53 cr4 120216195 T 10
UTR
3'
3 USP7 crl6 8986976 T 9
UTR
3'
3 USP8 crl5 50791892 A 11
UTR
3'
3 VCPIP1 cr8 67545984 A 13
UTR
3'
3 VEZF1 crl7 56051105 T 14
UTR
3'
3 VGLL3 cr3 86995866 A 11
UTR
3'
3 VGLL3 cr3 86990599 T 11
UTR
3'
3 VPS33A cr12 122716608 A 11
UTR
3'
3 VTI1A cr10 114578212 T 9
UTR
3'
3 VTI1A cr10 114575744 T 10
UTR
3'
3 WDR1 cr4 10076371 A 9
UTR
3'
3 WDR3 cr1 118502087 T 11
UTR
3'
3 WHSC1 cr4 1945453 A 9
UTR
3'
3 WNK3 crX 54222891 A 14
UTR
3'
3 WWC3 crX 10111121 T 10
UTR
3'
3 XKR6 cr8 10755102 T 11
UTR
3'
3 XPO4 crl3 21353626 A 9
UTR

170
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras Posición
Gen Cromosoma homopolímero homopolímero
afectadas inicial
afectada afectado
3'
3 YTHDC1 cr4 69179759 A 10
UTR
3'
3 YY1 crl4 100744470 A 12
UTR
3'
3 ZC3H13 crl3 46537561 T 13
UTR
3'
3 ZC3HAV1 cr7 138745419 A 20
UTR
3'
3 ZC3HAV1L cr7 138710878 A 11
UTR
3'
3 ZC3HAV1L cr7 138710715 A 10
UTR
3'
3 ZFAND3 cr6 38122149 G 8
UTR
3'
3 ZFAND5 cr9 74968284 A 10
UTR
3'
3 ZFHX3 crl6 72820483 A 17
UTR
3'
3 ZFHX3 crl6 72816794 T 10
UTR
3'
3 ZHX3 cr20 39808271 T 16
UTR
3'
3 ZNF264 crl9 57731930 T 9
UTR
3'
3 ZNF362 cr1 33764950 T 12
UTR
3'
3 ZNF440 crl9 11944944 T 11
UTR
3'
3 ZNF503 cr10 77157784 T 11
UTR
3'
3 ZNF528 crl9 52920874 T 12
UTR
3'
3 ZNF557 crl9 7086241 A 13
UTR
3'
3 ZNF618 cr9 116812463 A 9
UTR
3'
3 ZNF629 crl6 30792783 T 10
UTR
3'
3 ZNF681 crl9 23925293 A 13
UTR
3'
3 ZNF770 crl5 35272976 A 9
UTR
3'
3 ZSCAN30 crl8 32831761 T 12
UTR
3'
3 ZSWIM2 cr2 187692280 T 9
UTR
3'
3 ZSWIM4 crl9 13942940 T 11
UTR

171
ES 2 906 023 T3

(continuación)

Base de Longitud del


Nº de muestras
Gen Cromosoma Posición inicial homopolímero homopolímero
afectadas
afectada afectado
3'
3 ZXDC cr3 126179925 T 11
UTR
3'
3 ZXDC cr3 126170876 T 9
UTR
3'
3 ZYG11B cr1 53290310 A 13
UTR

Asimismo, otra lista particular de marcadores exónicos previstos son los que se identificaron en los primeros 11
tumores sólidos deficientes en MMR. Esta lista se proporciona en la tabla 7, los indeles recurrentes comunes se
definen como los que aparecen en al menos 3 de 11 muestras.

172
ES 2 906 023 T3

173
ES 2 906 023 T3

174
ES 2 906 023 T3

175
ES 2 906 023 T3

176
ES 2 906 023 T3

En la tabla 8 se enumera una lista adicional prevista particular de la que se pueden seleccionar marcadores. Según
formas de realización específicas, las, al menos dos, regiones de microsatélites UTR o al menos tres regiones de
microsatélites (tal como se han descrito anteriormente) son regiones seleccionadas de las enumeradas en la tabla 8.
Sin embargo, según formas de realización alternativas muy específicas, los marcadores se seleccionan de la tabla 1
5 y/o 2 y no contienen un marcador enumerado en la tabla 8. Los marcadores ilustrativos en este caso incluyen, pero
sin limitación, LLRC8D, SAMD12, SEPT7, CASK, FAM20B, HELZ, KCNK1, LHX9, LYRM1, TMEM26, TRIP11,
ZBTB7A, ZKSCAN1, ZNF217, WIPF2, COL5A2, ZBTB33, AGPAT3, BMPR1B, CNOT7, EDEM3, G3BP2, HRNR,
KLF3, TNPO1, TRAK2, ZNF169, BDNF, OIT3, CNOT2, LTN1, MBD4, SLC22A9, ATR, CDH26, KIAA2018, RNF145,
TGFBR2, y TMBIM4.
10
Tabla 8. Indeles recurrentes en regiones 5' y 3' UTR y en exones para muestras tumorales deficientes en MMR.

Base de homopolímero Longitud del


Gen Cromosoma Posición inicial Región
afectada homopolímero afectado
ARHGEF11 cr1 157014811 A 12 5'UTR
LRMP cr12 25205380 A 11 5' UTR
GABRG2 cr5 161494990 A 12 5' UTR
MBNL1 cr3 152017897 T 11 5' UTR
ARHGEF9 crX 62974288 T 12 5' UTR
CCT6B cr17 33288433 A 11 5' UTR
EPHB6 cr7 142560576 A 13 5' UTR
GRIA2 cr4 158142151 A 9 5' UTR
LMOD3 cr3 69171664 T 13 5' UTR
NDE1 cr16 15737427 T 11 5' UTR
OMD cr9 95179844 T 11 5' UTR
TMEM177 cr2 120437061 A 11 5' UTR
TRPS1 cr8 116681041 A 14 5' UTR
ZNF781 cr19 38161161 T 11 5' UTR
ZXDA crX 57936946 A 9 5' UTR
AMD1 cr6 111196178 A 11 5' UTR
ASPH cr8 62602295 A 11 5' UTR
BMP5 cr6 55739711 A 14 5' UTR
CBLN2 cr18 70211389 A 14 5' UTR
CEPT1 cr1 111690319 A 9 5' UTR
EBF1 cr5 158526596 T 11 5' UTR
ESCO1 cr18 19164371 A 11 5' UTR
KDM2B cr12 122018157 G 10 5' UTR
LRRC70 cr5 61874619 A 18 5' UTR
MCF2 crX 138724841 A 15 5' UTR
MEIS1 cr2 66662690 T 13 5' UTR
MEIS2 cr15 37391752 T 12 5' UTR
SEMA6A cr5 115910134 A 11 5' UTR
SETBP1 cr18 42260910 G 8 5' UTR
ST7L cr1 113162029 C 10 5' UTR
MAPK1IP1L cr14 55535728 T 13 3' UTR
NARG2 cr15 60712503 T 13 3' UTR
PI15 cr8 75766071 T 10 3' UTR
AHCYL1 cr1 110566210 A 14 3' UTR
APH1B cr15 63600287 T 12 3' UTR

177
ES 2 906 023 T3

(continuación)

Base de homopolímero Longitud del


Gen Cromosoma Posición inicial Región
afectada homopolímero afectado
C17orf63 cr17 27083744 T 12 3' UTR
CALN1 cr7 71245682 A 12 3' UTR
CCND2 cr12 4410638 T 16 3' UTR
CD5L cr1 157801230 A 13 3' UTR
CEP170 cr1 243288181 T 11 3' UTR
CREB3L2 cr7 137561927 A 11 3'UTR
CSNK1G3 cr5 122950254 T 13 3' UTR
DIDO1 cr20 61536691 A 11 3' UTR
DRAM2 cr1 111660181 A 11 3' UTR
EIF4G3 cr1 21133496 T 13 3' UTR
FAM38B cr18 10670849 T 14 3' UTR
GSK3B cr3 119542766 A 11 3' UTR
KCNMB4 cr12 70824838 A 14 3' UTR
KDM5A cr12 389523 T 11 3' UTR
MYO5B cr18 47351784 A 12 3' UTR
NEK5 cr13 52639268 A 13 3' UTR
NPR3 cr5 32787131 A 11 3' UTR
PPP1R12A cr12 80169697 T 13 3' UTR
PRTG cr15 55903921 A 11 3' UTR
RAB11FIP1 cr8 37718707 A 13 3' UTR
RASGRP1 cr15 38781450 T 13 3' UTR
SH3KBP1 crX 19552231 T 13 3' UTR
SHROOM3 cr4 77701305 A 12 3' UTR
SLC5A3 cr21 35470291 T 11 3' UTR
UBE2Z cr17 47005701 A 11 3' UTR
UST cr6 149398012 T 13 3' UTR
ZNF275 crX 152617043 A 12 3' UTR
EIF4G3 cr1 21133286 A 13 3' UTR
FCHSD2 cr11 72549649 A 10 3' UTR
FMO2 cr1 171178335 A 11 3' UTR
RYR3 cr15 34157541 A 10 3' UTR
TMEM65 cr8 125325217 A 11 3' UTR
WHSC1L1 cr8 38175279 A 11 3' UTR
ABAT cr16 8876793 T 11 3' UTR
ARFIP1 cr4 153832103 T 11 3' UTR
BTBD7 cr14 93708030 A 10 3' UTR
C15orf2 cr15 24927891 A 10 3' UTR
CALN1 cr7 71249416 T 10 3' UTR
CCDC89 cr11 85395559 T 10 3' UTR
CCND1 cr11 69466273 A 10 3' UTR
ENTPD4 cr8 23289680 A 11 3' UTR
FCHSD2 cr11 72548510 A 14 3' UTR

178
ES 2 906 023 T3

(continuación)

Base de homopolímero Longitud del


Gen Cromosoma Posición inicial Región
afectada homopolímero afectado
FGFBP3 cr10 93666830 A 11 3' UTR
LANCL1 cr2 211297865 T 9 3' UTR
PPM1A cr14 60761433 T 10 3' UTR
PURB cr7 44920830 A 9 3' UTR
ST7L cr1 113067470 A 10 3' UTR
SULF2 cr20 46286320 A 10 3' UTR
TMC7 cr16 19073947 A 10 3' UTR
TSR2 crX 54471045 T 10 3' UTR
UBA6 cr4 68481877 T 12 3' UTR
USP14 cr18 212029 A 9 3' UTR
ZNF185 crX 152140995 C 10 3' UTR
ZNF287 cr17 16454419 T 9 3' UTR
AKIRIN1 cr1 39471673 A 10 3' UTR
ARL10 cr5 175800427 T 10 3' UTR
BMPR2 cr2 203426176 T 8 3' UTR
C17orf96 cr17 36829265 T 8 3' UTR
CCND2 cr12 4409520 T 10 3' UTR
EDEM1 cr3 5260540 T 10 3' UTR
FOXN2 cr2 48604358 T 10 3' UTR
FOXN2 cr2 48603079 T 10 3' UTR
HDAC4 cr2 239974109 A 9 3' UTR
HUS1B cr6 656079 A 10 3' UTR
KDM5A cr12 393804 T 11 3' UTR
KIF5C cr2 149879665 T 10 3' UTR
LRCH1 cr13 47325657 A 10 3' UTR
MKLN1 cr7 131175980 A 10 3' UTR
PCDHB3 cr5 140482943 T 10 3' UTR
RYBP cr3 72424549 T 9 3' UTR
SH3KBP1 crX 19553810 T 12 3' UTR
SLC35F1 cr6 118638703 A 8 3' UTR
MSH6 cr2 48030639 C 8 Exón
SETD1B cr12 122242657 C 8 Exón
CASP5 cr11 104879686 T 10 Exón
RBMXL1 cr1 89449508 T 11 Exón
SEC31A cr4 83785564 T 9 Exón
CCDC150 cr2 197531518 A 11 Exón
PHF2 cr9 96422611 A 8 Exón
RPL22 cr1 6257784 T 8 Exón
TMEM60 cr7 77423459 T 9 Exón
AIM2 cr1 159032486 T 10 Exón
ASTE1 cr3 130733046 T 11 Exón
CASP5 cr11 104878040 T 10 Exón

179
ES 2 906 023 T3

(continuación)

Base de homopolímero Longitud del


Gen Cromosoma Posición inicial Región
afectada homopolímero afectado
CTCF cr16 67645338 A 7 Exón
DDX27 cr20 47858503 A 8 Exón
EXOSC9 cr4 122723893 T 8 Exón
FAM111B cr11 58892376 A 10 Exón
GRIK2 cr6 102503431 A 8 Exón
KIAA0182 cr16 85682289 C 8 Exón
KIAA1919 cr6 111587360 T 9 Exón
MLL3 cr7 151874147 T 9 Exón
MYL1 cr2 211179765 T 11 Exón
OR7E24 cr19 9361740 T 11 Exón
P4HTM cr3 49043192 C 7 Exón
PRKDC cr8 48866909 T 10 Exón
PRRT2 cr16 29825015 C 9 Exón
RNPC3 cr1 104076466 A 12 Exón
SMC6 cr2 17898125 T 9 Exón
TAF1B cr2 9989570 A 11 Exón
TMEM97 cr17 26653806 A 10 Exón
TTK cr6 80751896 A 9 Exón
UVRAG cr11 75694430 A 10 Exón

Según formas de realización particulares, la longitud de los homopolímeros utilizados como marcadores no excederá
5 de 20 nucleótidos o no excederá de 15 nucleótidos (por ejemplo, para permitir una detección más eficaz de la
presencia de un indel). Por lo tanto, según formas de realización particulares, los marcadores se seleccionan de, por
ejemplo, cualquiera de las tablas 1 a 8, pero solo de los marcadores que tienen menos de 20 nucleótidos o menos
de 15 nucleótidos. Esta longitud más corta es particularmente ventajosa en comparación con los marcadores de la
técnica anterior (por ejemplo, el marcador BAT25 y BAT26).
10
Particularmente, en algunas formas de realización, la longitud de los homopolímeros utilizados como marcadores no
excede de 15 nucleótidos, 14 nucleótidos, 13 nucleótidos, 12 nucleótidos o incluso 11 nucleótidos. Por otra parte,
según formas de realización particulares, los homopolímeros contemplados tienen al menos 6 nucleótidos, al menos
7 nucleótidos, al menos 8 nucleótidos, al menos 9 nucleótidos o incluso al menos 10 nucleótidos de longitud. Según
15 formas de realización específicas particulares, se prevé que la longitud de marcador de al menos un marcador (y
hasta todos los marcadores utilizados) se encuentre entre 7 y 15 nucleótidos, entre 8 y 15 nucleótidos, entre 8 y 14
nucleótidos, entre 8 y 13 nucleótidos, entre 9 y 13 nucleótidos, entre 10 y 13 nucleótidos, entre 8 y 12 nucleótidos,
entre 9 y 12 nucleótidos, entre 8 y 11 nucleótidos o entre 9 y 11 nucleótidos.

20 Es importante señalar que los marcadores descritos anteriormente se pueden utilizar para determinar el estado de
MSI independientemente del tipo de cáncer. Por lo tanto, en principio, se puede realizar un diagnóstico del estado de
MSI con los marcadores proporcionados en el presente documento para cada tipo de cáncer. No obstante, dado que
la MSI está presente con mayor frecuencia en cánceres con una deficiencia en genes de reparación de errores de
apareamiento, se prevé particularmente diagnosticar el estado de MSI en una muestra tumoral de tumores en los
25 que la deficiencia en MMR tiene lugar con más frecuencia que en otros tipos. En consecuencia, la muestra de
cáncer es normalmente una muestra seleccionada de un cáncer que sea cáncer colorrectal, cáncer endometrial,
cáncer de ovario, cáncer gástrico, leucemia y un tumor del espectro del síndrome de Lynch.

Diagnosticar el estado de MSI generalmente implica extraer la conclusión de detectar la presencia de MSI o no (esto
30 es equivalente a detectar la ausencia de MSI). Normalmente, la detección de la presencia de MSI se basará en la
detección de uno o más indeles en las regiones de microsatélites en investigación. Cuantos más genes marcadores
presentados en las tablas 1-3 del presente documento tengan una indel en una región de microsatélites, mayor será
la probabilidad de que el tumor se caracterice por inestabilidad microsatelital.

35 Generalmente, la MSI se puede clasificar como MSI-H, MSI-L y MSS. Según formas de realización particulares, si el
20% (o el 25%) o más de las regiones de microsatélites utilizadas para diagnosticar el estado de MSI contienen un
180
ES 2 906 023 T3

indel, el tumor es MSI-H, si entre el 2,5% y el 20% (25%) de las regiones de microsatélites contiene un indel, el
tumor es MSI-L, y si menos del 2,5% de las regiones de microsatélites contiene un indel, el tumor es estable en
microsatélites. Según formas de realización alternativas, la MSI puede clasificarse como MSI-H si el 17% o más de
las regiones de microsatélites utilizadas para diagnosticar el estado de MSI contienen un indel; si entre el 2% (o el
5 2,5%) y el 17% de las regiones de microsatélites contienen un indel, el tumor es MSI-L, y si menos del 2% (o el
2,5%) de las regiones de microsatélites contiene un indel, el tumor es estable en microsatélites. La última
clasificación es particularmente preferida cuando se utiliza un número elevado (por ejemplo, 25 o más) de
marcadores. Se utilizan porcentajes en lugar de números absolutos, ya que un experto en la técnica puede variar el
número de marcadores. Como pauta general, los porcentajes deben corresponder más o menos a los porcentajes
10 aplicados en el reconocido panel Bethesda. Por ejemplo, si se utilizan 8 marcadores, el tumor será MSS solo si
ninguno de los marcadores de microsatélites contiene un indel; será MSI-H si 2 o más marcadores son positivos,
mientras que será MSI-L si solo un marcador contiene un indel. Dado que es evidente a partir de este ejemplo que
un marcador positivo más o menos puede afectar al diagnóstico si se usa un número limitado de marcadores, se
prevé particularmente el uso de más marcadores. Esto es particularmente útil para clasificar de forma fiable los
15 tumores como MSI-L. Por ejemplo, con la clasificación del 2-17%, si se usa el panel de marcadores preferido de 56
marcadores, un tumor es MSS si 0 o 1 marcadores tienen una puntuación positiva, MSI-L si de 2 a 9 marcadores
tienen una puntuación positiva y MSI-H si 10 o más marcadores tienen una puntuación positiva.

El trabajo publicado también sugiere que los tumores MMR tienen una respuesta distinta a los tratamientos estándar
20 y las terapias dirigidas emergentes. Las investigaciones preclínicas sugieren, por ejemplo, que los tumores
deficientes en MMR muestran resistencia a las terapias con 5-fluorouracilo, anti-EGFR y VEGF25,26. Se desconoce el
motivo preciso de esta heterogeneidad, pero la presencia o la ausencia de mutaciones secundarias (recurrentes)
como consecuencia de la deficiencia en MMR podría determinar el resultado del tratamiento. Por ejemplo,
observamos una mutación recurrente en KRAS, que actúa como un predictor de respuesta negativa establecido de
25 terapias anti-EGFR. Es interesante señalar que la mayor parte de las mutaciones recurrentes en tumores
endometriales también afectan específicamente a genes expresados en el endometrio normal y se expresaron de
forma diferencial en tumores MMR- con respecto a MMR+, lo que sugiere una selección clonal positiva de estas
mutaciones. La identificación de mutaciones recurrentes también revela varias dianas terapéuticas novedosas para
el tratamiento de tumores deficientes en MMR.
30
Por lo tanto, según algunas formas de realización particulares, los procedimientos de diagnóstico del estado de MSI
de un tumor, tal como se presentan en el presente documento, pueden comprender además una etapa de elección
del régimen de tratamiento en función del estado de MSI (es decir, en función de si se encontró que el tumor es MSI-
H, MSI-L o MSS).
35
Todos los procedimientos actuales se basan en la detección de indeles en regiones de microsatélites del genoma.
Se describirán brevemente las metodologías de uso frecuente para el análisis de muestras de ácido nucleico para
detectar indeles. No obstante, puede utilizarse en la invención cualquier procedimiento conocido en la técnica para
detectar la presencia de indeles.
40
a. Hibridación específica de alelos

Esta técnica, también conocida de forma común como hibridación de oligonucleótidos específicos de alelos (ASO)
(por ejemplo, Stoneking et al., Am. J. Hum. Genet. 48: 70-382, 1991; Saiki et al., Nature 324,163-166,1986;
45 documento EP 235.726 y documento WO 89/11548), se basa en la distinción entre dos moléculas de ADN que
difieren en una base mediante hibridación de una sonda de oligonucleótidos que es específica para una de las
variantes con un producto amplificado obtenido al amplificar la muestra de ácido nucleico. Este procedimiento
normalmente emplea oligonucleótidos cortos, por ejemplo de 15-20 bases de longitud. Las sondas están diseñadas
para hibridarse diferencialmente con una variante frente a otra. Los principios y las pautas para diseñar dicha sonda
50 están disponibles en la técnica, por ejemplo en las referencias citadas en el presente documento. Las condiciones
de hibridación deben ser lo suficientemente rigurosas como para que haya una diferencia significativa en la
intensidad de hibridación entre alelos y producir una respuesta esencialmente binaria, por lo que una sonda se
hibrida con solo uno de los alelos. Algunas sondas están diseñadas para hibridarse con un segmento de ADN diana
de forma que el sitio polimórfico se alinee con una posición central (por ejemplo, en un oligonucleótido de 15 bases
55 en la posición 7; en un oligonucleótido de 16 bases en la posición 8 o 9) de la sonda, pero este diseño no es
necesario.

La cantidad y/o la presencia de un alelo se determina mediante la medición de la cantidad de oligonucleótido


específico de alelo que se hibrida con la muestra. Normalmente, el oligonucleótido se marca con una marca, tal
60 como una marca fluorescente. Por ejemplo, se aplica un oligonucleótido específico de alelo a oligonucleótidos
inmovilizados que representan secuencias con diferente longitud de microsatélites. Después de condiciones
rigurosas de hibridación y lavado, se mide la intensidad de la fluorescencia para cada oligonucleótido microsatélite.

Los formatos de ensayo adecuados para detectar híbridos formados entre sondas y secuencias de ácido nucleico
65 diana en una muestra son conocidos en la técnica e incluyen el formato de diana inmovilizada (dot-blot
(transferencia puntual)) y los formatos de ensayo de sonda inmovilizada (dot-blot inverso o line-blot (transferencia
181
ES 2 906 023 T3

lineal)). Algunos formatos de ensayo de dot blot y dot blot inverso se describen en las patentes de Estados Unidos
Nº 5.310.893, 5.451.512, 5.468.613 y 5.604.099.

En un formato dot-blot, el ADN diana amplificado se inmoviliza sobre un soporte sólido, tal como una membrana de
5 nailon. El complejo membrana-diana se incuba con la sonda marcada en condiciones de hibridación adecuadas, la
sonda no hibridada se elimina mediante lavado en condiciones rigurosas adecuadas y se inspecciona la membrana
para determinar la presencia de sonda unida.

En el formato dot-blot inverso (o line-blot), las sondas se inmovilizan sobre un soporte sólido, tal como una
10 membrana de nailon o una placa de microvaloración. El ADN diana se marca, normalmente durante la amplificación,
mediante la incorporación de cebadores marcados. Se pueden marcar uno o los dos cebadores. El complejo de
membrana-sonda se incuba con el ADN diana amplificado marcado en condiciones de hibridación adecuadas, el
ADN diana no hibridado se elimina mediante lavado en condiciones rigurosas adecuadas y la membrana se
inspecciona para determinar la presencia de ADN diana unido. En el ejemplo se describe un ensayo de detección
15 line-blot inverso.

b. Cebadores específicos de alelos

Los indeles también se pueden detectar utilizando procedimientos de amplificación específica de alelos o de
20 extensión de cebadores. Estas reacciones generalmente implican el uso de cebadores que están diseñados para
dirigirse específicamente a un polimorfismo por medio de un error de apareamiento en el extremo 3' de un cebador.
La presencia de un error de apareamiento afecta a la capacidad de una polimerasa de extender un cebador cuando
la polimerasa carece de actividad correctora de errores. Por ejemplo, para detectar una secuencia de alelos usando
un procedimiento basado en amplificación específica de alelos o en extensión, se diseña un cebador
25 complementario al alelo normal de un microsatélite (es decir, sin indeles) de forma que el nucleótido del extremo
terminal 3' se hibride con la secuencia que contiene el número correcto de repeticiones. La presencia del alelo
particular puede determinarse por la capacidad del cebador para iniciar la extensión. Si el extremo terminal 3'
presenta un error de apareamiento, se impide la extensión.

30 En algunas formas de realización, el cebador se utiliza junto con un segundo cebador en una reacción de
amplificación. El segundo cebador se hibrida en un sitio no relacionado con el microsatélite. La amplificación se
produce a partir de los dos cebadores, dando lugar a un producto detectable que significa que la forma alélica
particular está presente. Los procedimientos basados en amplificación específica de alelos o en extensión se
describen en, por ejemplo, el documento WO 93/22456, las patentes de Estados Unidos Nº 5.137.806, 5.595.890,
35 5.639.611 y la patente de Estados Unidos Nº 4.851.331.

Utilizando genotipado basada en amplificación específica de alelos, la identificación de los alelos requiere solo la
detección de la presencia o la ausencia de secuencias diana amplificadas. Los procedimientos para la detección de
secuencias diana amplificadas son bien conocidos en la técnica. Por ejemplo, electroforesis en gel y los ensayos de
40 hibridación de sonda descritos se utilizan a menudo para detectar la presencia de ácidos nucleicos.

En un procedimiento alternativo sin sonda, el ácido nucleico amplificado se detecta supervisando el aumento en la
cantidad total de ADN bicatenario en la mezcla de reacción, y se describe, por ejemplo, en la patente de Estados
Unidos Nº 5.994.056; y las publicaciones de patente europeas Nº 487.218 y 512.334. La detección de ADN
45 bicatenario diana se basa en el aumento de la fluorescencia de varios tintes de unión a ADN, por ejemplo, SYBR
Green, que se muestra cuando se unen a ADN bicatenario.

Como apreciará un experto en la técnica, los procedimientos de amplificación específica de alelos se pueden realizar
en reacciones que emplean múltiples cebadores específicos de alelos para dirigirse a alelos particulares. Los
50 cebadores para dichas aplicaciones multiplex generalmente se marcan con marcas distinguibles o se seleccionan de
forma que los productos de amplificación producidos a partir de los alelos sean distinguibles por tamaño. Así, por
ejemplo, ambos alelos pueden identificarse en una sola muestra utilizando una única amplificación mediante análisis
en gel del producto de amplificación.

55 Como en el caso de las sondas específicas de alelo, un cebador oligonucleotídico específico de alelo puede ser
exactamente complementario a uno de los alelos polimórficos en la región de hibridación o puede tener algunos
errores de apareamiento en posiciones distintas del extremo terminal 3' del oligonucleótido, que dan lugar a errores
de apareamiento en sitios no polimórficos en ambas secuencias de alelos.

60 c. Sondas detectables

i) Sondas de ensayo de 5'-nucleasa

El genotipado también se puede realizar utilizando un "TaqMan®" o "ensayo de 5'-nucleasa", tal como se describe en
65 las patentes de Estados Unidos Nº 5.210.015, 5.487.972 y 5.804.375; y Holland et al., 1988, Proc. Natl. Acad. Sci.
USA 88: 7276-7280. En el ensayo TaqMan®, se añaden durante la reacción de amplificación sondas de detección
182
ES 2 906 023 T3

marcadas que se hibridan dentro de la región amplificada. Las sondas se modifican para evitar que actúen como
cebadores para la síntesis de ADN. La amplificación se realiza usando una ADN polimerasa que tiene actividad de
exonucleasa 5' a 3'. Durante cada etapa de síntesis de la amplificación, cualquier sonda que se hibrida con el ácido
nucleico diana cadena abajo del cebador en extensión se degrada por la actividad de exonucleasa 5' a 3' de la ADN
5 polimerasa. Por lo tanto, la síntesis de una nueva hebra diana también da como resultado la degradación de una
sonda, y la acumulación de producto de degradación proporciona una medida de la síntesis de secuencias diana.

La sonda de hibridación puede ser una sonda específica de alelo que discrimina entre los alelos con y sin indeles.
Alternativamente, el procedimiento se puede realizar usando un cebador específico de alelo y una sonda marcada
10 que se une al producto amplificado.

Se puede utilizar cualquier procedimiento adecuado para detectar el producto de degradación en un ensayo de 5'
nucleasa. A menudo, la sonda de detección se marca con dos tintes fluorescentes, uno de los cuales es capaz de
extinguir la fluorescencia del otro tinte. Los tintes se unen a la sonda, normalmente uno unido al extremo 5' y el otro
15 a un sitio interno, de modo que la extinción se produce cuando la sonda se encuentra en un estado no hibridado y de
tal modo que la escisión de la sonda por la actividad de exonucleasa 5' a 3' de la ADN polimerasa se produce entre
los dos tintes. La amplificación da como resultado la escisión de la sonda entre los tintes con una eliminación
concomitante de la extinción y un aumento en la fluorescencia observable del tinte inicialmente extinguido. La
acumulación de producto de degradación se supervisa mediante la medición del aumento de la fluorescencia de la
20 reacción. Las patentes de Estados Unidos Nº 5.491.063 y 5.571.673 describen ambas procedimientos alternativos
para detectar la degradación de la sonda que se produce concomitantemente con la amplificación.

ii) Sondas de estructura secundaria

25 Las sondas detectables tras un cambio estructural secundario también son adecuadas para la detección de un
polimorfismo, incluidos indeles. Las sondas de estructura secundaria o de estructura de tallo-bucle ejemplificadas
incluyen balizas moleculares o cebador/sondas Scorpion®. Las sondas de baliza molecular son sondas de ácido
oligonucleico monocatenario que pueden formar una estructura de horquilla en la que normalmente se colocan un
fluoróforo y un extintor en los extremos opuestos del oligonucleótido. En cualquier extremo de la sonda, las
30 secuencias complementarias cortas permiten la formación de un tallo intramolecular, lo que permite que el fluoróforo
y el extintor se dispongan en una proximidad estrecha. La porción de bucle de la baliza molecular es complementaria
a un ácido nucleico diana de interés. La unión de esta sonda a su ácido nucleico diana de interés forma un híbrido
que fuerza la separación del tallo. Esto provoca un cambio de conformación que aleja el fluoróforo y el extintor y da
lugar a una señal fluorescente más intensa. Las sondas de baliza molecular son, sin embargo, muy sensibles a una
35 pequeña variación de secuencia en la diana de la sonda (Tyagi S. y Kramer F. R., Nature Biotechnology, vol. 14,
páginas 303-308 (1996); Tyagi et al., Nature Biotechnology, vol. 16, páginas 49-53 (1998); Piatek et al., Nature
Biotechnology, vol. 16, páginas 359-363 (1998); Marras S. et al., Genetic Analysis: Biomolecular Engineering, vol.
14, páginas 151-156 (1999); Tpp I. et al, BioTechniques, Vol 28, páginas 732-738 (2000)). Un cebador/sonda
Scorpion® comprende una sonda de estructura de tallo-bucle unida covalentemente a un cebador.
40
d. Secuenciación de ADN y extensiones de una única base

Los indeles también se pueden detectar mediante secuenciación directa. Los procedimientos incluyen, por ejemplo,
procedimientos basados en secuenciación didesoxi y otros procedimientos tales como la secuencia de Maxam y
45 Gilbert (véase, por ejemplo, Sambrook et al., anteriormente).

Otros procedimientos de detección incluyen Pyrosequencing™ (pirosecuenciación) de productos de longitud de


oligonucleótido. Estos procedimientos emplean a menudo técnicas de amplificación tales como la PCR. Por ejemplo,
en la pirosecuenciación, un cebador de secuenciación se hibrida con una plantilla de ADN monocatenaria,
50 amplificada por PCR; y se incuba con las enzimas, ADN polimerasa, ATP sulfurilasa, luciferasa y apirasa, y los
sustratos, adenosina 5' fosfosulfato (APS) y luciferina. Se añade a la reacción el primero de cuatro desoxinucleótido
trifosfatos (dNTP). La ADN polimerasa cataliza la incorporación del desoxinucleótido trifosfato en la hebra de ADN, si
es complementario a la base presente en la hebra de plantilla. Cada evento de incorporación viene acompañado de
la liberación de pirofosfato (PPi) en una cantidad equimolar a la cantidad de nucleótido incorporado. La ATP
55 sulfurilasa convierte cuantitativamente PPi en ATP en presencia de adenosina 5' fosfosulfato. Este ATP impulsa la
conversión mediada por luciferasa de luciferina en oxiluciferina, lo que genera luz visible en cantidades que son
proporcionales a la cantidad de ATP. La luz producida en la reacción catalizada por luciferasa se detecta mediante
una cámara de dispositivo de carga acoplada (CCD) y se ve como un pico en un pyrogram™ (pirograma). Cada señal
de luz es proporcional al número de nucleótidos incorporados. La apirasa, una enzima que degrada los nucleótidos,
60 degrada continuamente los dNTP no incorporados y el exceso de ATP. Cuando se completa la degradación, se
añade otro dNTP.

Otro procedimiento similar para caracterizar indeles no requiere el uso de una PCR completa, sino que normalmente
utiliza solo la extensión de un cebador mediante una única molécula de ácido didesoxirribonucleico (ddNTP)
65 marcada con fluorescencia que es complementaria al nucleótido que se va a investigar. El nucleótido presente en el

183
ES 2 906 023 T3

sitio polimórfico se puede identificar mediante la detección de un cebador que se ha extendido por una base y está
marcado de forma fluorescente (por ejemplo, Kobayashi et al., Mol. Cell. Probes, 9: 175-182, 1995).

e. Electroforesis
5
Los productos de amplificación generados utilizando la reacción en cadena de la polimerasa se pueden analizar
mediante el uso de electroforesis en gel de gradiente desnaturalizante. Se pueden identificar diferentes alelos
basándose en las diferentes propiedades de fusión dependientes de la secuencia y la migración electroforética del
ADN en solución (véase, por ejemplo, Erlich, ed., PCR Technology, Principles and Applications for DNA
10 Amplification, W. H. Freeman and Co, Nueva York, 1992, Capítulo 7).

La distinción de polimorfismos de microsatélites se puede realizar mediante electroforesis capilar. La electroforesis


capilar permite convenientemente la identificación del número de repeticiones en un alelo microsatélite particular. La
aplicación de la electroforesis capilar al análisis de polimorfismos de ADN es bien conocida por los expertos en la
15 técnica (véase, por ejemplo, Szantai, et al., J Chromatogr A. (2005) 1079 (1-2): 41-9; Bjorheim y Ekstrom,
Electrophoresis (2005) 26 (13): 2520-30 y Mitchelson, Mol Biotechnol. (2003) 24 (1): 41-68).

f. Análisis de polimorfismo de conformación monocatenaria

20 Los alelos de secuencias diana pueden diferenciarse utilizando el análisis de polimorfismo de conformación
monocatenaria, que identifica diferencias de bases mediante la alteración en la migración electroforética de
productos de PCR monocatenarios, tal como se describe, por ejemplo, por Orita et al., Proc. Nat. Acad. Sci. 86,
2766-2770 (1989). Los productos de PCR amplificados pueden generarse tal como se ha descrito anteriormente, y
calentarse o desnaturalizarse de otro modo, para formar productos de amplificación monocatenarios. Los ácidos
25 nucleicos monocatenarios pueden replegarse o formar estructuras secundarias que dependen parcialmente de la
secuencia de bases. Las diferentes movilidades electroforéticas de los productos de amplificación monocatenarios
pueden estar relacionadas con la diferencia de secuencia de bases entre alelos de genes diana.

g. Análisis de la curva de fusión


30
El análisis de la curva de fusión es una evaluación de las características de disociación del ADN bicatenario durante
el calentamiento. A medida que aumenta la temperatura, la doble hebra comienza a disociarse, lo que produce un
aumento en la intensidad de la absorbancia, el efecto hipercrómico. La temperatura a la que se desnaturaliza el 50%
del ADN se conoce como punto de fusión (que no debe confundirse con el término punto de fusión utilizado en
35 física). La energía requerida para romper el enlace de hidrógeno base-base entre dos hebras de ADN depende de
su longitud, contenido de GC y su complementariedad. Debido al hecho de que los emparejamientos de bases G-C
tienen 3 enlaces de hidrógeno entre los mismos, mientras que los pares de bases A-T tienen solo 2, el ADN con un
contenido de G-C más alto tendrá una temperatura de fusión más alta que el ADN con un contenido de A-T más alto.
Al calentar una mezcla de reacción que contiene secuencias de ADN bicatenario y medir la disociación frente a la
40 temperatura, se puede determinar la presencia y la identidad de polimorfismos de un solo nucleótido (SNP).

Originariamente, la disociación de hebras se observó mediante mediciones de absorbancia UV, pero las técnicas
basadas en mediciones de fluorescencia son ahora el enfoque más común. La disociación dependiente de la
temperatura entre dos hebras de ADN se puede medir utilizando un fluoróforo intercalador de ADN, tal como SYBR
45 green, EvaGreen o sondas de ADN marcadas con fluoróforo.

Una técnica alternativa es el análisis de fusión de alta resolución (HRM). Están disponibles comercialmente muchos
tintes e instrumentos de alta resolución para realizar análisis de curvas de fusión o HRM; incluidas la mayor parte de
las máquinas qPCR.
50
Los procedimientos de detección de indeles a menudo emplean oligonucleótidos marcados. Los oligonucleótidos se
pueden marcar incorporando un marcador detectable por medios espectroscópicos, fotoquímicos, bioquímicos,
inmunoquímicos o químicos. Los marcadores útiles incluyen tintes fluorescentes, marcadores radiactivos, por
ejemplo 32P, reactivos densos en electrones, enzimas, tales como peroxidasa o fosfatasa alcalina, biotina o
55 haptenos y proteínas para las que se encuentran disponibles antisueros o anticuerpos monoclonales. Las técnicas
de marcado son bien conocidas en la técnica (véase, por ejemplo, Sambrook et al., anteriormente).

Los marcadores de indeles de microsatélites proporcionados en el presente documento se pueden detectar


utilizando cualquiera de estas tecnologías u otras; el panel de marcadores es independiente de la tecnología
60 utilizada. Sin embargo, está particularmente previsto que la determinación de la presencia de un indel no se realice
mediante un procedimiento basado en la secuenciación de Sanger. Esto se debe a que el proceso de detección de
la inestabilidad microsatelital mediante el panel de marcadores Bethesda se realiza normalmente mediante la
secuenciación de Sanger, un protocolo que resulta bastante engorroso. Según formas de realización adicionales, se
prevé particularmente determinar la presencia de un indel a través de procedimientos de extensión de un solo par de
65 bases (tales como Sequenom MassArray), tecnologías de hibridación de ADN (por ejemplo, Taqman), análisis de
curva de fusión o una tecnología similar.
184
ES 2 906 023 T3

Según otro aspecto, el panel de biomarcadores tal como se describe en el presente documento se proporciona para
su uso como diagnóstico. En particular, se prevé que este panel de biomarcadores se pueda utilizar para detectar el
estado de la MSI en un cáncer o para determinar la MSI en una muestra tumoral. En consecuencia, el uso de este
5 panel de biomarcadores se proporciona en el diagnóstico de inestabilidad microsatelital (o del estado de MSI) en el
cáncer.

Aunque también se prevé explícitamente el uso de menos marcadores, los paneles de biomarcadores
particularmente adecuados para determinar la MSI en una muestra tumoral son paneles de biomarcadores que
10 comprenden al menos ocho marcadores (regiones de microsatélites). Dicho panel de biomarcadores comprende al
menos ocho regiones de microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los
genes enumerados en la tabla 1 y las presentes en los exones de los genes enumerados en la tabla 2. Los, al
menos ocho, marcadores pueden ser al menos 10 marcadores, al menos 12 marcadores, al menos 16 marcadores,
al menos 20 marcadores, al menos 25 marcadores o incluso más. Según formas de realización muy particulares, el
15 panel de biomarcadores comprende al menos la mitad de las regiones de microsatélites enumeradas en la tabla 3.
Según otras formas de realización particulares más, el panel de biomarcadores está representado por las 56
regiones de microsatélites enumeradas en la tabla 3.

Según formas de realización particulares, los marcadores se seleccionan de aquellos que son más recurrentes, es
20 decir, marcadores que aparecen en al menos un tercio o al menos la mitad de los tumores deficientes en MMR. En
consecuencia, los marcadores se seleccionan de los marcadores que aparecen al menos 5 veces de 16 (por
ejemplo, en las tablas 1 y 2, o en las tablas 4 y 5), 6 veces de 16, 7 veces de 16 o al menos 8 veces de 16 tumores.
O aparecen al menos 4 veces de 11 (por ejemplo, en la tabla 6 y 7), al menos 5 veces de 11, al menos 6 veces de
11 tumores.
25
Según otras formas de realización más, se proporciona un kit para determinar MSI en una muestra tumoral, que
comprende las herramientas para genotipar el panel de biomarcadores (es decir, las, al menos ocho, regiones de
microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla
1 y las presentes en los exones de los genes enumerados en la tabla 2). Más particularmente, el kit se adaptará al
30 panel o paneles de biomarcadores particularmente previstos. Según formas de realización específicas, el kit también
puede contener las herramientas para genotipar el panel de marcadores Bethesda, o el panel de marcadores
Bethesda ampliado. Dichos kits son especialmente adecuados para realizar una comparación lado a lado de los
marcadores con el panel Bethesda. También se prevé que un kit solo tome un subconjunto del panel de marcadores
Bethesda (por ejemplo, de 1 a 5 marcadores en lugar de los 10). En tal caso, se prevé explícitamente que se
35 incluyan los marcadores BAT25 y BAT26, ya que generalmente se consideran los más fiables. No hace falta decir
que esto también significa que los procedimientos de diagnóstico de MSI descritos en el presente documento
también pueden contener además una etapa de determinación del estado de uno o más marcadores del panel de
marcadores Bethesda ampliado (además del uso de los marcadores descritos en el presente documento).

40 Tal como se muestra en la sección Ejemplos (particularmente en los ejemplos 8 y 9), los marcadores de indeles
proporcionados en el presente documento están enriquecidos en genes implicados en las vías de reparación de
roturas de doble hebra de ADN y afectan a su funcionalidad. Como consecuencia, las células en las que están
presentes estos marcadores son sensibles a letalidad sintética mediante la inhibición de la reparación por escisión
de bases de ADN. Esto ofrece nuevas oportunidades terapéuticas, ya que los tumores positivos a MSI a menudo
45 son resistentes a las quimioterapias estándar utilizadas.

En consecuencia, en un aspecto adicional, se proporcionan procedimientos de cribado de la sensibilidad de células


cancerosas al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN, que
comprende determinar el estado de MSI en las células cancerosas. Según formas de realización particulares, el
50 inhibidor de una enzima de reparación por escisión de bases de ADN es un inhibidor de PARP. Según formas de
realización específicas, las células cancerosas son de un cáncer seleccionado de la lista de: cáncer colorrectal,
cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un tumor del síndrome de Lynch. Según otras
formas de realización específicas, las células cancerosas son de un cáncer resistente a una terapia estándar. Se
prevé particularmente que dicha terapia estándar se seleccione de entre 5-FU (5-fluorouracilo, efudex), carboplatino,
55 cisplatino o terapia dirigida (particularmente terapia dirigida dirigida contra EGFR (por ejemplo, gefitinib, erlotinib,
cetuximab, panitumumab) o contra Braf. Aunque estos procedimientos pueden realizarse en principio in vivo, ex vivo
e in vitro, se prevé particularmente que se realicen in vitro.

Según formas de realización particulares, la presencia de MSI es indicativa de la sensibilidad de las células
60 cancerosas al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN; es decir, las
células cancerosas morirán, dejarán de crecer o proliferarán menos cuando se traten con dicho inhibidor.

Según formas de realización específicas, las células cancerosas son células obtenidas de un sujeto, y el cribado de
la sensibilidad al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN se utiliza
65 para guiar el tratamiento del sujeto. Según formas de realización alternativas, el cribado de sensibilidad se usa para
estratificar o clasificar al sujeto para un ensayo clínico.
185
ES 2 906 023 T3

Según formas de realización particulares, la presencia de MSI se establece mediante un procedimiento descrito en
el presente documento, es decir, un procedimiento que comprende determinar la presencia de un indel en al menos
dos regiones de microsatélites en una muestra del ADN tumoral, en el que las, al menos dos, regiones de
5 microsatélites son

- al menos dos regiones de microsatélites presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en
la tabla 1, o

10 - al menos tres regiones de microsatélites seleccionadas de las presentes en los exones de los genes
enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1,

en el que la presencia de al menos un indel es indicativa de MSI.

15 Según otras formas de realización particulares, la presencia de MSI se establece usando un panel de biomarcadores
tal como se describe en el presente documento, es decir, un panel de biomarcadores que comprende al menos ocho
regiones de microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes
enumerados en la tabla 1 y los presentes en los exones de los genes enumerados en la tabla 2. Según otras formas
de realización específicas más, el panel de biomarcadores comprende al menos ocho regiones de microsatélites
20 seleccionadas de las enumeradas en la tabla 3.

Según formas de realización muy específicas, los procedimientos también pueden comprender una etapa de
secuenciación de genes implicados en la vía de recombinación homóloga.

25 Por lo tanto, no solo se proporcionan procedimientos de cribado de la sensibilidad de las células cancerosas, sino
también procedimientos para diagnosticar la sensibilidad de un sujeto con cáncer al tratamiento con un inhibidor de
una enzima de reparación por escisión de bases de ADN, que comprenden las etapas siguientes:

- determinar el estado de MSI en una muestra de células cancerosas obtenidas del sujeto;
30
- correlacionar el estado de MSI con la sensibilidad al tratamiento con un inhibidor de una enzima de reparación
por escisión de bases de ADN, en los que la presencia de MSI es indicativa de sensibilidad al tratamiento.

Opcionalmente, estos procedimientos contienen una etapa adicional de obtención de una muestra de células
35 cancerosas del sujeto (antes de la etapa de determinación). La determinación del estado de MSI generalmente se
realiza en las células de la muestra obtenida. En particular, se prevé que la determinación del estado de MSI en una
muestra de células cancerosas se realice in vitro.

Según formas de realización particulares, el inhibidor de una enzima de reparación por escisión de bases de ADN es
40 un inhibidor de PARP. Según formas de realización específicas, las células cancerosas provienen de un cáncer
seleccionado de la lista de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un
tumor del síndrome de Lynch (o cualquier otro tumor del espectro del síndrome de Lynch). Según formas de
realización particulares, la presencia de MSI se establece mediante un procedimiento descrito en el presente
documento, es decir, un procedimiento que comprende determinar la presencia de un indel en al menos dos
45 regiones de microsatélites en una muestra del ADN tumoral, en el que las, al menos dos, regiones de microsatélites
son

- al menos dos regiones de microsatélites presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en
la tabla 1, o
50
- al menos tres regiones de microsatélites seleccionadas de las presentes en los exones de los genes
enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1,

en el que la presencia de al menos un indel es indicativa de MSI.


55
Según otras formas de realización particulares, la presencia de MSI se establece usando un panel de biomarcadores
tal como se describe en el presente documento, es decir, un panel de biomarcadores que comprende al menos ocho
regiones de microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes
enumerados en la tabla 1 y las presentes en los exones de los genes enumerados en la tabla 2.
60
También se prevé que los procedimientos según este aspecto pueden contener una etapa adicional de tratamiento
al sujeto con un inhibidor de una enzima de reparación por escisión de bases de ADN (si el sujeto es sensible a
dicho tratamiento, según se determina mediante el estado de MSI).

65 Por lo tanto, también se proporcionan procedimientos para tratar un cáncer con MSI (o, de forma equivalente,
deficiencia en MMR) en un sujeto que lo necesita, que comprenden:
186
ES 2 906 023 T3

- establecer la presencia de MSI en el cáncer;

- administrar un inhibidor de una enzima de reparación por escisión de bases de ADN al sujeto.
5
Para procedimientos relacionados con el diagnóstico de la sensibilidad de un sujeto con cáncer al tratamiento con un
inhibidor de una enzima de reparación por escisión de bases de ADN, o al tratamiento de un sujeto que tiene cáncer
con MSI, se prevé particularmente que este cáncer sea resistente a al menos una terapia estándar, particularmente
una terapia estándar seleccionada de entre 5-FU (5-fluorouracilo, efudex), carboplatino, cisplatino o terapia dirigida
10 (particularmente terapia dirigida, dirigida contra EGFR (por ejemplo, gefitinib, erlotinib, cetuximab, panitumumab) o
contra Braf.

Se prevé que el cáncer se trate administrando el inhibidor al sujeto. Los procedimientos pueden tener opcionalmente
una etapa adicional de obtención de una muestra de células cancerosas del sujeto (antes de la etapa de
15 determinación de MSI y de establecer la presencia de MSI).

Según formas de realización particulares, el inhibidor de una enzima de reparación por escisión de bases de ADN es
un inhibidor de PARP. Según formas de realización específicas, las células cancerosas son de un cáncer
seleccionado de la lista de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un
20 tumor del síndrome de Lynch. Según formas de realización particulares, la presencia de MSI se establece mediante
un procedimiento descrito en el presente documento, es decir, un procedimiento que comprende determinar la
presencia de un indel en al menos dos regiones de microsatélites en una muestra del ADN tumoral, en el que las, al
menos dos, regiones de microsatélites son

25 - al menos dos regiones de microsatélites presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en
la tabla 1, o

- al menos tres regiones de microsatélites seleccionadas de las presentes en los exones de los genes
enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1,
30
en el que la presencia de al menos un indel es indicativa de MSI.

Según otras formas de realización particulares, la presencia de MSI se establece usando un panel de biomarcadores
tal como se describe en el presente documento, es decir, un panel de biomarcadores que comprende al menos ocho
35 regiones de microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes
enumerados en la tabla 1 y las presentes en los exones de los genes enumerados en la tabla 2.

Debe entenderse que aunque se han abordado en el presente documento formas de realización particulares,
configuraciones específicas así como materiales y/o moléculas para células y procedimientos según la presente
40 invención, se pueden realizar varios cambios o modificaciones en la forma y detalle sin apartarse del alcance y el
espíritu de la presente invención. Los ejemplos siguientes se proporcionan para ilustrar mejor las formas de
realización particulares y no deben considerarse limitantes de la solicitud. La solicitud está limitada solo por las
reivindicaciones.

45 Ejemplos

Ejemplo 1. Secuenciación del genoma completo de un tumor endometrial con deficiencia en MMR

Para seleccionar tumores deficientes en MMR para la secuenciación del genoma completo, se utilizaron pruebas
50 diagnósticas estándar, incluidas inmunohistoquímica de proteínas MMR (MLH1, MSH2 y MSH6), evaluación de la
inestabilidad microsatelital (MSI) utilizando el panel Bethesda ampliado (Pinol et al., 2005) y perfilado de metilación
del promotor MLH1. Los resultados de inmunohistoquímica e hipermetilación del promotor MLH1 se muestran como
las 3 líneas superiores en la tabla 9. El estado de inestabilidad microsatelital (MSI) se analizó en 10 loci diferentes
que contenían secuencias de repetición mononucleotídicas o dinucleotídicas (respectivamente 2 y 8 marcadores),
55 utilizando el panel recomendado por las directrices internacionales para la evaluación de la MSI, es decir, el panel
Bethesda revisado (Boland et al., 1998; Dietmaier et al., 1997). Las amplificaciones por PCR se realizaron en dos
pentaplexos: Multiplex A (BAT25, BAT26, D5S346, D17S250, D2S123) y multiplex B (BAT40, D17S787, D18S58,
D18S69, TGFβ-RII). Los cebadores directos se marcaron con 6-FAM, HEX, VIC o TET. Los amplicones de ADN
tumoral y normal del mismo paciente se analizaron en un analizador genιtico ABI 3130 (Applied Biosystems). El
60 tumor 1 fue fuertemente positivo a 7 de los 8 marcadores exitosos, mientras que los otros dos tumores fueron
negativos. Esto confirma que el tumor 1 es deficiente en MMR. Los resultados se resumen en la tabla 10. En la tabla
11 se incluye mαs informaciσn sobre las muestras tumorales.

Se seleccionaron un tumor EM deficiente en MMR, que presentaba un estado MSI positivo y ausencia de expresión
65 de MSH6 (tabla 9), y dos tumores EM competentes en MMR. Usando tecnología Complete Genomics® (CG),
obtuvimos datos de secuenciación de alta cobertura del tumor y muestras normales correspondientes (en promedio
187
ES 2 906 023 T3

95,2x y 77,1x, respectivamente), que posteriormente se analizaron utilizando una anotación y un conducto de filtrado
previamente desarrollados (Reumers et al., 2011). El tumor deficiente en MMR mostró un fenotipo hipermutador
claro, que contenía mutaciones somáticas significativamente más novedosas que los otros tumores utilizando el
procedimiento calldiff de CGAtools™ verificado (http://cgatools.sourceforge.net) (tabla 12, mutaciones somáticas
5 usando calldiff). Este algoritmo está diseñado para encontrar diferencias entre dos genomas del mismo individuo,
tales como un par tumor-normal.

A continuación, aplicamos un umbral de puntuación de calidad basado en la validación independiente de mutaciones


seleccionadas aleatoriamente, lo que dio como resultado una precisión general de la llamada de mutación estimada
10 en el 94,6%. Esto confirmó que la carga de mutación del tumor deficiente en MMR era 20,3 veces superior (figura 1a
y tabla 12). La inspección detallada de variantes somáticas en la muestra de hipermutador reveló una inserción de
desplazamiento de marco somática en el exón 5 de MSH6 (F1088fs; Nota S2) que era coherente con la ausencia de
expresión de MSH6. No se encontraron mutaciones en las ADN polimerasas, tales como POLE. De hecho, de las 34
ADN polimerasas conocidas, solo REV3L se mutó somática en el hipermutador. Sin embargo, dado que REV3L está
15 involucrada en la síntesis de ADN de translesión, es poco probable que una mutación en REV3L cause nuestro
fenotipo hipermutador. Además, el análisis del número de copias se realizó utilizando el algoritmo ASCAT (Van Loo
et al., 2010). ASCAT está diseñado específicamente para detectar aberraciones en el número de copias en muestras
tumorales. Determina con precisión el número de copias específicas de alelos en tumores sólidos estimando y
ajustando la ploidía tumoral general y la fracción tumoral eficaz en la muestra. A diferencia de los tumores
20 competentes en MMR, el hipermutador es un tumor cromosómico estable (datos no mostrados).

Tabla 9. Pruebas diagnósticas estándar para evaluar la deficiencia en MMR. Todos los tumores se secuenciaron
utilizando o bien tecnología de secuenciación del genoma completo Complete Genomics (CG) o bien
enriquecimiento del exoma Truseq combinado con tecnología de secuenciación de Illumina. Para cada tumor, se
25 muestran la inestabilidad microsatelital (MSI) utilizando el panel Bethesda ampliado, la inmunohistoquímica estándar
de las proteínas MMR (MLH1, MSH2 y MSH6) y el estado de metilación del promotor MLH1. Los asteriscos (*)
indican la presencia de una tinción nuclear positiva débil en una minoría de las células tumorales.

Tecnología de IHC IHC IHC Hipermetilación de


Tumor Tipo de tumor MSI
secuenciación MLH1 MSH2 MSH6 MLH1
MMR- 1 Genoma completo CG Endometrial + + - (*) + -
MMR+ 1 Genoma completo CG Endometrial + + + - +
MMR+ 2 Genoma completo CG Endometrial + + + - -
MMR- 2 Exoma de Illumina Endometrial - (*) + - + +
MMR-3 Exoma de Illumina Endometrial - + + + +
MMR- 4 Exoma de Illumina Endometrial + - - - -
MMR-5 Exoma de Illumina Endometrial + - - + -
MMR- 6 Exoma de Illumina Endometrial + + - + -
MMR-7 Exoma de Illumina Endometrial - - - - +
MMR- 8 Exoma de Illumina Endometrial + - - - -
MMR- 9 Exoma de Illumina Colorrectal + - + + N/A
MMR- 10 Exoma de Illumina Colorrectal + + - + N/A
MMR-11 Exoma de Illumina Colorrectal - + + + N/A
MMR+ 3 Exoma de Illumina Endometrial + + + - -
MMR+ 4 Exoma de Illumina Endometrial + + + - -
MMR+ 5 Exoma de Illumina Endometrial + + + - -
MMR+ 6 Exoma de Illumina Endometrial + + + - -

30

188
ES 2 906 023 T3

189
ES 2 906 023 T3

Tabla 11. Muestras tumorales e información clínica. La tabla enumera información detallada para las tres muestras
tumorales seleccionadas. Todos los tumores eran tumores primarios, no tratados previamente con quimioterapia, de
5 pacientes sin antecedentes familiares de cánceres hereditarios.

Tumor Tumor Tipo Histopatología Grado Estadio


Tumor 1 MMR- 1 Endometrio Carcinoma endometrioide 3 IIIc
Tumor 2 MMR+ 1 Endometrio Carcinoma endometrioide 3 I
Tumor 3 MMR+ 2 Endometrio Carcinoma seroso 3 Ia

190
ES 2 906 023 T3

191
ES 2 906 023 T3

Ejemplo 2. Patrones de mutación somática en el hipermutador deficiente en MSH6

Los estudios en organismos modelo y líneas celulares revelaron que las mutaciones somáticas que se producen
debido a la deficiencia de MMR involucran principalmente inserciones/deleciones (indeles) que afectan a las
5 secuencias de microsatélites (repeticiones dinucleotídicas a hexanucleotídicas con una longitud mínima de 6 bases y
al menos dos unidades de repetición) y homopolímeros (repeticiones mononucleotídicas con una longitud mínima de
6 bases) (Ellegren, 2004). Para probar esta hipótesis, estratificamos el genoma en cuatro clases diferentes utilizando
las definiciones siguientes:

10 - Regiones de microsatélites: repeticiones di-, tri-, tetra-, penta- o hexanucleotídicas que constan de al menos dos
unidades repetidas y con una longitud mínima de 6 bases.

- Regiones homopoliméricas: repeticiones mononucleotídicas con una longitud mínima de 6 bases.

15 - Regiones homopoliméricas cortas: repeticiones mononucleotídicas de 3, 4 o 5 bases de longitud.

- Regiones de no repetición: el resto del genoma, es decir, cada base que no forma parte de una secuencia de
repetición simple.

20 Las regiones genómicas que siguen estas definiciones se determinaron escaneando los archivos de secuencia (en
formato FASTA) utilizando la herramienta "grepseq" (http://code.google.com/p/grepseq/). A nivel del genoma
completo, la composición general de repetición fue la siguiente: microsatélites (7,9%), homopolímeros (1,9%),
homopolímeros cortas (19,8%) y regiones no en repetición (70,4%).

25 En nuestro hipermutador, observamos que las mutaciones somáticas se ubican con mayor frecuencia en
homopolímeros de lo esperado en función de su aparición en el genoma completo (no se muestra). Observamos que
las mutaciones somáticas se acumulan con mayor frecuencia en homopolímeros (47,7%) en comparación con su
aparición en el genoma completo (1,9%). El 35,5%, el 10,7% y el 6,2% de las mutaciones somáticas se ubicaron en
regiones de no repetición, homopolímeros cortos y microsatélites, respectivamente. En comparación con la aparición
30 de estas regiones en el genoma completo (es decir, el 70,4%, el 19,8% y el 7,9% para regiones de no repetición,
homopolímeros cortos y microsatélites, respectivamente), las mutaciones somáticas se vieron afectadas con menos
frecuencia de lo esperado en estas regiones.

Además, observamos que los indeles eran de hecho más frecuentes que las sustituciones de pares de bases
35 individuales (57,4% de indeles frente a 42,6% de sustituciones; figura 1b), pero afectaban predominantemente a los
homopolímeros (81,3%) y no a los microsatélites (figura 1c). Las sustituciones no afectaron preferentemente a los
homopolímeros o los microsatélites (figura 1d). Las mutaciones se produjeron con tanta frecuencia en los intrones
como en el resto del genoma, pero claramente menos en los exones (excluyendo las regiones no traducidas (UTR)
5' y 3'). Para indeles, esta disminución fue más pronunciada que para sustituciones (74,7% frente a 14,3%; figuras
40 1e,f). La corrección por el número de homopolímeros o la longitud de homopolímeros en las regiones exónicas,
intergénicas e intrónicas confirmó que esta reducción no podía atribuirse a menos homopolímeros o a
homopolímeros más cortos. La mayor parte de los indeles exónicos dieron como resultado mutaciones de
desplazamiento de marco heterocigóticas (160 indeles de desplazamiento de marco frente a 3 indeles sin
desplazamiento de marco), lo que sugiere que son mutaciones de pérdida de función que experimentan una
45 selección clonal negativa.

Sustituciones somáticas en el hipermutador deficiente en MSH6

Los estudios que evaluaron las sustituciones somáticas en un melanoma inducido por luz ultravioleta (Pleasance et
50 al., 2010a) y un adenocarcinoma de pulmón inducido por humo de tabaco (Pleasance et al., 2010b) revelaron que,
respectivamente, tienen lugar con frecuencia transiciones G:C>A:T y transversiones G:C>T:A en estos tumores. Al
evaluar las sustituciones somáticas en nuestro hipermutador, se observó un patrón claramente distinto, en el que el
71,5% de todas las sustituciones representaron transiciones A:T>G:C y G:C>A:T en comparación con solo el 50,1%
en los tumores competentes en MMR (figura 2a). Sorprendentemente, en el hipermutador, las transiciones G:C>A:T
55 ocurrieron con mayor frecuencia en el contexto de un dinucleótido CG (en el que C experimenta la sustitución y G
representa el nucleótido siguiente), mientras que las transiciones A:T>G:C ocurrieron independientemente del
contexto de dinucleótidos y con mayor frecuencia que en los tumores competentes en MMR (figuras 2b-c).

A continuación, para identificar aquellas características que proporcionan un mejor ajuste al patrón de mutación del
60 hipermutador, usamos regresión lineal para correlacionar los diversos tipos de sustituciones con 9 características
genómicas previamente implicadas en la explicación de la variabilidad genética en la población humana (Hodgkinson
y Eyre-Walker, 2011) (figura 2d; las 9 características son la distancia al telómero, el tiempo de replicación, las
repeticiones simples, la composición de GC, el contenido de CpG, la isla CpG, el contenido de génico, la
hipersensibilidad a la DNasa y los sitios de unión de la lámina nuclear). Aunque no pudimos observar una
65 correlación con el contenido de genes, la hipersensibilidad a la DNasa o los dominios asociados a la lámina (no se
muestra), la distancia al telómero, el tiempo de replicación, el contenido de repetición simple, la composición de GC
192
ES 2 906 023 T3

(% de GC), la frecuencia de CpG y la fracción de islas CpG representaron predictores significativos e


independientes. En general, observamos un mejor modelo predictivo para las transiciones que para las
transversiones (R2= 0,22 frente a 0,07, respectivamente; figura 2d), mientras que a nivel individual se observaron las
siguientes correlaciones relevantes. En primer lugar, se encontró una correlación positiva entre el tiempo de
5 replicación y las transiciones, pero no las transversiones (figura 2e), lo que indica que la menor fidelidad de
replicación del ADN en la fase S tardía aumenta las mutaciones de transición pero no las transversiones, lo que
sugiere que el aumento observado anteriormente en transversiones de fase S tardías (Koren et al., 2012) puede
atribuirse a una menor actividad de MMR en ese momento, ya que la falta de una maquinaria de MMR constituye la
principal diferencia entre los conjuntos de datos actuales y los previamente investigados. En segundo lugar, para
10 repeticiones simples, se observó un aumento del 42% en sustituciones en las bases que flanquean inmediatamente
a los homopolímeros. Esto fue cierto tanto para las transiciones como para las transversiones, y muy probablemente
se relacione con el estancamiento de la ADN polimerasa dentro de secuencias repetitivas de ADN que da lugar a
una replicación propensa a errores (Hodgkinson y Eyre-Walker, 2011). En tercer lugar, el % de GC se correlacionó
inversamente con las frecuencias de transición y transversión. Esto se ha descrito previamente en numerosos
15 organismos, y aunque aún no ha surgido un modelo dominante para explicar esta correlación, nuestros datos indican
que la actividad diferencial de MMR no contribuye a este efecto. En cuarto lugar, las transiciones G:C>A:T en los
sitios CpG dependen en gran medida del contenido de CpG, pero están inversamente correlacionadas con la
fracción de islas CpG (figuras 2d). Debido a que la mayor parte de los CpG en el genoma, excepto los de las islas
CpG, están metilados, esto indica un vínculo con la metilación de la citosina similar a las mutaciones impulsadas por
20 desaminación, por lo que las transiciones CG>TG se producen a través del proceso espontáneo, independiente de la
replicación, de la desaminación de la citosina. Como la MMR se considera canónicamente asociada a la replicación,
el aumento mucho mayor en las transiciones CG>TG observado en los tumores deficientes en MMR en comparación
con los tumores competentes en MMR (3042 frente a 452 mutaciones) demuestra que la MMR no canónica,
independiente de la replicación, que se ha descrito recientemente a nivel molecular (Hombauer et al., 2011; Liu et
25 al., 2008; Pena-Diaz et al., 2012), es importante para la integridad del genoma. Finalmente, las frecuencias de las
islas CpG se relacionaron inversamente con las frecuencias generales de mutación. De hecho, las bases que se
encontraban fuera de las islas CpG tenían casi dos veces más probabilidades de sufrir mutaciones que las que
estaban dentro de las islas CpG (figura 2f). Es poco probable que la selección negativa explique esta disminución,
ya que las sustituciones exónicas no disminuyen en la misma medida. La metilación del ADN ofrece una explicación
30 alternativa a través del estancamiento de la polimerasa que puede inducir (Song et al., 2012), aunque otra
posibilidad es a través de la reparación por desaminación, que puede estar catalizada por polimerasas propensas a
errores.

En general, la mayor parte de las características genómicas que se correlacionan con la frecuencia de mutación en
35 la población general también se correlacionan con sustituciones somáticas en el tumor deficiente en MMR, lo que
sugiere que una parte considerable de la diversidad genética humana surge debido a errores de apareamiento que
escapan a MMR. En apoyo de esta noción, observamos frecuencias de mutación muy similares en el ADN somático
y de línea germinal del hipermutador, en las bases de datos 1000 Genomes Project y dbSNP de ratón
(respectivamente el 71,5%, el 68,3%, el 66,9% y el 67,1% de todas las sustituciones representaron transiciones). En
40 particular, la frecuencia de sustitución somática por unidad cromosómica (100 kb) en el hipermutador está
fuertemente correlacionada con el número de líneas germinales correspondientes (R2= 0,90 y 1000 Genomes
Project SNP (R2= 0,90) en la misma unidad, pero no con la frecuencia de sustitución somática en los genomas de
adenocarcinoma de pulmón o melanoma (R2= 0,53 y 0,37).

45 Indeles somáticos en el hipermutador deficiente en MSH6

A continuación, evaluamos el patrón de indeles somático en el hipermutador. Como era de esperar, dado que la
mayor parte de indeles se ubicaron en homopolímeros, se observó una fuerte correlación entre las repeticiones
simples y la frecuencia de indeles (figura 2g). Casi todos los indeles afectaron a los homopolímeros A o T (94,0%;
50 figura 2h), pero aunque el 92,2% de los homopolímeros consisten en bases A o T, los homopolímeros C o G
parecen igualmente propensos a acumular indeles. Además, hasta el 96,4% de los indeles consistían en
desplazamientos de marco de 1 o 2 pb (figura 2i), lo que confirma que MSH6 está involucrado principalmente en la
reparación de indeles de 1 o 2 pb. Las deleciones fueron ligeramente menos frecuentes que las inserciones (47,7%
frente a 52,3%; P < 10E-6). Al calcular para cada sustitución somática la distancia al indel somático más cercano,
55 observamos que las sustituciones se ubicaron, respectivamente, 3,8 y 3,4 veces más frecuentemente dentro de una
distancia < 5 o < 10 pb de lo esperado basándose en una distribución aleatoria de sustituciones e indeles (figura 2j).
De forma similar, aunque no hubo evidencia de kataegis (tormentas somáticas) (Nik-Zainal et al., 2012), las
sustituciones somáticas se agruparon 7,6 veces más frecuentemente que lo predicho por el modelado aleatorio
(figura 2k). Se observó el mismo agrupamiento de sustituciones en los tumores competentes en MMR (no se
60 muestra), aunque con una frecuencia general más baja, lo que sugiere que la aparición de estos agrupamientos está
suprimida por MMR. Sorprendentemente, estas observaciones son similares a los genomas eucariotas, en los que el
número de sustituciones se eleva cerca de otras sustituciones e indeles (McDonald et al., 2011; Tian et al., 2008).

65

193
ES 2 906 023 T3

Ejemplo 3. Secuenciación del exoma de tumores deficientes y competentes en la reparación de errores de


apareamiento y sus muestras normales correspondientes
Seleccionamos 10 tumores EM y CCR deficientes en MMR adicionales caracterizados por la ausencia de MLH1,
MSH2 o MSH6, así como 4 tumores competentes en MMR (tabla 9, tabla 13). Por lo tanto, en total, se recolectaron
14 pares tumor-normal para la secuenciación del exoma, incluidos 11 tumores endometriales (EM) y sus muestras
de línea germinal correspondiente y 3 tumores colorrectales (CCR) y sus pares de línea germinal correspondiente.
5 Todos los tumores eran primarios, no tratados previamente con quimioterapia. El ADN del tumor se obtuvo a partir
de tejido tumoral recién congelado, mientras que el ADN de la línea germinal correspondiente para estas muestras
se extrajo de glóbulos blancos periféricos. La información clínica detallada para todas estas muestras se enumera en
la tabla 13. Además, se incluyeron en el análisis 5 líneas celulares de tumores endometriales primarios que son
deficientes en MMR, de modo que se alcanzara un total de 16 muestras de tumores deficientes en MMR.
10
Tabla 13. Información clínica para muestras tumorales adicionales

Tumor Tipo Histopatología Grado Estadio


1 MMR- 2 Endometrio Carcinoma endometrioide 3 IIIa
2 MMR- 3 Endometrio Carcinoma endometrioide 2 Ib
3 MMR- 4 Endometrio Carcinoma endometrioide 3 II
4 MMR- 5 Endometrio Carcinoma endometrioide 2 Ia
5 MMR- 6 Endometrio Carcinoma seroso 3 Ib
6 MMR- 7 Endometrio Célula endometrioide/ clara 3 Ia
7 MMR- 8 Endometrio Célula serosa/clara 3 Ib
8 MMR- 9 Colon Adenocarcinoma 3 IIa
9 MMR- 10 Colon Adenocarcinoma 2 IIIc
10 MMR- 11 Colon Adenocarcinoma 2 IIa
11 MMR+ 3 Endometrio Carcinoma endometrioide 1 IIIc
12 MMR+ 4 Endometrio Carcinoma seroso 3 IIIa
13 MMR+ 5 Endometrio Carcinoma mucinoso 2 IIIa
14 MMR+ 6 Endometrio Carcinoma endometrioide 1 Ia

3.1 Pruebas diagnósticas estándar


15
Las tablas 14 y 15 siguientes describen los resultados de pruebas diagnósticas estándar en la determinación de MSI
(inmunohistoquímica de genes MMR MLH1, MSH2 y MSH6; estado de hipermetilación de las regiones promotoras
de MLH1; inestabilidad microsatelital utilizando el panel Bethesda ampliado de 8 marcadores de repetición de
dinucleótidos y 2 de mononucleótidos) realizados en los tumores endometriales y colon secuenciados. En los
20 experimentos de inmunohistoquímica, un asterisco (*) indica una tinción nuclear positiva débil en una minoría de las
células tumorales. La clasificación del estado de deficiencia en MMR se realizó mediante inmunohistoquímica de las
principales proteínas MMR (MLH1, MSH2 y MSH6). Cuando cualquiera de estas proteínas estaba ausente en el
núcleo de las células tumorales, el tumor se clasificó como deficiente en MMR (MMR-), de lo contrario, como
competente en MMR (MMR+).
25
Tabla 14. Pruebas diagnósticas estándar para evaluar la deficiencia en MMR

Tumor IHC MLH1 IHC MSH2 IHC MSH6 MSI (Bethesda) Hipermetilación de MLH1
MMR- 2 - (*) + - + +
MMR- 3 - + + + +
MMR- 4 + - - - -
MMR- 5 + - - + -
MMR- 6 + + - + -
MMR- 7 - - - - +
MMR- 8 + - - - -
MMR- 9 + - + + N/A
MMR- 10 + + - + N/A
MMR- 11 - + + + N/A

194
ES 2 906 023 T3

(continuación)

Tumor IHC MLH1 IHC MSH2 IHC MSH6 MSI (Bethesda) Hipermetilación de MLH1
MMR+ 3 + + + - -
MMR+ 4 + + + - -
MMR+ 5 + + + - -
MMR+ 6 + + + - -

Para la prueba de inestabilidad microsatelital, a continuación se enumeran los resultados detallados de todos los
5 marcadores incluidos en el panel Bethesda ampliado.

Tabla 15. Datos sobre el panel Bethesda ampliado

Tumor MTD 25 MTD 26 D5S346 D17S250 D2S123 TGFB MTD 40 D18S58 D17S787 D18S69
MMR- 2 + + + N/A N/A N/A - N/A - +
MMR- 3 - + - + + + - + - -
MMR- 4 - - - - - - N/A - - -
MMR- 5 + - + + + + N/A - - -
MMR- 6 + - + + + - + - - +
MMR- 7 - - - - - - - - - -
MMR- 8 - - - - - - - - - -
MMR- 9 + + + + + - + N/A + +
MMR- 10 + + + - + - + N/A + +
MMR- 11 + + + + - - + N/A + +
MMR+ 3 - - - - - - - - - -
MMR+ 4 - - - - - - - - - -
MMR+ 5 - - - - - - - - - -
MMR+ 6 - - - - - - - - - -

10 Sorprendentemente, los tumores MMR- 4, 7 y 8 fueron negativos a MLH1, MSH2 o MSH6 según lo evaluado por
inmunohistoquímica, pero no se identificaron como tumores positivos a MSI utilizando el panel Bethesda. Esta
observación muy probablemente ilustra que el panel Bethesda actual para el diagnóstico de MSI no reconoce varios
tumores positivos a MSI. Sin embargo, utilizando nuestro panel mejorado de 56 marcadores (tabla 3 y ejemplo 7),
pudimos confirmar que estos tumores deficientes en MMR eran positivos a MSI.
15
3.2 Secuenciación, mapeo y llamada de variantes para exomas secuenciados con la tecnología HiSeq2000 de
Illumina

La secuenciación del exoma del ADN del tumor y de la línea germinal correspondiente mediante una tecnología de
20 secuenciación independiente (Illumina®) revelaron que cada tumor deficiente en MMR contenía en promedio 1.497
eventos somáticos frente a 39 para los tumores competentes en MMR (aumento de 38,9 veces; figura 3a). En los
tumores deficientes en MMR, una gran mayoría de estos (78,4%) representaron sustituciones (figura 3b), la mayor
parte de las cuales fueron transiciones A:T>G:C y G:C>A:T (81,5%). Las mutaciones restantes representaron
indeles somáticos, que estaban muy enriquecidos en homopolímeros (55,9%).
25
En resumen, los exomas se capturaron utilizando el kit de enriquecimiento de exomas TruSeq de Illumina (8 rxns),
después del enriquecimiento, las bibliotecas enriquecidas se sometieron a secuenciación por Illumina (HiSeq 2000).
La secuenciación de extremos emparejados (2x75 pb) se realizó con kits TruSeq SBS. Se usó BWA para alinear las
lecturas sin procesar de cada carril de secuenciación (en formato fastq) con el genoma de referencia humano
30 (NCBI37/hg19) usando parámetros predeterminados. Las lecturas alineadas se procesaron y se clasificaron con
SAMtools (v.0.1.13) y los duplicados de PCR se eliminaron con Picard MarkDuplicates (http://picard.sourceforge.net,
v1.32). La recalibración de bases, el realineamiento local alrededor de indeles y la llamada de variantes de un solo
nucleótido se realizaron utilizando el kit GenomeAnalysisToolKit (GATK v1.0.4487). Adicionalmente, también
filtramos todas las variantes comunes de las listas de mutaciones somáticas. Esto se realizó utilizando varias pistas
35 de datos, que se aplicaron a las listas de variantes utilizando el comando intersectBed de BEDTools (Quinlan y Hall,
2010). Las sustituciones somáticas y los indeles se validaron mediante genotipado por Sequenom MassARRAY. Los
datos generales de mutación después del filtrado de calidad y la validación se proporcionan en la tabla 16.
195
ES 2 906 023 T3

196
ES 2 906 023 T3

Los efectos dependientes del contexto revelaron un fuerte efecto CG para las transiciones G:C>A:T (figura 3c).
Curiosamente, las sustituciones de novo de la línea germinal identificadas por secuenciación del exoma mostraron
efectos dependientes del contexto similares, lo que confirma la noción de que las mutaciones subyacentes a la
variación genética humana y la enfermedad surgen a menudo debido a errores de apareamiento que escapan a la
5 MMR (figura 3d). Además, aunque el número de eventos somáticos fue ligeramente superior en tumores CCR que
en tumores EM (en promedio, 2278 frente a 1161 eventos), no observamos diferencias claras en el patrón de
mutación entre ambos tipos de cáncer (no se muestra).

Asimismo, la estratificación de los patrones de mutación según la deficiencia de MLH1 o MSH2 no reveló diferencias
10 obvias. En particular, aunque observamos que los indeles eran ligeramente más comunes en los microsatélites
(12,0% y 11,2% frente al 5,4% en el exoma del hipermutador), los homopolímeros seguían siendo los más afectados
(figura 3e), lo que confirma que los indeles en tumores deficientes en MLH1 o en MSH2 afectan preferentemente a
los homopolímeros, en lugar de a los microsatélites.

15 Ejemplo 4. Selección clonal positiva y mutaciones recurrentes en tumores deficientes en MMR

4.1 Análisis de homopolímeros afectados de forma recurrente (mutaciones de punto caliente)

Mientras que la frecuencia de mutación observada en los exomas de tumores deficientes en MMR reveló evidencia
20 de selección negativa, algunas mutaciones también pueden ser objeto de selección positiva. Es más probable que
estas mutaciones aparezcan como mutaciones de punto caliente (recurrentes). Por lo tanto, evaluamos cuántos
homopolímeros se vieron afectados de forma recurrente en tumores deficientes en MMR. Por lo tanto, los 10
exomas deficientes en MMR, junto con el exoma extraído del genoma completo del hipermutador, se analizaron para
detectar la aparición de sustituciones e indeles recurrentes. Se generaron dos conjuntos de mutaciones recurrentes:
25 datos para sustituciones o indeles recurrentes en al menos 3, o al menos 4 de 11 tumores.

Se detectaron mutaciones de punto caliente en 11 tumores deficientes en MMR. Se generaron listas de variantes
para mutaciones recurrentes en tres (cuatro) o más muestras. En primer lugar intentamos excluir el hecho de que
estas mutaciones de punto caliente representan errores de secuenciación. Existe la posibilidad de que las
30 mutaciones de punto caliente sean falsos positivos, ya que pueden generarse mediante llamadas de variantes
sistemáticas de falsos positivos en los tumores o mediante llamadas sistemáticas de falsos negativos en las
muestras normales. Por lo tanto, realizamos una etapa de filtrado adicional. En particular, recopilamos todas las
variantes identificadas en cada uno de los 11 exomas normales endometriales y 3 exomas normales colorrectales.
Cada mutación de punto caliente que también estaba presente como una variante de la línea germinal en al menos
35 uno de estos exomas se consideró un error sistemático y se eliminó del conjunto de datos. Esto dio como resultado
una gran reducción de las sustituciones recurrentes, mientras que el efecto sobre los indeles recurrentes fue muy
limitado (tabla 17).

Tabla 17. Filtrado de falsos positivos a partir de mutaciones de punto caliente


40
Antes de filtrar Después de filtrar
Número de muestras
Sustituciones Indeles Sustituciones Indeles

3 o más 33 84 5 82

4 o más 8 45 0 44

Las 5 sustituciones de punto caliente en 3 o más tumores se sometieron a validación por Sequenom. De estas
sustituciones, solo se confirmó una. Además, intentamos validar todos los indeles recurrentes en cuatro o más
muestras. De estos 44 indeles recurrentes, 26 indeles pudieron genotiparse con éxito y todos se confirmaron
45 mediante el genotipado de Sequenom (tasa de validación del 100%). Dada la alta tasa de validación de indeles
somáticos recurrentes y no recurrentes, no buscamos más validaciones para los indeles restantes (n = 18), pero
consideramos todos los indeles recurrentes como verdaderos indeles positivos.

Dado que en los tumores deficientes en MMR los indeles se limitaron principalmente a homopolímeros, limitamos
50 nuestros análisis a indeles que afectan de forma recurrente a regiones homopoliméricas. Realizamos un cribado de
los 30.111 homopolímeros exónicos capturados con TruSeq de Illumina en cada uno de los 11 tumores deficientes
en MMR. La tabla 18 enumera el número de homopolímeros que se vieron afectados de forma recurrente en
tumores deficientes en MMR.

197
ES 2 906 023 T3

Tabla 18. Lista de homopolímeros con indeles en regiones exónicas en 11 tumores deficientes en MMR

Número de tumores afectados Número de homopolímeros afectados


1 1.238

2 173

3 38

4 26

5 8

6 5

7 3

8 1

9 1

En total, 1.493 homopolímeros se vieron afectados al menos una vez, 255 se vieron afectados al menos dos veces,
5 82 se vieron afectados tres veces y 44 se vieron afectados de forma recurrente en al menos 4 de 11 tumores. Estos
82 homopolímeros afectados se consideraron mutaciones de punto caliente. 4 de 82 mutaciones de punto caliente
se ubicaron en genes del censo de cáncer conocidos (RPL22, MSH6, MLL3 y BRAF). 41 de 82 mutaciones de punto
caliente se ubicaron en genes previamente implicados en tumores deficientes en MMR u otros tipos de cáncer. La
lista de estas mutaciones se proporciona en la tabla 7. El análisis se amplió analizando adicionalmente 5 líneas de
10 células tumorales primarias. Esto dio lugar a un total de 149 homopolímeros exónicos afectados de forma recurrente
en al menos 4 de 16 tumores deficientes en MMR. Los detalles de estas mutaciones de punto caliente se pueden
encontrar en la tabla 2. Cuando se aplicó una etapa de filtrado adicional, excluyendo no solo las variantes comunes
presentes en la base de datos 1000 Genomes y la base de datos dbSNP, sino también las variantes en nuestra base
de datos patentada de más de 100 individuos, se obtuvieron 103 homopolímeros exónicos afectados de forma
15 recurrente, que se enumeran en la tabla 5.

De los 44 homopolímeros afectados en al menos 4 de los 11 tumores, 21, 18, 1 y 4 consistían en tramos A, T, G o C,
respectivamente. Para los 82 homopolímeros afectados en al menos 3 de los 11 tumores, respectivamente 34, 31, 7
y 10 consistieron en tramos A, T, G o C (no se muestra). La longitud de los homopolímeros afectados de forma
20 recurrente varió de 7 nucleótidos a 25 nucleótidos. Sin embargo, se puede observar un fuerte sesgo hacia
homopolímeros con una longitud de 7-11 nucleótidos afectados en al menos 3 de 11 veces (no se muestra).

4.2 Frecuencia prevista frente a observada de indeles recurrentes

25 Para evaluar si los indeles recurrentes aparecen como consecuencia de la selección positiva o aparecen
aleatoriamente como resultado de una mayor frecuencia de indeles en los tumores deficientes en MMR, calculamos
el número esperado de indeles recurrentes basándonos en la frecuencia de indeles observada en el genoma
completo en el hipermutador. Dado que el deslizamiento de la polimerasa durante la replicación es más probable
que ocurra en homopolímeros largos, se espera que las mutaciones de indeles afecten más fácilmente a los
30 homopolímeros de mayor longitud. Por lo tanto, calculamos la frecuencia esperada (fe,genoma) para cada longitud de
homopolímero de entre 6 y 11 bases, ya que estos representan la mayor parte de los homopolímeros exónicos
(99,7%, figura 4a).

Tabla 19. Distribución de homopolímeros en función de la longitud del homopolímero


35
Longitud del Número de Número total de Frecuencia observada en el
homopolímero homopolímeros homopolímeros (genoma genoma completo del
afectados completo) hipermutador (fe, genoma)
6 4.868 4.123.709 1,18E-03
7 7.332 1.583.507 4,63E-03
8 8.729 562.325 1,55E-02
9 8.100 319.266 2,54E-02
10 5.861 206.595 2,84E-02
11 4.602 126.018 3,65E-02

198
ES 2 906 023 T3

Tal como se ha mencionado, la frecuencia observada en el hipermutador (fe,genoma) se utilizó para calcular el número
esperado de homopolímeros afectados en el exoma (multiplicando el número esperado de indeles por homopolímero
por el número de homopolímeros de esta longitud en el exoma). Después calculamos el número de homopolímeros
de una longitud determinada que se ven afectados en los 11 tumores deficientes en MMR. Este número se promedia
5 con respecto a los 11 exomas deficientes en MMR y se denomina frecuencia observada (fo,exoma) de un
homopolímero de una longitud determinada que se ve afectado. Después se calculan las veces del enriquecimiento
con respecto al número esperado de indeles en homopolímeros de esta longitud como la relación de las frecuencias
observadas y esperadas. Hubo un enriquecimiento débil en el número de indeles que aparecen en homopolímeros
de longitud 8-11 en estos exomas (véase la tabla 20).
10
Tabla 20

Longitud del Número esperado de Número total de Frecuencia observada Veces de


homopolímero homopolímeros afectados homopolímeros en el exoma (fo,exoma) enriquecimiento
en el exoma (exoma)
6 28,5 24.008 1,19E-03 1,0
7 33,6 4.787 7,02E-03 1,5
8 25,8 938 2,75E-02 1,8
9 10,8 205 5,24E-02 2,1
10 6,5 60 1,08E-01 3,8
11 4,1 24 1,72E-01 4,7

Suponiendo que cada homopolímero de la misma longitud tiene una probabilidad igualmente alta de verse afectado,
15 la probabilidad de que los homopolímeros se vean afectados en dos o tres tumores independientes se puede
calcular como el producto de la probabilidad de que un homopolímero se vea afectado en un tumor (es decir, la
frecuencia observada en el genoma completo fgenoma).

Como tal, la frecuencia esperada de que un homopolímero se vea afectado en tres tumores se calculó de la forma
20 siguiente:
fe,recurrente en 3 = (fe,genoma)3

y para que un indel se vea afectado en cuatro tumores:

25 fe,recurrente en 4 = (fe,genoma)4

Para calcular el número esperado de indeles recurrentes en tres, respectivamente cuatro, tumores, multiplicamos las
frecuencias esperadas por el número de homopolímeros en el exoma, y por el número de formas en que podemos
extraer 3, resp. 4, muestras de 11 muestras (es decir, el número de combinaciones C(3,11) y C(4,11)). Por lo tanto,
30 el número de indeles recurrentes esperados en 11 tumores se calcula de la forma siguiente:

Nrecurrente en 3 = C(3,11) * Nhomopolímeros * fe,recurrente en 3

Nrecurrente en 4 = C(4,11) * Nhomopolímeros * fe,recurrente en 4


35
Para indeles recurrentes en tres tumores, los datos son los siguientes:

Tabla 21. Indeles esperados y observados en homopolímeros recurrentes en 3 de 11 tumores

Longitud del Número observado de indeles Número esperado de


Veces de aumento
homopolímero recurrentes indeles recurrentes
6 0 6,51E-03 N/A

7 9 7,84E-02 114,80

8 25 5,76E-01 43,38

9 18 5,54E-01 32,47

10 16 2,27E-01 70,56

11 11 1,93E-01 57,12
40
199
ES 2 906 023 T3

Aunque ya observamos un enriquecimiento de indeles recurrente en tres muestras, el enriquecimiento de indeles


recurrente en cuatro o más muestras es mucho más fuerte:

Tabla 22. Indeles esperados y observados en homopolímeros recurrentes en 4 de 11 tumores


5
Longitud del Número observado de indeles Número esperado de
Veces de aumento
homopolímero recurrentes indeles recurrentes
6 0 1,54E-05 N/A

7 1 7,26E-04 1377,52

8 11 1,79E-02 615,67

9 9 2,82E-02 319,62

10 10 1,29E-02 776,36

11 11 1,41E-02 782,52

En resumen, aunque la mayor parte de los homopolímeros presentes en el exoma constan de 6 nucleótidos, la
mayor parte de los homopolímeros afectados de forma recurrente presentaron una longitud de 8-11 nucleótidos. Por
lo tanto, evaluamos la posibilidad de que estos homopolímeros se vieran afectados de forma recurrente debido a su
10 mayor longitud. Calculamos la probabilidad en el genoma completo de que un homopolímero de una longitud
específica se viera afectado por un indel en el hipermutador y encontramos que el número de mutaciones
observadas en el exoma era mayor de lo esperado para cada longitud de homopolímero. También calculamos la
probabilidad en el genoma completo de observar indeles recurrentes en homopolímeros de una longitud específica y
encontramos que el número observado de mutaciones recurrentes exónicas en > 2 o > 3 tumores era mucho mayor
15 de lo esperado para cada longitud de homopolímero, lo que indica que los homopolímeros exónicos no se vieron
afectados de forma recurrente debido al aumento de la longitud. Esto indica que estos indeles en estos
homopolímeros se seleccionan positivamente en estos cánceres.

Conclusión
20
En total, 1.238 de 30.111 homopolímeros se vieron afectados una vez, mientras que 173 homopolímeros se vieron
afectados dos veces. Además, 82 homopolímeros se vieron afectados por el mismo indel en al menos 3 tumores. De
ellos, 27 y 8 homopolímeros estaban presentes en 4 o 5 tumores, y 5 estaban presentes en 6 tumores (tabla 7 y tabla
23). Por el contrario, solo se identificó una única sustitución (G13D en KRAS) en más de un tumor deficiente en MMR.
25
Tabla 23. Genes afectados por indeles en al menos 3 de los 11 exomas deficientes en MMR

Número de muestras
Genes afectados*
afectadas
9 SETD1B
8 CASP5
7 RPL22, RBMXL1
6 SEC31A, OR7E24, MSH6, CCDC150, MYL1, ASTE1
5 SLC22A9, CNOT2, C15orf40, LTN1, KIAA2018, RGS12, RNF145, PHF2
4 WDTC1, RNPC3, FAM111B, NDUFC2, CASP5, TMBIM4, MIS18BP1, PRRT2, CTCF,
KIAA0182, TAF1B, SMC6, SLC35F5, ACVR2A, COBLL1, DDX27, CDH26, TGFBR2,
MBD4, ATR, EXOSC9, TTK, GRIK2, KIAA1919, MAP3K4, TMEM60
3 ARV1, KCNMA1, HPS1, ADD3, UVRAG, CD3G, SRPR, WNK1, CHD4, SENP1,
MYO1A. GLI1, CCDC168, PIGB, TMEM97, COIL, RNF43, ELAVL3, RBM43, NBEAL1,
NRIP1, P4HTM, DOCK3, RG9MTD1, ZBTB20, FETUB, CLOCK, MYO10, MSH3,
SPINK5, IGF2R, BRAF, MLL3, PRKDC, UBR5, AQP7, PRRG1, F8

Ejemplo 5. Los indeles recurrentes en las 3' y 5' UTR afectan a los homopolímeros largos
30
Dado que las 5' y 3' UTR son críticas para determinar la expresión génica, también evaluamos mutaciones en estas
regiones. En particular, utilizando datos del exoma de tumores deficientes en MMR, pudimos evaluar de forma fiable
hasta el 83,9% y el 91,9% de estas regiones.

200
ES 2 906 023 T3

5.1 Indeles recurrentes en regiones reguladoras

Para evaluar si cualquiera de las regiones 5' UTR y 3' UTR se vieron afectadas por mutaciones recurrentes, se
5 cribaron 5.367 y 59.259 homopolímeros ubicados en las 5' UTR y 3' UTR capturadas en el exoma de 10 tumores
deficientes en MMR, respectivamente. Estos homopolímeros también se cribaron en las 5' UTR y las 3' UTR de la
muestra de hipermutador con el genoma completo secuenciado, de modo que el número total de tumores en los que
pudimos cribar las 5' y 3' UTR fue de 11 tumores deficientes en MMR. Eliminamos cada mutación de punto caliente
que también estaba presente como una variante de la línea germinal en al menos una de 11 muestras deficientes en
10 MMR.

Los indeles recurrentes en homopolímeros fueron mucho más frecuentes en regiones 5' y 3' UTR de lo esperado a
partir de las observaciones en el exoma: en las regiones 3' UTR observamos 1.142 indeles recurrentes en al menos
4 de 11 tumores y 1.812 en al menos 3 de 11 tumores, mientras que en las 5' UTR observamos 50 indeles
15 recurrentes en al menos 4 de 11 tumores y 89 en al menos 3 de 11 tumores. Estos indeles recurrentes se muestran
en la tabla 6. Cuando se tomaron en cuenta las 5 muestras adicionales deficientes en MMR, se obtuvieron como
resultado 2.648 indeles recurrentes en 4 de 16 tumores para las regiones 3' UTR y 155 indeles recurrentes en 4 de
16 tumores para las regiones 5' UTR. Esta lista de indeles recurrentes frecuentes en homopolímeros en regiones
UTR (presentes en al menos 4 de los 16 tumores deficientes en MMR) se muestra en la tabla 1. En este caso
20 también, una etapa de filtrado adicional, que excluye no solo las variantes comunes presentes en la base de datos
1000 Genomes y la base de datos dbSNP, sino también variantes presentes en nuestra base de datos patentada de
más de 100 individuos, redujeron el número de homopolímeros afectados de forma recurrente en las regiones UTR a
1.314 indeles recurrentes en 4 de 16 tumores para las regiones 3' UTR y 88 indeles recurrentes en 4 de cada de 16
tumores para las regiones 5' UTR, que se enumeran en la tabla 4.
25
Por el contrario, las sustituciones recurrentes fueron muy raras: se encontraron 3 sustituciones recurrentes en al
menos 4 de 11 tumores y 18 en al menos 3 de 11 tumores, mientras que en las regiones 5' UTR se observó 1
sustitución recurrente en tres muestras, y no se encontraron sustituciones en 4 o más muestras.

30 5.1.1. Longitud del homopolímero y recurrencia de la mutación somática en regiones exónicas, 5' UTR y 3' UTR

Para evaluar si los indeles recurrentes en las regiones 5' y 3' UTR también son resultado de la selección clonal
positiva o simplemente aparecen debido al contenido de homopolímeros, evaluamos la distribución de longitud de
los homopolímeros en función de su ubicación en los exones, 5' UTR y 3' UTR. Observamos que hay muchos más
35 homopolímeros en las 3' UTR y mucho menos homopolímeros en las 5' UTR. Los homopolímeros en la 3' UTR
también fueron más largos que en el exoma. Por ejemplo, el exoma contiene 29.733 (98,7%) homopolímeros de
longitud < 9 nucleótidos, mientras que las 5' UTR y las 3' UTR contienen 4.857 (90,5%) y 49.769 (84,0%)
homopolímeros de longitud < 9 nucleótidos, respectivamente. A pesar del mayor número de homopolímeros de
longitud corta (6 o 7) en la 3' UTR que en el exoma (no se muestra), el número de homopolímeros afectados en la 3'
40 UTR y el exoma fue más o menos igual (no se muestra). En la 3' UTR se ubicaron muchos indeles en los
homopolímeros largos, es decir, homopolímeros con una longitud de 9, 10, 11, >= 12 pares de bases.

Al evaluar los indeles recurrentes en las 5' y 3' UTR y el exoma, observamos que también el número de indeles
recurrentes fue mucho mayor en la 3' UTR que en la 5' UTR o el exoma. Los indeles recurrentes en las 3' UTR
45 afectaron principalmente a los homopolímeros con una longitud > 9 pares de bases. Sorprendentemente, a pesar del
mayor número de homopolímeros de longitud 7 u 8 en la 3' UTR que en el exoma y a pesar del mayor número de
indeles en homopolímeros de longitud 7 u 8 en la 3' UTR que en el exoma, hubo más indeles recurrentes que
afectaban a homopolímeros de longitud 7 u 8 en el exoma que en la 3' UTR. Los indeles recurrentes en la 3' UTR
afectaron principalmente a los homopolímeros de longitud 11 y >= 12.
50
Para verificar que el aumento de la fracción de homopolímeros afectados de forma recurrente con una longitud < 9
en el exoma no se debe a diferencias generales en las distribuciones de longitud de los homopolímeros en las
diferentes regiones, corregimos la frecuencia de indeles (es decir, la fracción de homopolímeros afectados) en
homopolímeros de longitud < 9 por la aparición general de estos homopolímeros en las diferentes regiones. La
55 fracción corregida se calculó de la forma siguiente:

Esta frecuencia de mutación corregida se calculó después para las tres regiones diferentes (exoma, 5' UTR y 3'
60 UTR). Después de esta corrección, se observó aún el enriquecimiento para homopolímeros recurrentes más cortos
en el exoma (39,2% con longitud < 9) en comparación con las 5' (19,5%) y 3' UTR (2,2%). Estos datos indican
claramente que la longitud del homopolímero determina críticamente qué homopolímeros se ven afectados de forma
recurrente en las regiones 5' y 3' UTR, mientras que en el exoma, la longitud de homopolímeros y el efecto de la
201
ES 2 906 023 T3

mutación sobre la ventaja del crecimiento clonal determinan qué homopolímeros se ven afectados de forma
recurrente. La tabla 24 muestra una descripción general de los datos descritos en los párrafos anteriores.

Tabla 24. Distribución de homopolímeros en función de su longitud


5
Exoma 5' UTR 3' UTR

Número de homopolímeros afectados de forma recurrente 82 89 1812

Número de homopolímeros afectados de forma recurrente con longitud < 9 34 3 71

Porcentaje de homopolímeros afectados de forma recurrente con longitud < 9 41,5% 3,4% 3,9%

Número de homopolímeros con longitud < 9 29.733 4.857 49.769

Porcentaje de homopolímeros afectados de forma recurrente con longitud < 9


39,2% 19,5% 2,2%
corregido por el número de homopolímeros con longitud < 9

Por lo tanto, en resumen, en las 5' y 3' UTR, los homopolímeros son más largos que en las regiones codificantes
(figura 4a); además, los homopolímeros más largos en las UTR tienen una mayor propensión a acumular indeles
(figura 4b). En conjunto, esto da lugar a una frecuencia de indeles más alta en las 5' y 3' UTR que en las regiones
10 codificantes (aumento de 3,8 y 10,7 veces, respectivamente; figura 4c). Sin embargo, en las UTR, las mutaciones de
punto caliente se reducen en los homopolímeros largos. Por ejemplo, solo estaban presentes 3 (de 89; 3,4%) y 71
(de 1.812; 3,9%) mutaciones de punto caliente en homopolímeros afectados de las 5' y 3' UTR < 9 pb de longitud
(tabla 24), mientras que en regiones codificantes había presencia de hasta 34 (de 82; 41,5%) de dichas mutaciones
de punto caliente (figura 4d). En general, esto sugiere que la longitud del homopolímero determina críticamente qué
15 homopolímeros se ven afectados frecuentemente en las regiones 5' y 3' UTR, mientras que en las regiones
codificantes, el impacto de la mutación sobre la ventaja del crecimiento clonal codetermina qué homopolímero se ve
afectado con mayor frecuencia.

Ejemplo 6. Perfiles de expresión génica de genes mutados de forma recurrente


20
Dado que hemos planteado la hipótesis de que las mutaciones recurrentes están relacionadas con la selección
positiva debido a la ventaja de crecimiento para el tumor, los genes afectados por estas mutaciones recurrentes
deberían al menos expresarse en tejido endometrial normal. También se espera que al menos un subconjunto de
estos genes se pueda encontrar en otros tumores deficientes en la reparación de errores de apareamiento, y que las
25 mutaciones de punto caliente cambiarán la expresión del gen afectado. Por lo tanto, analizamos los perfiles de
expresión de genes afectados por mutaciones recurrentes tanto en el contexto de la expresión específica del
endometrio como en el contexto de genes expresados diferencialmente en tumores colorrectales deficientes en
MMR.

30 6.1 Expresión génica en endometrio normal

Los datos de expresión de genes en tejido endometrial normal se descargaron del Atlas de expresión génica23
(http://www.ebi.ac.uk/gxa/) utilizando la consulta "todos los genes sobreexpresados/subexpresados/expresados no
diferencialmente en Homo sapiens, endometrio". Esta consulta dio como resultado 14.664 genes, de los cuales
35 9.021 se sobreexpresaron en el endometrio normal, 463 se subexpresaron y 5.180 mostraron expresión no
diferencial. Dado que la sobreexpresión y la subexpresión se calcularon con respecto a los perfiles de expresión
génica general en diferentes tipos de tejido, es difícil evaluar si los genes subexpresados están efectivamente
ausentes (no expresados) o simplemente expresados a un nivel inferior. Sin embargo, para los genes
sobreexpresados significativamente en el tejido endometrial, podemos argumentar con seguridad que al menos
40 desempeñan un papel dentro del endometrio normal. Por lo tanto, en este análisis nos hemos limitado a los genes
sobreexpresados en el endometrio normal.

Las mutaciones de diferentes conjuntos de datos se compararon con los datos de expresión derivados: todos los
genes mutados en tumores competentes en MMR (genes MMR+), todos los genes mutados en tumores deficientes
45 en MMR (genes MMR-), todos los genes afectados de forma recurrente en tumores deficientes en MMR (definidos
como 3 de 11 muestras, genes recurrentes), y finalmente todos los indeles recurrentes en regiones exónicas
(exónicos recurrentes). Este análisis indicó que las mutaciones recurrentes (de punto caliente) estaban
sobrerrepresentadas en genes que estaban sobreexpresados en tejido endometrial normal. Los datos completos
para estos análisis se muestran en la tabla 25.
50

202
ES 2 906 023 T3

Tabla 25. Expresión génica en endometrio normal

Conjunto de Genes Genes Genes Exónicos


datos deficientes en competentes recurrentes recurrentes
MMR en MMR
Genes afectados N/A 7.084 380 994 82
Genes en el conjunto de datos 14.664 5.303 243 750 65
Sobreexpresados 9.021 (61,5%) 3.411 (64,3%) 142 (58,4%) 476 (63,5%) 57 (87,7%)
Subexpresados 463 (3,2%) 208 (3,9%) 5 (2,1%) 30 (4,0%) 2 (3,1%)
Expresados no diferencialmente 5.180 (35,3%) 1.684 (31,8%) 96 (39,5%) 244 (32,5%) 6 (9,2%)

Análisis de genes específicos de cánceres colorrectales inestables en microsatélites


5
Los genes expresados diferencialmente entre cánceres colorrectales inestables en microsatélites (MSI-H) y estables en
microsatélites (MSS) se derivaron de un estudio de Banerjea et al.22. En este estudio, se analizaron 133 tumores
colorrectales, de los cuales 29 (22%) tumores se identificaron como MSI-H. Los datos de expresión génica se derivaron
de chips Affymetrix HG-U133A. El conjunto de datos derivado contiene 4.874 genes expresados diferencialmente entre
10 cánceres estables e inestables en microsatélites (P < 0,05, tasa de descubrimiento falso de Benjamini y Hochberg).

Las mutaciones de diferentes conjuntos de datos se compararon con los datos de expresión derivados: todos los
genes mutados en tumores competentes en MMR (genes MMR+), todos los genes mutados en tumores deficientes
en MMR (genes MMR-), todos los genes afectados de forma recurrente en tumores deficientes en MMR (definidos
15 como 3 de 11 muestras, genes recurrentes), y finalmente todos los indeles recurrentes en regiones exónicas
(exónicos recurrentes). Este análisis reveló que las mutaciones de punto caliente se enriquecieron entre el conjunto
de genes expresados diferencialmente en tumores inestables en microsatélites.

Tabla 26. Análisis de genes específicos para cánceres colorrectales con MSI
20
Conjunto de datos (n = 4.874 genes) Genes Genes Genes Exónicos
deficientes en competentes en recurrentes recurrentes
MMR MMR
Genes en el conjunto de datos 7.084 380 994 82
Expresados diferencialmentes en MSI-H 1.524 (21,5%) 63 (16,6%) 211 (21,2%) 28 (34,1%)

Resumen

Utilizando datos de expresión disponibles públicamente del Atlas de expresión génica (Kapushesky et al., 2010),
25 evaluamos si los genes afectados por la misma mutación en al menos 3 tumores deficientes en MMR (en lo
sucesivo, mutaciones de punto caliente) se expresaron en tejido EM normal. De todos los genes mutados en
tumores competentes en MMR y deficientes en MMR, el 58% y el 64% se expresaron en tejido EM en comparación
con el 88% de los genes afectados por mutaciones de punto caliente (tabla 25). Se obtuvieron datos similares para
tejido de mucosa normal (no se muestran). Además, al evaluar las diferencias de expresión entre tumores
30 deficientes en MMR y tumores competentes en MMR (Banerjea et al., 2004), observamos que el 20% de los genes
afectados por mutaciones no de punto caliente frente al 32% de los genes afectados por mutaciones de punto
caliente se expresaron de forma diferencial. Por lo tanto, las mutaciones de punto caliente afectan preferentemente a
genes que se expresan en tejido normal y alteran su expresión, lo que indica que son el resultado de una selección
clonal positiva en el tumor.
35
Ejemplo 7. Las mutaciones recurrentes detectan de forma fiable MSI en varios tipos de tumores

El panel Bethesda ampliado, que consiste en 8 marcadores de microsatélites y 2 marcadores de homopolímeros, se


utiliza actualmente para evaluar el diagnóstico de MSI como un marcador de deficiencia de MMR9,15. Dado que estos
40 marcadores no se seleccionaron en función de la frecuencia relativa con la que afectan a los tumores MMR, este
panel a veces no detecta los tumores MMR24. Por lo tanto, evaluamos si las mutaciones recurrentes podrían mejorar
la detección de MSI.

7.1 onstrucción de un panel de diagnóstico

45 Hay dos criterios por los que creemos que es posible mejorar el panel de diagnóstico que se utiliza actualmente para
detectar inestabilidad microsatelital. En primer lugar, determinamos mutaciones recurrentes en tumores deficientes
en MMR de una forma no sesgada: mediante la realización de experimentos de secuenciación del genoma completo

203
ES 2 906 023 T3

y del exoma y simplemente observando qué posiciones se vieron afectadas de forma recurrente. La detección de
forma no sesgada sugiere que las mutaciones de punto caliente más frecuentes serán las más sensibles para
detectar MSI. En segundo lugar, la mayor parte de los indeles recurrentes que identificamos estaban ubicados en la
3' UTR. Los indeles recurrentes en las 5' y 3' UTR no se someten a una selección positiva estricta, pero están
5 determinados principalmente por la longitud del homopolímero afectado, y es poco probable que se produzcan
enriquecimientos específicos de tejido. Estos dos criterios aseguran que i) hemos elegido marcadores que, sin un
conocimiento a priori de su función, se ven afectados de forma recurrente en múltiples muestras tumorales y ii)
tienen una serie de marcadores que probablemente sean independientes del tipo de cáncer. Para el último, los
indeles seleccionados de las 5' y 3' UTR pueden ser más útiles.
10
Para obtener la mayor sensibilidad, solo usamos mutaciones que aparecen en 4 o más muestras. Para los indeles
recurrentes de 5' y 3' UTR, se dio prioridad a los indeles que afectaban a 5 o más muestras. Los 44 indeles exónicos
recurrentes, 1.142 indeles de 3' UTR recurrentes y 50 indeles de 5' UTR recurrentes resultantes se utilizaron para
diseñar un panel basado en Sequenom para detectar deficiencia en MMR. Dado que los indeles recurrentes se
15 ubicaron en regiones homopoliméricas, el diseño de cebadores de una PCR multiplex de Sequenom fue complejo.
Después de amplios experimentos de optimización, se generaron con éxito seis ensayos que genotipaban 56
mutaciones de punto caliente. De las 56 mutaciones de punto caliente, 11 se localizaron en exones, 40 en 3' UTR y
5 en 5' UTR, respectivamente. Nos referimos a este panel como el panel de 56 marcadores. Los detalles completos
de estas 56 mutaciones se pueden encontrar en la tabla 3.
20
7.2 Evaluación diagnóstica de MSI en tumores endometriales

A continuación, el panel de 56 marcadores se aplicó a una serie adicional de 114 tumores endometriales resecados
quirúrgicamente no seleccionados, que consistían en 7 carcinomas endometriales de células claras, 69 endometrioides,
25 18 endometrioides serosos mixtos, 10 serosos y 10 no clasificados. Todos los tumores eran tumores endometriales
primarios no tratados previamente con quimioterapia. Se dispuso de tejido recién congelado para cada uno de estos
tumores. La tasa de éxito de genotipado de los marcadores seleccionados fue alta (en promedio el 98,7%). El número de
marcadores positivos para una muestra varió entre 0 y 33, con un promedio general de 6,5 marcadores positivos por
muestra. De forma análoga al panel Bethesda, definimos tres categorías de inestabilidad microsatelital: estable en
30 microsatélites (MSS, 0 de 10 marcadores en Bethesda, 0 o 1 de 56 marcadores en el panel de 56 marcadores), baja
inestabilidad microsatelital (MSI-L, 1-2 de 10 marcadores en el panel Bethesda, entre 2 y 9 marcadores en un panel de
56 marcadores) y alta inestabilidad microsatelital (MSI-H, 3 o más de 10 marcadores en Bethesda, 10 o más de 56 en un
panel de 56 marcadores). Según estas categorías para el panel de 56 marcadores, 65 tumores (57,0%) se definen como
MSS. 33 tumores (29,0%) y 16 tumores (14,0%) se definen como MSI-H y MSI-L respectivamente. De estos 33 tumores
35 MSI-H, Bethesda identificó 29 tumores como MSI-H (> 2 marcadores positivos), 3 tumores como MSI-L y un tumor como
MSS. A la inversa, Bethesda no identificó ningún tumor MSI-H que no fuera identificado por nuestro panel de mutaciones
de punto caliente (tal como se muestra en la figura 5). Este resultado muestra que el panel de 56 marcadores tuvo un
mejor rendimiento que el panel Bethesda para esta serie de tumores endometriales. Los datos de los tumores
colorrectales son comparables (no se muestran).
40
7.3 Firmas de mutaciones en otros tipos de tumores

También aplicamos nuestro panel de 56 marcadores a otros tipos de tumores (tumores de ovario y leucemia). Se
seleccionaron 4 muestras MSI-H, incluyendo 1 de tumor de ovario y 3 muestras de líneas celulares de leucemia
45 (DND41, CCRF-CEM y SUPT1). Para evaluar si nuestras observaciones en tumores endometriales/colorrectales
deficientes en MMR eran extrapolables a otros tipos de tumores, se secuenciaron el tumor de ovario MSI-H, dos
tumores de ovario que se detectaron como MSS y sus muestras normales correspondientes, así como tres líneas
celulares de leucemia MSI-H y una línea celular de leucemia MSS (RPMI-8402).

50 Los 3 pares de tumores de ovario normales fueron tumores primarios, no tratados previamente con quimioterapia,
recolectados durante la cirugía. Se secuenció el exoma del tumor de ovario deficiente en MMR (MMR- Ovárico 1),
junto con su ADN normal correspondiente, utilizando la captura TruSeq de Illumina. El mismo conducto de análisis
que se describió anteriormente se utilizó para el análisis de estos datos del exoma. Los datos del exoma de dos
tumores ováricos MMR+ (MMR+ Ovárico 1 y 2), junto con sus muestras normales correspondientes, se extrajeron de
55 los datos existentes del genoma completo. En particular, ambos pares tumor-normal competentes en MMR ya
estaban disponibles de otro proyecto y se secuenciaron utilizando Complete Genomics. Los datos de la secuencia
del genoma completo se han depositado en el Archivo Europeo de Genomas y Fenomas con el número de acceso
EGAS00001000158. Para estos genomas se utilizaron los mismos análisis que se describen en los Ejemplos
anteriores del presente documento.
60
Además, se secuenció el exoma de 4 líneas celulares de leucemia utilizando captura de Nimblegen. Los exomas se
capturaron utilizando Nimblegen SeqCap EZ Human Exome Library v2.0. Se construyeron bibliotecas de ADN de
preenriquecimiento según el protocolo estándar de la Guía de preparación de muestras de ADN de extremos
emparejados de Illumina. El enriquecimiento del exoma se realizó según las instrucciones del fabricante. Se realizó
65 una ronda (72 horas) de hibridaciones basadas en cebo biotinilado, seguida de unión de perlas magnéticas de
estreptavidina, una etapa de lavado y una etapa de elución. Se realizó un enriquecimiento por PCR de 18 ciclos
204
ES 2 906 023 T3

después de la elución y las bibliotecas enriquecidas se sometieron a secuenciación de Illumina (HiSeq 2000). La
secuenciación de extremos emparejados (2 x 51 pb) se realizó con kits TruSeq SBS. Se utilizó un carril para un
exoma. La información clínica detallada de todas las muestras se incluye en la tabla 27. La tabla 28 enumera todas
las mutaciones encontradas en los genes MMR en todas las muestras de ovario y leucemia.
5
Tabla 27. Información clínica para tumores de ovario y de leucemia

Tumor Tipo Histopatología Grado Estadio


MMR- Ovárico 1 Ovario Serosa 3 IIIc
MMR+ Ovárico 1 Ovario Célula clara 3 IIc
MMR+ Ovárico 2 Ovario Célula clara 3 IIIc
DND41 (MMR- Leucemia 1) Sangre; Línea celular Leucemia linfoblástica aguda / /
CCRF-CEM (MMR- Leucemia 2) Sangre; Línea celular Leucemia linfoblástica aguda / /
SUPT1 (MMR- Leucemia 3) Sangre; Línea celular Leucemia linfoblástica aguda / /
RPMI8402 (MMR+ Leucemia 1) Sangre; Línea celular Leucemia linfoblástica aguda / /

Tabla 28. Estado de mutación de genes MMR en tumores de ovario y de leucemia


10
Tumor Estado de mutación de genes MMR
MMR- Ovárico 1 MSH6: T1085fs
MMR+ Ovárico 1 /
MMR+ Ovárico 2 /
DND41 (MMR- Leucemia 1) MSH6: T1085fs; MSH3: K381fs
CCRF-CEM (MMR- Leucemia 2) MLH1: R100X
SUPT1 (MMR- Leucemia 3) MLH1: T495fs; MSH3: K381fs
RPMI-8402 (MMR+ Leucemia 1) /

En el tumor de ovario deficiente en MMR (MMR- Ovárico 1), se detectaron 2.045 nuevas sustituciones somáticas y
280 nuevos indeles somáticos. Debido a que la tasa de validación en los otros tumores deficientes en MMR era muy
alta en tumores en los que se había secuenciado tanto el genoma completo como el exoma (véase anteriormente),
15 no se realizó una validación adicional para este tumor. En los dos tumores de ovario competentes en MMR se
detectaron respectivamente 32 y 42 sustituciones somáticas nuevas y 12 y 18 indeles somáticos nuevos. Debido a la
baja tasa de validación en tumores competentes en MMR en general, todas las mutaciones somáticas en los dos
tumores de ovario competentes en MMR se validaron utilizando Sequenom MassARRAY. Se confirmaron
respectivamente 16 y 20 sustituciones como sustituciones verdaderas en los dos tumores de ovario competentes en
20 MMR. No se confirmó ningún indel en ninguno de los tumores. Para estas mutaciones somáticas, observamos los
mismos patrones que los observados en los tumores EM/CCR (datos no mostrados).

Los exomas de cuatro líneas celulares de leucemia se secuenciaron usando tecnología Illumina HiSeq, tal como se
ha descrito anteriormente. Dado que no había muestras de ADN normal correspondiente disponibles para estas
25 líneas celulares, no pudimos distinguir entre mutaciones somáticas o de línea germinal. Sin embargo, utilizando el
conducto de filtrado de variantes comunes descrito anteriormente, pudimos eliminar las variantes que aparecen con
más frecuencia. Tal como se observó anteriormente en tumores deficientes en MMR, los indeles se ubicaron
principalmente en los homopolímeros de las muestras de leucemia deficientes en MMR. Por otra parte, la muestra
competente en MMR no mostró este patrón (no se muestra).
30
Para las sustituciones, los patrones en muestras deficientes MMR y competentes en MMR fueron muy similares (no
se muestra). En particular, estos patrones revelaron que la mayor parte de las sustituciones no estaban ubicadas en
regiones de repetición. Al igual que en los tumores endometriales/colorrectales deficientes en MMR, las
sustituciones en muestras deficientes en MMR se componían principalmente de transiciones (73,0% frente a 27,0%
35 de transversiones, respectivamente).
Resumen

Seleccionamos 56 de las mutaciones de punto caliente más frecuentes identificadas por secuenciación del exoma:
45 se encontraban en las UTR, que son menos propensas a la selección clonal y, por lo tanto, podrían detectar MSI
40 en tumores de diferentes tipos de tejidos, y 11 se encontraban en regiones codificantes. El genotipado de 114
tumores EM resecados quirúrgicamente para estas 56 mutaciones reveló que 33 (29,0%) tumores fueron positivos
para ≥ 10 marcadores (MSI-alta o MSI-H) y 16 (14,0%) tumores para 2 a 9 marcadores (MSI-baja o MSI-L). Los 65

205
ES 2 906 023 T3

tumores restantes (57,0%) fueron positivos para < 2 marcadores y eran tumores estables en microsatélites (MSS)
(figura 5). De 33 tumores MSI-H, Bethesda identificó solo 29 tumores como MSI-H (> 2 marcadores positivos). Los 4
tumores discordantes contenían una mutación de desplazamiento de marco en MSH6 o eran deficientes para MSH6
en histopatología, lo que confirma que eran MSI-H. A la inversa, Bethesda no identificó ningún tumor MSI-H que no
5 fuera identificado por nuestro panel de mutaciones de punto caliente.

Finalmente, evaluamos si las mutaciones de punto caliente también estaban presentes en tumores de ovario y en
leucemia. En primer lugar, utilizando nuestro panel de 56 marcadores, seleccionamos 1 tumor de ovario y 3 líneas
celulares de leucemia (DND41, CCRF-CEM y SUPT1) que fueron positivas para 20, 25, 23 y 21 marcadores
10 respectivamente, así como 2 tumores de ovario y una línea celular de leucemia (RPMI8402) sin marcadores
positivos. La secuenciación del exoma de los tumores de ovario y sus muestras normales correspondientes confirmó
que el tumor de ovario MSI-H contenía sustancialmente más eventos somáticos que los 2 tumores de MSS
correspondientes, incluida una deleción de desplazamiento de marco en MSH6. Aunque no pudimos distinguir entre
mutaciones somáticas o de línea germinal en las líneas celulares de leucemia, ya que no se disponía de ADN de
15 línea germinal correspondiente, las sustituciones y los indeles también fueron más frecuentes en las líneas celulares
MSI-H (Nota S9). Se observaron dos mutaciones con pérdida de función en MLH1 y una deleción por
desplazamiento de marco en MSH6, lo que confirma que las líneas celulares MSI-H eran deficientes en MMR. Al
evaluar si las mutaciones recurrentes identificadas en tumores endometriales también estaban presentes en los
genomas de ovario y leucemia, notamos que de 384 mutaciones recurrentes en tumores endometriales MMR-, 60,
20 25, 8 y 1 estaban presentes respectivamente en 1, 2, 3 o 4 tumores MMR- (no se muestra). Se observó un
enriquecimiento más pronunciado al limitar las mutaciones recurrentes a las que estaban presentes en al menos 3
tumores endometriales. Finalmente, dado que los indeles recurrentes en el exoma se seleccionan positivamente por
el tejido tumoral mientras que los indeles recurrentes en las 5' y 3' UTR dependen en gran medida de la longitud del
homopolímero, los indeles presentes en las UTR podrían representar mejores marcadores de MSI.
25
Ejemplo 8. Los patrones de mutación de tumores deficientes en MMR afectan a la reparación de roturas de doble
hebra de ADN

Para explorar la relevancia biológica de las mutaciones de punto caliente en tumores deficientes en MMR,
30 realizamos análisis de vías con dos herramientas diferentes, a saber, IPA® y GenomeMuSiC. Estas dos
herramientas utilizan cuatro bases de datos de vías diferentes, es decir, las bases de datos IPA, KEGG, BioCarta y
Reactome. El uso de múltiples herramientas y bases de datos nos permitió obtener una impresión detallada de las
vías afectadas.

35 8.1. Análisis de vías utilizando IPA® y GenomeMuSiC

El análisis de vías de ingenio (IPA)®, http://www.ingenuity.com/) permite la identificación de las vías biológicas más
relevantes para los genes de interés. El análisis de vías de todos los genes con indeles somáticos (3.022 indeles en
2.231 genes, excluyendo los indeles presentes en los genes MMR, porque estábamos interesados en mutaciones
40 secundarias resultantes de la deficiencia de MMR) usando IPA® reveló que 24 vías están significativamente
enriquecidas (P < 0,05) (no se muestra). El "Papel de BRCA1 en la respuesta al daño al ADN" y la "Reparación de
rotura de doble hebra (DSB) de ADN por recombinación homóloga (HR)" se clasificaron en la posición 1 y 3
respectivamente. Si se restringe la lista de genes de interés a los genes que portan las mutaciones de punto caliente
solamente (1.382 indeles en 452 genes), se revelaron 13 vías significativamente enriquecidas tal como se muestra
45 en la tabla 29. Las vías de "Papel de BRCA1 en la respuesta al daño al ADN" y de "Regulación del punto de control
de ADN G2/M" se clasificaron en la posición 1 y 2, respectivamente.

Tabla 29. Análisis de la vía de los genes portadores de mutaciones de punto caliente

Clasificación Vía Valor P

1 Papel de BRCA1 en respuesta al daño al ADN 1,96E-03

2 Ciclo celular: regulación del punto de control de daño al ADN G2/M 3,08E-03

3 Señalización de P53 5,04E-03

4 Señalización de GADD45 9,00E-03

5 Biosíntesis de D-mio-inositol-trifosfato 9,00E-03

6 Señalización de proteína quinasa A 1,33E-02

7 Señalización de PTEN 2,00E-02


50

206
ES 2 906 023 T3

(continuación)

Clasificación Vía Valor P

8 Biosíntesis del cofactor de tio-molibdeno 2,45E-02

9 Salvamento y modificación del lipoato 2,45E-02

10 Reparación de rotura de doble hebra de ADN por recombinación homóloga 3,89E-02

11 Señalización hereditaria de cáncer de mama 4,21E-02

12 Mecanismos moleculares de cáncer 4,42E-02

13 Biosíntesis e incorporación de lipoato II 4,83E-02

En resumen, IPA® reveló que el "Papel de BRCA1 en la respuesta al daño al ADN" era la principal vía enriquecida
5 utilizando dos conjuntos diferentes de genes de interés, es decir, todos los genes que portan indeles somáticos y
todos los genes con mutaciones de punto caliente. La "Regulación del punto de control del ADN G2/M" y la
"Reparación de rotura de doble hebra (DSB) de ADN por recombinación homóloga (HR)" también fueron muy
significativas.

10 Se realizó un análisis similar utilizando GenomeMuSiC (http://gmt.genome.wustl.edu/genome-music/0.3/index.html),


utilizando todos los indeles somáticos (excluyendo todos los indeles de genes MMR) como entrada. Los análisis de
vías de todos los indeles somáticos (3.022 indeles en 2.231 genes; se excluyeron los indeles presentes en genes
MMR) en tumores deficientes en MMR usando GenomeMuSiC revelaron 51 vías mutadas significativamente (FDR <
0,05). Las vías de "Reparación de ADN", "Reparación por escisión de bases" y "Punto de control de daño al ADN
15 G2/M" se clasificaron en las posiciones más altas, lo que confirma los resultados del análisis IPA®.

8.2 Análisis de la vía de indeles en los límites exón/intrón

Además, como se sabe que los genes también son inactivados por indeles que afectan a homopolímeros ubicados
20 en los límites exón/intrón, ampliamos nuestra llamada de mutación a indeles que aparecen en las secuencias de 25
pares de bases cadena arriba y abajo de cada exón. Se realizó la misma llamada de mutación y el mismo conducto
de filtrado que se describieron anteriormente. Detectamos 1.700 indeles adicionales en los límites exón/intrón,
incluida una deleción en el homopolímero del intrón 7 de ATM, una deleción en el homopolímero del intrón 4 de
MRE11 y una inserción en el homopolímero del intrón 5 de FANCD2. Estos tres indeles afectan a 7, 5 y 1 muestras
25 respectivamente. Junto con los 3.022 indeles en las regiones exónicas, el análisis GenomeMuSiC de las 4.722
mutaciones reveló 54 vías mutadas significativamente (FDR < 0,05). La inclusión de indeles en los límites
exón/intrón produjo una señal aún más fuerte para la reparación de DSB de ADN como la principal vía enriquecida.

Considerando todos los análisis, hay 11 genes involucrados en la vía de reparación de DSB por HR. La tabla 30
30 siguiente enumera estos genes y los tumores deficientes en MMR que portan mutaciones en estos genes.

Tabla 30. Genes implicados en la vía de reparación de DSB por HR

Gen Tumor deficiente en MMR afectado


ATM MMR- 2, MMR- 3, MMR- 6, MMR- 8, MMR- 9, MMR- 10, MMR- 11
ATR MMR- 2, MMR- 8, MMR- 10, MMR- 9
BLM MMR- 2, MMR- 6
BRCA1 MMR- 4, MMR- 5
CHEK1 MMR- 1, MMR- 9
FANCD2 MMR- 10
FANCE MMR- 2
FANCM MMR- 2, MMR- 11
MRE11 MMR- 1, MMR- 3, MMR- 8, MMR- 10, MMR- 11
RAD50 MMR- 9
RAD54 MMR- 5, MMR- 11

207
ES 2 906 023 T3

Resumen

Dado que los indeles presentes en tumores deficientes en MMR pueden estar sometidos a selección clonal positiva
o negativa, evaluamos si las vías específicas están enriquecidas para estas mutaciones. En promedio, cada tumor
5 deficiente en MMR contenía 309 indeles, 30 de los cuales eran mutaciones de punto caliente. Los análisis de vías de
todos los genes afectados por un indel somático (excepto los genes MMR porque los indeles en estos genes están
provocando deficiencia en MMR) usando IPA® revelaron que el "Papel de BRCA1 en la respuesta al daño al ADN" y
la "Reparación de rotura de doble hebra (DSB) de ADN por recombinación homóloga (HR)" eran las principales vías
enriquecidas (P = 6,5E-03 y P = 1,1E-02, respectivamente). El análisis IPA® de todas las mutaciones de punto
10 caliente reveló que además del "Papel de BRCA1 en la respuesta al daño al ADN" (P = 2,0E-03), la vía de
"Regulación del punto de control de daño al ADN G2/M" también se enriqueció (P = 3,1E-03). Los genes que
mutaron con más frecuencia en estas vías incluyeron, entre varios otros, ATR, BLM, BRCA1, CHEK1 y FANCM (4,
2, 2, 2 y 2 mutaciones, respectivamente; tabla 30). Los análisis de vías de todos los indeles en tumores deficientes
en MMR utilizando GenomeMuSiC, que calcula las vías que están mutadas específicamente basándose en las
15 bases de datos KEGG, BioCarta o Reactome, mientras corrige por la tasa de mutación de fondo, revelaron que,
respectivamente, las vías de "Reparación de ADN", "Reparación por escisión de bases" y "Puntos de control de
daño al ADN G2/M" se clasificaron en las posiciones más altas (P = 6,3E-05, P = 3,1E-04 y P = 9,8E-04,
respectivamente). Además, dado que los genes de reparación de DSB también pueden verse afectados por indeles
con pérdida de función en homopolímeros ubicados en los límites exón/intrón (Ham et al., 2006), ampliamos nuestra
20 llamada de mutación a indeles que aparecen en las secuencias de 25 pb cadena arriba y abajo de cada exón. El
análisis GenomeMuSiC de todas las mutaciones (1.700 indeles de límite exón/intrón y 3.022 indeles exónicos) arrojó
una señal aún más fuerte para la reparación de DSB de ADN como la vía enriquecida principal (por ejemplo, P =
6,8E-07 para la vía "ATR/BRCA" en BioCarta y P = 3,0E-05 para la vía de "Punto de control de daño al ADN G2/M"
en Reactome). En general, cada tumor deficiente en MMR contenía una media de 3,0 ± 0,5 indeles en la vía de
25 reparación de DSB por HR (figura 6).

En un intento de replicar estos hallazgos, analizamos los datos del exoma de 27 tumores CCR MSI-H secuenciados
en el contexto de la red The Cancer Genome Atlas (TCGA, 2012). Aunque estos tumores se secuenciaron con una
profundidad de cobertura promedio de solo 20x, que es bastante baja para detectar indeles de forma fiable en
30 homopolímeros (Reumers et al., 2011), seleccionamos cada uno de los 1.426 indeles con desplazamiento de marco
(en 1.284 genes, sin incluir los genes MMR) que se notificaron para estos tumores, pero además también
seleccionaron 19 indeles identificados por TCGA basándonos en una evaluación separada de 29 homopolímeros
seleccionados mediante un enfoque de genes candidatos. Sorprendentemente, el análisis de IPA de los 1.303 genes
afectados con indeles confirmó que el "Papel de BRCA1 en la respuesta al daño al ADN" fue nuevamente la vía
35 enriquecida principal (P = 0,0148). Los genes mutados en esta vía incluyeron, entre varios otros, RAD50, ATR, BLM
y CHEK1 (7, 5, 2 y 1 mutaciones, respectivamente; figura 6).

8.3 Inactivación de la vía de reparación de DSB por HR en células deficientes en MMR

40 Para investigar si la vía de reparación de DSB por HR está funcionalmente inactivada en tumores deficientes en
MMR, evaluamos la actividad de reparación de DSB en 8 cultivos de tumores primarios y líneas celulares
cancerosas deficientes en MMR y 4 competentes en MMR. El estado de MMR de estas células se analizó utilizando
el panel de 56 marcadores y se confirmó mediante el panel Bethesda.

45 Se establecieron nueve cultivos primarios de células tumorales endometriales y ovario de pacientes sometidas a
cirugía en la División de Oncología Ginecológica, Hospitales Universitarios de Gasthuisberg, Lovaina (Bélgica). Solo
después de dar su consentimiento informado, los pacientes se incluyeron en el estudio. Se utilizó el siguiente
protocolo para generar cultivos de tumores primarios. En primer lugar, se dispusieron muestras de tumores en medio
RPMI estéril suplementado con penicilina/estreptomicina (1000 U/ml) y fungizona (0,5 µg/ml) (todos de Life
50 Technologies) para su transporte desde la sala de cirugía al laboratorio de cultivo celular. Posteriormente, el tejido
tumoral se lavó con PBS suplementado con penicilina/estreptomicina y fungizona, y el tejido se trituró con cuchillas
estériles. El tejido tumoral se digirió con colagenasas tipo IV (1 mg/ml; Roche) en medio RPMI (Life Technologies)
suplementado con penicilina/estreptomicina y fungizona. También se añadió DNasa I (0,1 mg/ml; Roche) al medio
de digestión. La digestión se realizó con agitación durante 3 h a 37 ºC. A continuación, se preparó una suspensión
55 de células individuales mediante filtración a través de un filtro de 70 µm y se lisaron los glóbulos rojos usando una
solución de cloruro de amonio (Stem Cell Technologies). Finalmente, las células individuales se plaqueron en un
matraz de cultivo de 25 cm2 y el medio se cambió al día siguiente. Después de 1-3 semanas, cuando las células
alcanzaron una confluencia del 60-70%, se eliminaron los fibroblastos usando CD90 antihumano de ratón (Clon
AS02; Dianova) y selección negativa con Mouse Pan IgG Dynabeads (Life Technologies). Posteriormente, los
60 cultivos celulares se sometieron a pases a una confluencia del 70-90% y los cultivos celulares se almacenaron en un
banco de células en diferentes pases. La tabla 31 enumera los diversos cultivos de tumores primarios que se
generaron según este protocolo.

208
ES 2 906 023 T3

Tabla 31. Cultivos de células de tumores primarios

Cultivo celular Tipo Histopatología Grado Estado de MMR


1 EMC- 1 Endometrio Carcinoma endometrioide 2 Deficiente
2 EMC- 2 Endometrio Carcinoma endometrioide 3 Deficiente
3 EMC- 3 Endometrio Carcinoma endometrioide/seroso 3 Deficiente
4 EMC- 4 Endometrio Carcinoma endometrioide 1-3 Deficiente
5 EMC- 5 Endometrio Carcinoma endometrioide 3 Deficiente
6 OVC- 1 Ovario Carcinoma seroso 3 Deficiente
7 OVC- 2 Ovario Carcinoma seroso 3 Deficiente
8 EMC+ 1 Endometrio Carcinoma endometrioide 2 Competente
9 OVC+ 1 Ovario Carcinoma seroso 3 Competente

Los cultivos de células de tumores primarios se cultivaron en medio RPMI 1640 (Gibco) suplementado con suero
5 bovino fetal al 20%, L-glutamina 2 mM, 100 U/ml de penicilina, 100 µg/ml de estreptomicina, 1 µg/ml de fungizona y
10 µg/ml de gentamicina hasta 20 pases. Todos los cultivos celulares se realizaron en una atmósfera humidificada
que contenía CO2 al 5% a 37 ºC. También se supervisaron de forma rutinaria para detectar contaminación por
micoplasma y no se detectó crecimiento de micoplasma.

10 Se obtuvieron células HEC-1-A, MDA-MB-231 y MCF7, en todos los casos de las Colecciones de Cultivos Tipo
Estadounidenses (ATCC, Manassas, VA, Estados Unidos). Se cultivaron células HEC-1-A en medio 5A de McCoy
(Gibco-BRL, Life Technologies), células MDA-MB-231 y MCF7 en medio de Eagle modificado por Dulbecco (DMEM,
Gibco-BRL), todos complementados con suero bovino fetal al 10% (FBS, Gibco-BRL), L-glutamina 2 mM, 100 U/ml
de penicilina y 100 µg/ml de estreptomicina (todos de Life Technologies). Todas las células humanas se mantuvieron
15 en una atmósfera humidificada que contenía CO2 al 5% a 37 ºC. Las líneas celulares se enumeran en la tabla 32.

Tabla 32

Línea celular Tipo Subtipo Estado BRCA Mutaciones en genes MMR Estado de MMR
Mutación sin sentido en PMS2,
1 HEC-1-A Endometrio Endometrioide WT BRCA1/2 Mutación del sitio de empalme Deficiente
en MSH6
2 MDA-MB-231 Mama TNBC WT BRCA1/2 - Competente
3 MCF7 Mama ER+ PR+ WT BRCA1/2 - Competente

20 Resumen

Habiendo establecido que los tumores deficientes en MMR están enriquecidos en mutaciones de pérdida de función
que afectan a la vía de reparación de DSB por HR, investigamos si esta vía también está funcionalmente inactivada.
Esto es relevante ya que estas mutaciones representan indeles heterocigóticos, cuyos efectos de pérdida de función
25 pueden compensarse por medio del alelo no afectado. Dado que durante la replicación del ADN, las roturas de una
sola hebra (SSB) se convierten en DSB, lo que activa la reparación de DSB por HR, expusimos 8 tumores
deficientes en MMR y 4 tumores competentes en MMR (9 cultivos de tumores primarios y 3 líneas de células
cancerosas) al inhibidor de PARP olaparib, que inhibe la reparación de SSB, y posteriormente se cuantificó el
número relativo de células con focos positivos para γH2AX y RAD51 como una medida del daño al ADN y HR activa,
30 respectivamente. Dado que ninguno de los tumores se sometió a secuenciación del exoma, lo que representa un
conjunto independiente de tumores deficientes en MMR, el estado de MMR se determinó utilizando nuestro panel de
56 marcadores y se confirmó utilizando el panel Bethesda. Aunque no observamos ninguna diferencia en la
formación de focos RAD51 entre cultivos tumorales deficientes MMR y competentes en MMR en ausencia de
olaparib (10 ± 2% de células frente al 13 ± 2% mostraron formación de focos de RAD51, P = 0,74; figura 7a,b), la
35 exposición a olaparib 10 µM desencadenó significativamente menos formación de focos de RAD51 en células
deficientes en MMR que en células competentes en MMR (19 ± 3% frente al 37 ± 4%; P = 0,02; figura 7a,b). Por el
contrario, al investigar el grado de daño al ADN no reparado por inmunofluorescencia H2AX, el olaparib aumentó
drásticamente el número de focos de γH2AX en todas las células independientemente de su estado de MMR (no se
muestra), lo que indica que la extensión del daño al ADN fue similar entre ambos cultivos. Dado que en las células
40 deficientes en BRCA1 o BRCA2, la formación de focos de RAD51 está completamente ausente tras la inhibición de
PARP (Farmer et al., 2005), estos datos sugieren que en las células deficientes en MMR, la vía de reparación de
DSB por HR solo se inactiva parcialmente.

209
ES 2 906 023 T3

Ejemplo 9. El inhibidor de PARP olaparib sensibiliza tumores deficientes en MMR

Dado que los tumores deficientes en MMR se caracterizan por una actividad reducida de la vía de reparación de
DSB por HR, planteamos la hipótesis de que estos tumores, similares a los tumores deficientes en BRCA1 (Farmer
5 et al., 2005), pueden ser dirigidos selectivamente por inhibición de PARP. Los 8 cultivos deficientes en MMR y los 4
cultivos competentes en MMR se expusieron todos de forma dependiente de la dosis (1, 3 y 10 µM) a olaparib y se
evaluaron los efectos sobre la proliferación. Los cultivos individuales deficientes en MMR, incluidos cada uno de los
6 cultivos de tumores primarios deficientes en MMR, mostraron una disminución de la proliferación dependiente de la
dosis tras la exposición a olaparib, mientras que ninguna de las células competentes en MMR se caracterizó por una
10 respuesta similar. En promedio, 1, 3 y 10 µM de olaparib redujeron la proliferación de células deficientes en MMR en
el 15%, 20% y 42% respectivamente (P = 0,02, P < 0,001 y P < 0,001, respectivamente frente a células no tratadas;
figura 7c), mientras que no se observó ningún efecto en los tumores competentes en MMR a las 48 horas (P = NS
para todas las concentraciones de olaparib; figura 7d). En general, la proliferación también difirió significativamente
entre tumores deficientes y competentes en MMR (P < 0,001 mediante medición repetida). Dado que las células
15 deficientes en BRCA1 y BRCA2 expuestas a, respectivamente, 3 µM y 10 µM de olaparib, se caracterizan por una
disminución del 78% y del 91% en la viabilidad (Farmer et al., 2005; Patel et al., 2012), estos datos "ex vivo"
confirman que las células deficientes en MMR, de forma coherente con su inactivación parcial de la la vía de
reparación de DSB por HR, se sensibilizan por inhibición de PARP.

20 Proliferación celular con el sistema xCELLigence

Se utilizó el sistema analizador de células en tiempo real (RTCA) xCELLigence (Roche Applied Science, Mannheim,
Alemania) para supervisar de forma dinámica las tasas de proliferación celular. El sistema mide la impedancia
eléctrica a través de microelectrodos en la parte inferior de las placas E de cultivo de tejidos. La medición de la
25 impedancia proporciona información cuantitativa sobre el número de células, su viabilidad, su morfología y su
adhesión. Se sembraron 5.000 células/pocillo en la placa E 16 (Roche) en 200 µl de medio. Las células se trataron
con olaparib 24 h después de la siembra hasta la concentración final deseada (1, 3, 10 µM de olaparib). El
porcentaje final de DMSO en todos los pocillos fue del 0,1%. Cada condición de tratamiento se midió por triplicado.
Los valores del índice de células dinámicas se supervisaron en intervalos de 5 minutos durante 48 h después de los
30 tratamientos. Los valores del índice de células se normalizaron con respecto al control tratado con vehículo para
cada célula. La figura siguiente muestra las tasas de proliferación celular para cada uno de los cultivos celulares (las
células deficientes en MMR se muestran en azul y las células competentes en MMR se muestran en rojo). En
resumen, las células deficientes en MMR se caracterizaron por una disminución de la proliferación dependiente de la
dosis, mientras que las células competentes en MMR no respondieron a olaparib (P = 2,0E-7 mediante medición
35 repetida; figuras 7c y e).

Discusión

A este respecto, secuenciamos el primer genoma completo de un tumor deficiente en MMR. Observamos que la
40 mayor parte de las sustituciones somáticas consistían en transiciones de nucleótidos y que los nucleótidos
adyacentes tenían un importante efecto dependiente del contexto sobre la determinación de qué nucleótidos estaban
afectados. Sorprendentemente, estos patrones de sustitución también se observaron en el ADN de línea germinal y
otros organismos eucariotas, y en estos genomas se correlacionaron con características importantes del genoma de
forma similar (Hodgkinson y Eyre-Walker, 2011). En particular, observamos un mayor número de sustituciones en las
45 secuencias de CpG metiladas, lo que involucra a la maquinaria de MMR en la reparación de la desaminación de
citosina metilada y demuestra que la MMR no canónica es fundamental para mantener la integridad genómica.

Además, la desaminación es uno de los procesos más importantes que subyacen a las mutaciones asociadas a
enfermedades humanas y la evolución. Desde esa perspectiva, es interesante notar que observamos una firma muy
50 similar en 10 exomas adicionales de tumores deficientes en MMR, en sustituciones de novo de la línea germinal y en
bases de datos SNP humanas y de ratón. En general, estas observaciones indican que, de forma similar a las
poblaciones bacterianas (Saint-Ruf y Matic, 2006), la reparación incompleta de errores de apareamiento en seres
humanos contribuye a la selección natural a través de la adaptación genética.

55 Aproximadamente la mitad de las mutaciones en el hipermutador representaban indeles. Es importante señalar que,
aunque en indeles de secuenciación de alto rendimiento la detección se carga con tasas muy altas de falsos
positivos, validamos el 92,7% de los indeles utilizando tecnologías ortogonales. La mayor parte de los indeles
afectan específicamente a tramos de homopolímeros. Esto es relevante porque el panel Bethesda ampliado, que se
utiliza actualmente para la clasificación diagnóstica de MSI, tiene únicamente una sensibilidad limitada (80%, 84% y
60 55% para tumores deficientes en MLH1, MSH2 y MSH6 (de la Chapelle y Hampel, 2010)), presumiblemente porque
consiste en 8 marcadores de microsatélites y solo 2 de homopolímeros. Nuestro panel de 56 marcadores de
mutaciones de punto caliente identificadas por secuenciación del exoma fue más sensible para detectar MSI,
especialmente en tumores EM, que se sabe que son más frecuentemente deficientes en MSH6 que en MLH1 o
MSH2. Además, dado que 45 de 56 marcadores se ubicaron en las UTR, que tienen menos probabilidades de
65 impulsar la selección clonal, pudimos detectar MSI-H en cánceres que afectan a diferentes tejidos. Finalmente, dado
que la mayor parte de los 56 marcadores se ubicaron en homopolímeros de ≤ 10 pb de longitud, estos marcadores
210
ES 2 906 023 T3

son compatibles con varias tecnologías de genotipado de bajo a alto rendimiento, tales como la extensión de un solo
par de bases (Sequenom MassArray), tecnologías de hibridación específica de alelos (TaqMan) y análisis de curvas
de fusión (incluido HRM). Los marcadores más sensibles en Bethesda (BAT25 y BAT26) son claramente menos
compatibles, ya que detectan indeles en homopolímeros de 25 y 26 pb.
5
Curiosamente, observamos que varios indeles en el exoma, todos los cuales representaban mutaciones de pérdida
de función, se producían como mutaciones de punto caliente. En promedio, cada tumor contenía 30 mutaciones de
punto caliente, lo que es significativamente alto en comparación con los intentos previos de secuenciación del
cáncer de tumores competentes en MMR (Nik-Zainal et al., 2012; Rausch et al., 2012). Los análisis de vías revelaron
10 además que la vía de reparación de DSB por HR estaba enriquecida en mutaciones; en promedio 3 mutaciones
afectaron a esta vía en cada tumor. Anteriormente se había informado de mutaciones en genes de reparación de
DSB, tales como MRE11A o RAD50, pero estos estudios se centraron en mutaciones específicas en genes
individuales más que en vías, y por este motivo solo pudieron establecer que una fracción de los tumores deficientes
en MMR está mutada en uno de estos genes (Miquel et al., 2007). Además, aunque está bien establecido que las
15 células deficientes en BRCA1 y BRCA2, así como las células deficientes en genes relacionados con la anemia de
Fanconi u otros genes relacionados con HR, son selectivamente hipersensibles a los inhibidores de PARP (Murai et
al., 2012), los datos que demuestran la selectividad de líneas celulares deficientes en MMR a la inhibición de PARP
no han sido concluyentes. El estudio más prometedor, hasta la fecha, observó una correlación débil pero significativa
entre los niveles de expresión de MRE11 y la citotoxicidad al inhibidor de PARP ABT-888, pero el posterior
20 silenciamiento de MRE11 en una línea celular MSS solo modificó modestamente la proliferación a altas
concentraciones del inhibidor (Vilar et al., 2011). Por el contrario, nuestro descubrimiento libre de hipótesis de que la
reparación de DSB por HR es la vía principal afectada por mutaciones de pérdida de función en tumores EM y CCR
deficientes en MMR, tanto en nuestro propio conjunto de datos como en el conjunto de datos públicos de TCGA,
sugiere que las mutaciones en varios genes en la vía cooperan para inactivar la reparación de DSB por HR en
25 tumores deficientes en MMR. El hallazgo de que cada cultivo de tumor primario deficiente en MMR, también aquellos
sin mutaciones MRE11, mostraba un efecto de respuesta a la dosis tras la exposición con olaparib, confirma
funcionalmente el efecto acumulado de estas mutaciones heterocigóticas.

Se han desarrollado varios inhibidores de PARP, tales como olaparib (AZD2281), veliparib (ABT-888) y niraparib
30 (MK-4827). Los estudios iniciales con estos inhibidores revelaron un beneficio clínico significativo en pacientes con
cáncer de mama o de ovario portadoras de mutaciones BRCA1 y BRCA2, sin causar toxicidad excesiva (Tutt et al.,
2010). A pesar de estos resultados alentadores, los inhibidores de PARP aún no se han aprobado (Maxwell y
Domchek, 2012). Uno de los principales obstáculos es la falta de una prueba diagnóstica aprobada por la FDA que
sea rentable. Las pruebas diagnósticas para analizar las mutaciones BRCA1 y BRCA2 no están aprobadas por la
35 FDA y los costes asociados son excesivamente altos. Como resultado, las compañías farmacéuticas han dudado en
iniciar estudios clínicos de fase 3 con inhibidores de PARP (Maxwell y Domchek, 2012). Nuestras observaciones de
que los tumores deficientes en MMR son sensibles a la inhibición de PARP son muy interesantes a este respecto.
En primer lugar, nuestro estudio identifica un segundo subgrupo de tumores que podrían ser sensibles a la inhibición
de PARP. Aunque se puede percibir que los tumores MSI representan solo una pequeña proporción de los tumores
40 CCR y EM, la población absoluta de pacientes con tumores MSI que podría beneficiarse es tan grande, si no mayor,
que la de las mutaciones BRCA1 o BRCA2 o incluso otros agentes dirigidos. En segundo lugar, las pruebas
diagnósticas complementarias para los tumores MSI ya están disponibles, ya sea utilizando procedimientos
tradicionales, como el panel Bethesda, o mediante el perfilado de mutaciones de punto caliente frecuentes. Por lo
tanto, la traducción de nuestras observaciones al entorno clínico podría ser más rápida que para los portadores de
45 mutaciones BRCA1 o BRCA2, y podría acelerarse aún más a través de nuestro panel de marcadores más sensible y
automatizable/escalable. En tercer lugar, existe una gran necesidad clínica de opciones de tratamiento dirigidas en
los tumores MSI. En particular, aunque los tumores de CCR en estadio II o III con MSI se caracterizan por un
pronóstico moderadamente mejorado, los tumores de MSI en el entorno avanzado se asocian con más metástasis
peritoneales y una peor supervivencia general independientemente del régimen de quimioterapia (Smith et al.,
50 2013).

Además, mientras que la resistencia clínica a la inhibición de PARP se ha atribuido a mutaciones secundarias que
restauran las proteínas BRCA1 o 2 de longitud completa, restableciendo así su función en las células tumorales
(Barber et al., 2012), es menos probable que se produzca este mecanismo para cada uno de los genes de
55 reparación de DSB afectados por mutaciones somáticas. Esto sugiere que es menos probable que los tumores
deficientes en MMR desarrollen resistencia contra los inhibidores de PARP, lo que los vuelve terapéuticamente más
valiosos a largo plazo.

Materiales y procedimientos
60
Detección de deficiencia de reparación de errores de apareamiento: para evaluar la expresión de MLH1, MSH2 y
MSH6 en muestras tumorales y de línea germinal correspondiente, se realizó una inmunohistoquímica utilizando los
anticuerpos monoclonales siguientes: clon ES05 para MLH1 (DAKO), clon G219-1129 para MSH2 (BD Pharmagen)
y clon EP49 para MSH6 (Epitomics). El estado de hipermetilación de las regiones promotoras de MLH1 se determinó
65 utilizando el kit SALSA MS-MLPA KIT (MRC-Holland). El estado de MSI se detectó mediante el panel Bethesda
ampliado. Selección y preparación de la muestra: seleccionamos 14 pares tumor-normal endometriales, 3
211
ES 2 906 023 T3

colorrectales y 3 de ovario para la secuenciación. El ADN tumoral se obtuvo a partir de tejido tumoral recién
congelado. Todas las muestras representaron tumores primarios no tratados previamente con quimioterapia. El ADN
normal correspondiente para estas 20 muestras se extrajo de glóbulos blancos periféricos. Se obtuvo un
consentimiento informado de todos los pacientes. Además, se secuenciaron 4 líneas celulares comerciales de
5 leucemia linfoblástica aguda de células T (DND41, CCRF-CEM, SUPT1 y RPMI-8402, obtenidas de DSMZ,
http://www.dsmz.de/). El ADN se extrajo utilizando el kit Qiagen DNAeasy para todas las muestras.

Secuenciación del genoma completo: se seleccionaron 5 pares tumor-normal, incluidos 3 pares EM y 2 pares de
ovario para la secuenciación del genoma completo. La secuenciación de extremos emparejados se realizó utilizando
10 el servicio Complete Genomics®, que incluye análisis de datos primarios (análisis de imágenes, llamadas de bases,
alineamiento y llamadas de variantes). Se utilizó el procedimiento calldiff de CGAtools
(http://cgatools.sourceforge.net) para seleccionar mutaciones somáticas. Para cada mutación somática, CGAtools
comunica una puntuación somática, lo que refleja la confianza de la mutación somática llamada. Las puntuaciones
más altas indican una mayor confianza. Utilizando los datos de validación generados por Sequenom MassARRAY,
15 determinamos el punto de corte óptimo para seleccionar mutaciones somáticas verdaderas y eliminar errores de
secuenciación de falsos positivos. Se aplicaron puntos de corte de puntuación somática a todas las listas de
mutaciones somáticas y para análisis posteriores solo se utilizaron las mutaciones con una puntuación superior a
estos umbrales.

20 Secuenciación del exoma de tumores deficientes en MMR: se capturaron exomas de 15 pares tumor-normal
endometriales, colorrectal y ovario utilizando el kit de enriquecimiento de exomas TruSeq (Illumina). La
secuenciación de extremos emparejados se realizó con los kits TruSeq SBS en el HiSeq2000 (2 x 75 pb para
muestras de ovario y EM, 2 x 100 pb para muestras de CCR). Se capturaron exomas de 4 genomas de leucemia
utilizando la biblioteca de exomas humanos Nimblegen SeqCap EZ v2.0. La secuenciación de Pairedend (2 x 50 pb)
25 se realizó con los kits TruSeq SBS en el HiSeq2000. Para todos los exomas, se usó BWA para alinear las lecturas
sin procesar de cada carril de secuenciación con el genoma de referencia humano usando parámetros
predeterminados. Las lecturas alineadas se procesaron y clasificaron con SAMtools (v.0.1.13) y los duplicados de
PCR se eliminaron con Picard MarkDuplicates. La recalibración de bases, el realineamiento local alrededor de
indeles y la llamada de variantes de un solo nucleótido se realizaron utilizando el kit GenomeAnalysisToolKit
30 (McKenna et al., 2010) (GATK v1.0.4487). Las sustituciones se llamaron usando el genotipador unificado GATK,
mientras que los indeles se detectaron usando Dindel (Albers et al., 2011) (v1.01). El filtrado de calidad inicial en las
sustituciones se realizó en función de la puntuación de calidad proporcionada por el llamador de variantes GATK.
Las mutaciones se retuvieron solo si la puntuación de calidad era superior a Q30 en el tumor y la muestra normal
correspondiente.
35
Anotación de datos del genoma completo y del exoma completo: los datos de la secuencia del genoma completo se
anotaron utilizando ANNOVAR y la pista de anotación UCSC RefGene hg18 (Wang et al., 2010). Las regiones de
repetición se determinaron usando "grepseq" (http://code.google.com/p/grepseq/). Los microsatélites se definieron
como repeticiones di-, tri-, tetra-, penta- y hexanucleotídicas que consisten en al menos dos unidades de repetición y
40 con una longitud mínima de 6 bases, homopolímeros como repeticiones mononucleotídicas con una longitud mínima
de 6 bases, homopolímeros cortos como repeticiones mononucleotídicas de 3, 4 o 5 bases de largo. La anotación de
las regiones de repetición se realizó mediante el comando intersectBed de BEDtools.

Disponibilidad de datos del exoma y del genoma completo: los archivos de variantes sin filtrar de todos los datos del
45 exoma y del genoma completo se han depositado en el Archivo Europeo de Genotipos y Fenotipos
(http://www.ebi.ac.uk/ega) con acceso restringido, con número de acceso EGAS00001000182 y EGAS00001000158.

Cultivos de tumores primarios e inmunofluorescencia: se establecieron nueve cultivos de células tumorales primarias
de endometrio y ovario a partir de tumores de las pacientes sometidas a cirugía. Se cultivaron cultivos de células
50 tumorales primarias en medio RPMI1640 (GIBCO) suplementado con FBS al 20%, L-glutamina 2 mM, penicilina 100
U/ml, estreptomicina 100 µg/ml, fungizona 1 µg/ml y gentamicina 10 µg/ml hasta 20 pases. Se sembraron 25.000
células/pocillo en portaobjetos de 8 pocillos (Nunc) en 400 µl de medio y se cultivaron durante 24 h. Después de la
exposición a olaparib 0 o 10 µM, los portaobjetos se enjuagaron en PBS, se fijaron en paraformaldehído a 37 ºC, se
permeabilizaron con Triton X-100 al 0,1% y se bloquearon con BSA. Las células se tiñeron con anticuerpo
55 monoclonal anti-fosfo-Histona H2A.X de ratón (Millipore clon JBW301, 1:100) o anticuerpo policlonal anti-Rad51 (H-
92) de conejo (Santa Cruz H-92, 1:1000) y se lavaron en Triton X-100 al 0,1% en PBS. Se utilizó Alexa Fluor 488
(Invitrogen) y los portaobjetos se montaron en el reactivo Prolong Gold Antifade que contenía DAPI (Molecular
Probes). El porcentaje de focos de células positivas (> 5 focos por núcleo) se determinó en un microscopio confocal
invertido Zeiss LSM 510 utilizando un objetivo de inmersión en aceite Plan-Neofluar 40x/1,3. Para cada experimento,
60 se analizaron al menos 100 núcleos.

Proliferación celular: se utilizó el analizador de células en tiempo real (RTCA) xCELLigence System (Roche) para
controlar dinámicamente las tasas de proliferación celular. Se sembraron 5.000 células/pocillo en la placa E 16
(Roche) en 200 µl de medio. Se disolvió olaparib (AZD-2281, JS Research Chemicals Trading) en DMSO. 24 h
65 después de la siembra, las células se trataron con olaparib (olaparib 1, 3, 10 µM). Cada condición se midió por

212
ES 2 906 023 T3

triplicado y todos los experimentos se realizaron por duplicado en diferentes puntos temporales. Los valores del
índice de células dinámicas se supervisaron durante 48 h después del tratamiento.

Materiales
5
El anticuerpo monoclonal anti-fosfo-Histona H2A.X (Ser139) de ratón (clon JBW301) era de Millipore Corporation,
Billerica, MA, Estados Unidos. El anticuerpo policlonal anti-Rad51 de conejo (H-92) era de Santa Cruz
Biotechnology, Santa Cruz, CA, Estados Unidos. El olaparib (AZD-2281, lote 3-8/10) se adquirió de JS Research
Chemicals Trading, Schleswig Holstein, Alemania y se preparó como solución madre en DMSO y se almacenaron 10
10 partes alícuotas a -20 ºC hasta su uso. El olaparib se diluyó adicionalmente 1:50 en los medios respectivos antes de
diluirlo 1:20 en el pocillo de la placa.

Inmunotinción de γH2AX

15 El grado de daño al ADN no reparado tras el tratamiento con olaparib se midió con inmunofluorescencia γH2AX.
Cuando hay una rotura de doble hebra en el ADN, H2AX se fosforila en serina 139 y se denomina γH2AX. Para la
inmunotinción de γH2AX, se sembraron 25.000 células/pocillo en portaobjetos de Lab-tek Permanox Chamber de 8
pocillos (Nunc) en 400 µl de medio y se incubaron durante 24 h a 37 ºC, 5% de CO2. Posteriormente, después de 24
h de incubación, las células se expusieron a olaparib 0 o 10 µM, los portaobjetos se enjuagaron en solución salina
20 tamponada con fosfato (PBS) y se fijaron en paraformaldehído al 4% durante 10 minutos a 37 ºC, se permeabilizaron
con Triton X-100 al 0,1% durante 5 minutos y se bloquearon con albúmina de suero bovino (BSA) al 5% durante 10
minutos, ambos a temperatura ambiente. Las células se tiñeron con una dilución 1:100 de anticuerpo monoclonal
anti-fosfo-Histona H2A.X (Ser139) de ratón (clon JBW301, Millipore). El anticuerpo primario se visualizó con IgG de
cabra anti-ratón Alexa Fluor-488 (Alexa) y se montó en el reactivo Prolong Gold Antifade con DAPI (Molecular
25 Probes). El tratamiento con olaparib 10 µM aumentó el número de focos de γH2AX 4-6 veces en comparación con el
valor inicial en todas las células independientemente de su estado de MMR, lo que indica que la medida del daño al
ADN de DSB fue similar entre ambos cultivos.

Inmunotinción de Rad51
30
La proteína RAD51 desempeña un papel importante en la vía de reparación de DSB por HR y la formación de focos
positivos a RAD51 se utiliza como marcador de la reparación de DSB por HR en curso. Para realizar la
inmunotinción RAD51, se sembraron 25.000 células/pocillo en portaobjetos Lab-tek Permanox Chamber de 8
pocillos (Nunc) en 400 µl de medio y se incubaron durante 24 h a 37 ºC, 5% de CO2 hasta el tratamiento con
35 olaparib. Después de 24 h de incubación tras la exposición a olaparib 0 o 10 µM, las células se lavaron con PBS a
temperatura ambiente y se fijaron en paraformaldehído al 3% con Triton X-100 al 0,1% en PBS durante 20 minutos a
37 ºC. Los portaobjetos se incubaron con una dilución 1:1000 de anticuerpo policlonal anti-Rad51 de conejo (H-92)
(Santa Cruz) durante 16 horas a 4 ºC, después se lavaron cuatro veces durante 15 minutos con Triton X-100 al 0,1%
en PBS. El anticuerpo primario se visualizó con IgG de cabra anti-ratón Alexa Fluor-488 (Alexa) y se montó en el
40 reactivo Prolong Gold Antifade con DAPI (Molecular Probes).

Microscopia confocal

Los focos de γH2AX y RAD51 se visualizaron con microscopio confocal invertido Zeiss LSM 510 utilizando un
45 objetivo de inmersión en aceite Plan-Neofluar 40x/1.3 y longitudes de onda de excitación de 488 y 750 nm (láser de
dos fotones coherente Chameleon). Mediante proyección máxima de enfoque, se adquirieron imágenes de
secciones ópticas separadas 1,20 µm y con un espesor de sección de 0,5 µm. Las imágenes se procesaron
utilizando el programa informático LSM510. Los núcleos con > 5 focos se puntuaron como positivos y se contaron al
menos 100 núcleos por cultivo y por condición.
50
Referencias

1. Stratton, M. R., Campbell, P. J. y Futreal, P. A. The cancer genome. Nature 458, 719-724 (2009).

2. Futreal, P. A. et al. A census of human cancer genes. Nat Rev Cancer 4, 177-183 (2004).

3. Loeb, L. A., Loeb, K. R. y Anderson, J. P. Multiple mutations and cancer. Proc Natl Acad Sci U S A 100, 776-781
(2003).

4. Loeb, L. A., Springgate, C. F. y Battula, N. Errors in DNA replication as a basis of malignant changes. Cancer Res
34, 2311-2321 (1974).

5. Loeb, L. A. Human cancers express mutator phenotypes: origin, consequences and targeting. Nat Rev Cancer 11,
450-457 (2011).

213
ES 2 906 023 T3

6. Poulogiannis, G., Frayling, I. M. y Arends, M. J. DNA mismatch repair deficiency in sporadic colorectal cancer and
Lynch syndrome. Histopathology 56, 167-179 (2010).

7. Beckman, R. A. y Loeb, L. A. Negative clonal selection in tumor evolution. Genetics 171, 2123-2131 (2005).

8. Jones, S. et al. Frequent mutations of chromatin remodeling gene ARID1A in ovarian clear cell carcinoma. Science
330, 228-231 (2010).

9. Boland CR, Thibodeau SN, Hamilton SR, et al: A National Cancer Institute Workshop on Microsatellite Instability
for cancer detection and familial predisposition: Development of international criteria for the determination of
microsatellite instability in colorectal cancer. Cancer Res 58:5248-5257, 1998.

10. Palomaki GE, McClain MR, Melillo S, et al: EGAPP supplementary evidence review: DNA testing strategies
aimed at reducing morbidity and mortality from Lynch syndrome. Genetics in Medicine 11:42-65, 2009.

11. Popat S, Hubner R, Houlston RS: Systematic review of microsatellite instability and colorectal cancer prognosis. J
Clinl Oncol 23:609-617, 2005.

12. Ribic CM, Sargent DJ, Moore MJ, et al: Tumor microsatellite-instability status as a predictor of benefit from
Fluorouracil-based adjuvant chemotherapy for colon cancer. N Engl J Med 349:247-257, 2003.

13. Des Guetz G, Schischmanoff O, Nocalas P, et al: Does microsatellite instability predict the efficacy of adjuvant
chemotherapy in colorectal cancer? A systematic review with meta-analysis. Euro J Cancer 45:1890-1896, 2009.

14. Dietmaier, W. et al. Diagnostic microsatellite instability: definition and correlation with mismatch repair protein
expression. Cancer Res 57, 4749-4756 (1997).

15. Umar, A. et al. Revised Bethesda Guidelines for hereditary nonpolyposis colorectal cancer (Lynch syndrome) and
microsatellite instability. J Natl Cancer Inst 96, 261-268 (2004).

16. de la Chapelle, A. y Hampel, H. Clinical relevance of microsatellite instability in colorectal cancer. J Clin Oncol 28,
3380-3387 (2010).

17. Pyatt R, Chadwick RB, Johnson CK, et al: Polymorphic variation at the BAT-25 and BAT-26 loci in individuals of
African origin: Implications for microsatellite instability testing. Am J Pathol 155:349-353, 1999.

18. Lindor, N. M. et al. Immunohistochemistry versus microsatellite instability testing in phenotyping colorectal
tumors. J Clin Oncol 20, 1043-1048 (2002).

19. Simpkins, S. B. et al. MLH1 promoter methylation and gene silencing is the primary cause of microsatellite
instability in sporadic endometrial cancers. Hum Mol Genet 8, 661-666 (1999).

20. Herman, J. G. et al. Incidence and functional consequences of hMLH1 promoter hypermethylation in colorectal
carcinoma. Proc Natl Acad Sci U S A 95, 6870-6875 (1998).

21. Quinlan, A. R. y Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics
26, 841-842 (2010).

22. Banerjea, A. et al. Colorectal cancers with microsatellite instability display mRNA expression signatures
characteristic of increased immunogenicity. Mol Cancer 3, 21 (2004).

23. Kapushesky, M. et al. Gene expression atlas at the European bioinformatics institute. Nucleic Acids Res 38,
D690-698 (2010).

24. Pinol, V. et al. Accuracy of revised Bethesda guidelines, microsatellite instability, and immunohistochemistry for
the identification of patients with hereditary nonpolyposis colorectal cancer. JAMA 293, 1986-1994 (2005).

25. Hewish, M., Lord, C. J., Martin, S. A., Cunningham, D. y Ashworth, A. Mismatch repair deficient colorectal cancer
in the era of personalized treatment. Nat Rev Clin Oncol 7, 197-208 (2010).

26. Heijink, D. M. et al. Perspectives for tailored chemoprevention and treatment of colorectal cancer in Lynch
syndrome. Crit Rev Oncol Hematol (2010).

27. Plaschke, J. et al. Aberrant protein expression and frequent allelic loss of MSH3 in colorectal cancer with low-
level microsatellite instability. Int J Colorectal Dis 27:911-919 (2012).

214
ES 2 906 023 T3

REIVINDICACIONES

1. Un procedimiento para diagnosticar el estado de MSI de un tumor, que comprende determinar la presencia de un
indel en al menos dos regiones homopoliméricas en una muestra del ADN del tumor, en el que las, al menos dos,
5 regiones homopoliméricas son

- al menos dos regiones homopoliméricas presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en
la tabla 1, o

10 - al menos tres regiones homopoliméricas seleccionadas de las presentes en los exones de los genes
enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1,

en el que dichas regiones homopoliméricas son regiones de microsatélites que son repeticiones mononucleotídicas
de al menos 6 nucleótidos y que no exceden de 20 nucleótidos, y en el que la presencia de un indel en el 2% o más
15 de las regiones homopoliméricas es indicativa de MSI.

2. El procedimiento según la reivindicación 1, en el que una de las regiones homopoliméricas se selecciona de las
regiones homopoliméricas de los genes MYL1, DIDO1, UBE2Z, RYR3, TMEM65, BTBD7, KDM5A, ABAT, PPM1A,
UBA6, ZNF185, ARL10, GRIA2 y TMC7 enumerados en la tabla 3.
20
3. El procedimiento según la reivindicación 1, en el que una de las regiones homopoliméricas se selecciona de las
regiones homopoliméricas de los genes MYL1, DIDO1, UBE2Z, RYR3, TMEM65, BTBD7, KDM5A, ABAT, PPM1A,
UBA6 y ZNF185 enumerados en la tabla 3.

25 4. El procedimiento según la reivindicación 2 o 3, en el que se selecciona una región homopolimérica adicional de la


región homopolimérica del gen MSH6 enumerado en la tabla 2 o la región homopolimérica del gen SULF2
enumerado en la tabla 1.

5. El procedimiento según la reivindicación 1, en el que al menos una región homopolimérica presente en la región 3'
30 UTR se selecciona de las regiones homopoliméricas presentes en los genes WIPF2, NARG2, AHCYL1, C17orf63,
CD5L, CEP170, COL5A2, CSNK1G3, DIDO1, EIF4G3, GSK3B, KCNMB4, MAPK1IP1L, NPR3, PI15, PRTG,
RASGRP1, SH3KBP1, SHROOM3, SLC5A3, UBE2Z, ZBTB33, ZNF275, AGPAT3, APH1B, BCL11A, BMPR1B,
CALN1, CASK, CBFB, CBX5, CCDC85C, CNOT7, CYP1B1, DRAM2, EDA2R, EDEM3, EGR1, EIF4G3, FAM20B,
FCHSD2, FLT1, FMO2, G3BP2, HELZ, HRNR, IER3IP1, KCNG1, KCNK1, KLF3, LHX9, LRRC8D, LYRM1, MED13,
35 MYO5B, NCEH1, PPP1R12A, PPP1R3D, RAB11FIP1, RAB6C, SAMD12, SEMA6A, SLAIN2, SMAD4, TMED7,
TMEM57, TMEM65, TNPO1, TOR1AIP2, TRAK2, TRIP11, UST, VEGFA, ZBTB7A, ZKSCAN1, ZNF12, y ZNF169
enumerados en la tabla 1 o la tabla 6; y/o en el que al menos una región homopolimérica presente en la región
exónica se selecciona de las regiones homopoliméricas presentes en los genes SETD1B, RBMXL1, CCDC150,
OR7E24, C15orf40, KIAA2018, LTN1, SLC22A9, CDH26, DDX27, EXOSC9, FAM111B, KIAA0182, KIAA1919,
40 MIS18BP1, PRRT2, TMEM60, AQP7, ARV1, CCDC168, ELAVL3, F8, FETUB, HPS1, NBEAL1, P4HTM, PIGB,
RBM43, RG9MTD1, SRPR, TMEM97, SEC31A, RNF145, RNPC3, SLC35F5, TMBIM4, CD3G, DOCK3, MYO10
enumerados en la tabla 2 o la tabla 7.

6. El procedimiento según una cualquiera de las reivindicaciones 1 o 5, en el que las, al menos dos, regiones
45 homopoliméricas son al menos dos regiones homopoliméricas seleccionadas de las presentes en las regiones 5'
UTR o 3' UTR de los genes enumerados en la tabla 1 y al menos dos regiones homopoliméricas seleccionados de
las presentes en los exones de los genes enumerados en la tabla 2.

7. El procedimiento según una cualquiera de las reivindicaciones 1 a 6, en el que las, al menos dos, regiones
50 homopoliméricas se seleccionan de las 56 regiones homopoliméricas que se muestran en la tabla 3.

8. El procedimiento según una cualquiera de las reivindicaciones 1 o 7, en el que las, al menos dos, regiones
homopoliméricas son al menos ocho regiones homopoliméricas.

55 9. El procedimiento según una cualquiera de las reivindicaciones 1 a 8, en el que la MSI se caracteriza además de la
forma siguiente: si el 17% o más de las regiones homopoliméricas contienen un indel, el tumor tiene una MSI alta, si
entre el 2% y el 17% de las regiones homopoliméricas contienen un indel, el tumor tiene una MSI baja y, si menos
del 2% de las regiones homopoliméricas contienen un indel, el tumor es estable en microsatélites.

60 10. El procedimiento según una cualquiera de las reivindicaciones 1 a 8, en el que la MSI se caracteriza además de
la forma siguiente: si el 20% o más de las regiones homopoliméricas contienen un indel, el tumor tiene una MSI alta,
si entre el 2,5% y el 20% de las regiones homopoliméricas contienen un indel, el tumor tiene una MSI baja y, si
menos del 2,5% de las regiones homopoliméricas contienen un indel, el tumor es estable en microsatélites.

215
ES 2 906 023 T3

11. El procedimiento según una cualquiera de las reivindicaciones 1 a 10, en el que la longitud de los
homopolímeros no excede de 15 nucleótidos, no excede de 14 nucleótidos, no excede de 13 nucleótidos, no excede
de 12 nucleótidos o no excede de 11 nucleótidos.

5 12. El procedimiento según una cualquiera de las reivindicaciones 1 a 9, en el que los homopolímeros tienen una
longitud de al menos 6 nucleótidos, de al menos 7 nucleótidos, de al menos 8 nucleótidos, de al menos 9 nucleótidos
o de al menos 10 nucleótidos.

13. El procedimiento según una cualquiera de las reivindicaciones 1 a 10, en el que los homopolímeros tienen una
10 longitud de 7 a 12 nucleótidos, de 7 a 11 nucleótidos o de 8 a 11 nucleótidos.

14. El procedimiento según cualquiera de las reivindicaciones 1 a 10, en el que la longitud de al menos uno de los
homopolímeros se encuentra entre 7 y 15 nucleótidos, se encuentra entre 8 y 15 nucleótidos, se encuentra entre 8 y
14 nucleótidos, se encuentra entre 8 y 13 nucleótidos, se encuentra entre 9 y 13 nucleótidos, se encuentra entre 10
15 y 13 nucleótidos, se encuentra entre 8 y 12 nucleótidos, se encuentra entre 9 y 12 nucleótidos, se encuentra entre 8
y 11 nucleótidos, se encuentra entre 9 y 11 nucleótidos o se encuentra entre 10 y 15 nucleótidos.

15. El procedimiento según una cualquiera de las reivindicaciones 1 a 14, que comprende además una etapa de
determinación del estado de uno o más marcadores del panel de marcadores Bethesda ampliado.
20
16. El procedimiento según una cualquiera de las reivindicaciones 1 a 15, en el que la determinación de la presencia
de un indel se realiza mediante tecnologías de extensión de un único par de bases, tecnologías de hibridación de
ADN o análisis de la curva de fusión.

25 17. El procedimiento según una cualquiera de las reivindicaciones 1 a 16, en el que el tumor se selecciona de entre
cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un tumor del síndrome de
Lynch.

18. Uso de un panel de al menos dos regiones homopoliméricas presentes en las regiones 5' UTR o 3' UTR de los
30 genes enumerados en la tabla 1 o de al menos tres regiones homopoliméricas seleccionadas de las presentes en los
exones de los genes enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes
enumerados en la tabla 1 en un procedimiento para diagnosticar el estado de MSI de un tumor según cualquiera de
las reivindicaciones 1 a 17, en el que dichas regiones homopoliméricas son regiones de microsatélites que son
repeticiones mononucleotídicas de al menos 6 nucleótidos y que no exceden de 20 nucleótidos.
35
19. Uso del panel de regiones homopoliméricas según la reivindicación 18, en el que las, al menos ocho, regiones
homopoliméricas son al menos ocho regiones seleccionadas de los genes enumerados en la tabla 3.

20. Uso del panel de regiones homopoliméricas según la reivindicación 18 o 19, en el que el panel comprende
40 adicionalmente un homopolímero en una región no codificante de al menos un gen seleccionado de ATM, ATR,
BLM, BRCA1, CHEK1, FANCD2, FANCE, FANCM, MRE11, RAD50 y RAD54.

21. Uso de un panel de regiones homopoliméricas de al menos tres regiones homopoliméricas seleccionadas de las
regiones homopoliméricas presentes en los genes MYL1, DIDO1, UBE2Z, RYR3, TMEM65, BTBD7, KDM5A, ABAT,
45 PPM1A, UBA6 y ZNF185 enumerados en la tabla 3 en un procedimiento de determinar la MSI en un tumor según
cualquiera de las reivindicaciones 1 a 17, en el que la presencia de al menos un indel es indicativa de MSI.

22. Uso del panel de regiones homopoliméricas según la reivindicación 21, en el que el panel comprende
adicionalmente una o más regiones homopoliméricas seleccionadas de las regiones homopoliméricas presentes en
50 los genes ARL10, GRIA2 y TMC7 enumerados en la tabla 3.

23. Uso del panel de regiones homopoliméricas según las reivindicaciones 21 o 22, en el que el panel comprende
adicionalmente la región homopolimérica del gen MSH6 enumerado en la tabla 2 o la región homopolimérica del gen
SULF2 enumerado en la tabla 1.
55
24. Uso del panel de regiones homopoliméricas según una cualquiera de las reivindicaciones 18 a 23, en el que los
homopolímeros tienen una longitud de 7 a 12 nucleótidos, de 7 a 11 nucleótidos o de 8 a 11 nucleótidos.

25. Un procedimiento de cribado de la sensibilidad de las células cancerosas al tratamiento con un inhibidor de una
60 enzima de reparación por escisión de bases de ADN, que comprende determinar el estado de MSI en dichas células
según un procedimiento de una cualquiera de las reivindicaciones 1 a 17.

26. El procedimiento según la reivindicación 25, en el que el inhibidor de una enzima de reparación por escisión de
bases de ADN es un inhibidor de PARP.
65

216
ES 2 906 023 T3

27. El procedimiento según la reivindicación 26, en el que el inhibidor de PARP se selecciona de entre olaparib,
veliparib, niraparib, iniparib, rucaparib, CEP9722, MK4827, BMN-673 y 3-aminobenzamida.

28. El procedimiento de una cualquiera de las reivindicaciones 25 a 27, en el que las células cancerosas son de un
5 cáncer seleccionado de entre cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y
un tumor del síndrome de Lynch.

29. Uso de un kit en un procedimiento para diagnosticar el estado de MSI de un tumor según una cualquiera de las
reivindicaciones 1 a 17, en el que el kit comprende oligonucleótidos específicos de alelo que discriminan entre los
10 alelos de las regiones homopoliméricas seleccionadas con y sin indeles.

30. El uso de un kit según la reivindicación 29, en el que las regiones homopoliméricas seleccionadas tienen una
longitud de 7 a 12 nucleótidos, de 7 a 11 nucleótidos o de 8 a 11 nucleótidos.

15 31. El uso de un kit según la reivindicación 29 o 30, en el que las regiones homopoliméricas se seleccionan de las
regiones homopoliméricas de los genes MYL1, DIDO1, UBE2Z, RYR3, TMEM65, BTBD7, KDM5A, ABAT, PPM1A,
UBA6 y ZNF185 enumerados en la tabla 3.

32. El uso de un kit según la reivindicación 31, en el que se selecciona una región homopolimérica adicional de las
20 regiones homopoliméricas de los genes ARL10, GRIA2 y TMC7 enumerados en la tabla 3.

33. El uso de un kit según la reivindicación 31 o 32, en el que se selecciona una región homopolimérica adicional de
las regiones homopoliméricas del gen MSH6 enumerado en la tabla 2 y la región homopolimérica del gen SULF2
enumerado en la tabla 1.
25
34. El uso de un kit según una cualquiera de las reivindicaciones 29 a 33 que comprende además oligonucleótidos
específicos de alelo que discriminan entre un alelo con y sin indeles, en el que el alelo se selecciona de los
marcadores del panel de marcadores Bethesda ampliado.

217
ES 2 906 023 T3

218
ES 2 906 023 T3

219
ES 2 906 023 T3

220
ES 2 906 023 T3

221
ES 2 906 023 T3

222
ES 2 906 023 T3

223
ES 2 906 023 T3

224
ES 2 906 023 T3

225
ES 2 906 023 T3

226
ES 2 906 023 T3

CUALQUIER REFERENCIA A LA FIGURA 7E


SE CONSIDERARÁ COMO NO EXISTENTE

227

También podría gustarte