Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PATENTES Y MARCAS
ESPAÑA
11 Número de publicación: 2 906 023
51Int. CI.:
C12Q 1/68 (2008.01)
30 Prioridad: 73 Titular/es:
10.04.2012 US 201261622383 P VIB VZW (50.0%)
26.04.2012 US 201261638955 P Rijvisschestraat 120
27.03.2013 EP 13161395 9052 Gent, BE y
45
LIFE SCIENCES RESEARCH PARTNERS VZW
Fecha de publicación y mención en BOPI de la (50.0%)
traducción de la patente:
72 Inventor/es:
12.04.2022
LAMBRECHTS, DIETHER
74 Agente/Representante:
LEHMANN NOVO, María Isabel
ES 2 906 023 T3
Aviso:En el plazo de nueve meses a contar desde la fecha de publicación en el Boletín Europeo de Patentes, de
la mención de concesión de la patente europea, cualquier persona podrá oponerse ante la Oficina Europea
de Patentes a la patente concedida. La oposición deberá formularse por escrito y estar motivada; sólo se
considerará como formulada una vez que se haya realizado el pago de la tasa de oposición (art. 99.1 del
Convenio sobre Concesión de Patentes Europeas).
E13717473
ES 2 906 023 T3 11-02-2022
DESCRIPCIÓN
Nuevos marcadores para detectar inestabilidad microsatelital en cáncer y determinar la letalidad sintética con inhibición
de la vía de reparación por escisión de bases de ADN
5
Campo de la invención
La presente solicitud se refiere al campo del cáncer, en particular a tumores deficientes en la reparación de errores de
apareamiento (MMR). En el presente documento se presentan nuevos marcadores que tienen una alta sensibilidad para
10 detectar si un tumor es deficiente en la reparación de errores de apareamiento o no. Los marcadores son, en particular,
mutaciones en regiones de microsatélites. En consecuencia, se proporcionan procedimientos para diagnosticar la
inestabilidad microsatelital de un tumor, que comprenden determinar la presencia de estos marcadores. Además, se
proporcionan kits para detectar la presencia de estos marcadores (o subconjuntos de los mismos) en una muestra.
15 Es interesante señalar que las mutaciones afectan preferentemente a la vía de reparación de roturas de doble hebra
(DSB) mediante recombinación homóloga (HR), y la reparación de DSB está funcionalmente alterada en los tumores
deficientes en MMR. En el presente documento se muestra que estos tumores son sensibles a la inducción de roturas
monocatenarias por inhibición farmacológica de la enzima poli ADP ribosa polimerasa (inhibición de PARP). En
consecuencia, se proporcionan nuevas modalidades de tratamiento para tumores deficientes en MMR, basadas en la
20 interacción letal sintética entre MMR y PARP.
Antecedentes
La forma de inestabilidad genómica asociada con la reparación defectuosa de errores de apareamiento del ADN en
25 tumores se denomina inestabilidad microsatelital (MSI). La inestabilidad microsatelital (MSI) es un cambio clonal en el
número de unidades de nucleótidos de ADN repetidas en microsatélites. Aparece generalmente en tumores con genes
de reparación de errores de apareamiento (MMR) defectuosos: el fallo del sistema MMR de ADN para reparar los errores
que se producen durante la replicación del ADN da como resultado una acumulación acelerada de mutaciones de un
solo nucleótido y alteraciones en la longitud de secuencias de microsatélites repetitivas simples que se producen de
30 forma ubicua a lo largo del genoma. La deficiencia en MMR representa una causa bien establecida del síndrome de
Lynch, que es un trastorno hereditario autosómico dominante de susceptibilidad al cáncer que es responsable del 2% al
5% de los cánceres endometriales (EM) o colorrectales (CCR). El síndrome de Lynch está provocado por mutaciones o
deleciones en los genes de la vía MMR (MLH1, MSH2, MSH3, MSH6 o PMS2) (Jiricny, 2006). Además, el silenciamiento
epigenético de MLH1, a menudo denominado síndrome de Lynch "esporádico", contribuye a otro 15% de estos tumores
35 (Kuismanen et al., 2002). Una mutación en la 3' UTR de MLH1 parece conferir una deficiencia en la reparación de errores
de apareamiento en un subconjunto de pacientes con leucemia (Mao et al. 2008, J Biol Chem 283: 3211-3216). La
deficiencia en MMR también se ha descrito en una minoría de cánceres de ovario, páncreas, gástricos, leucémicos y
varios otros cánceres. La deficiencia en la maquinaria MMR da lugar a errores de replicación del ADN en el tejido
tumoral, pero no en el tejido circundante normal. En particular, los errores somáticos se acumulan como mutaciones de
40 inserción/deleción en repeticiones mononucleotídicas y dinucleotídicas, un fenómeno conocido como inestabilidad
microsatelital (MSI) (Pinol et al., 2005).
Los tumores deficientes en MMR muestran un pronóstico y un resultado terapéutico diferente después de una
quimioterapia estándar (de la Chapelle y Hampel, 2010), tal como 5-fluoracilo y los agentes alquilantes tales como la
45 temozolomida. Los pacientes con CCR no tratados con tumores deficientes en MMR tienen un pronóstico
moderadamente mejor, pero no parecen beneficiarse de la quimioterapia adyuvante basada en 5-fluorouracilo, que es la
quimioterapia de primera elección para el CCR. En particular, en los tumores deficientes en MMR se toleran los errores
de apareamiento inducidos por el 5-fluorouracilo, lo que da lugar a incapacidad para inducir la muerte celular (Hewish et
al., 2010). Los tumores deficientes en MMR también son resistentes al cisplatino y al carboplatino, que son
50 quimioterapias de uso frecuente en EM (Hewish et al., 2010). Además, los tumores deficientes en MMR pueden ser
resistentes a las terapias dirigidas, incluidas las terapias anti-EGFR y anti-VEGF, porque adquieren mutaciones
secundarias en genes que activan vías de señalización alternativas o posteriores. Por ejemplo, los tumores MMR pueden
adquirir mutaciones en genes de reparación de rotura de doble hebra (por ejemplo, MRE11, ATR y RAD50), oncogenes
o supresores de tumores conocidos (por ejemplo, PIK3CA o PTEN). Otra posibilidad es que el silenciamiento epigenético
55 de MLH1 coincida con mutaciones particulares, tales como la mutación BRAF V600E (Ogino et al., 2012), que representa
un predictor negativo establecido de respuesta a terapias dirigidas anti-EGFR en CCR avanzado (De Roock et al., 2010).
Los esfuerzos para individualizar el tratamiento de tumores deficientes en MMR se han centrado en identificar
interacciones letales sintéticas con la vía MMR. En particular, los estudios revelaron que un aumento del daño oxidativo
60 (por exposición a metotrexato o silenciamiento de PINK1 (Martin et al., 2011)) y la interferencia con la vía de reparación
por escisión de bases (BER) (por inhibición de la ADN polimerasa γ o β (Martin et al., 2010)) sensibilizan tumores
deficientes en MMR. En particular, en los tumores MMR, el daño oxidativo induce lesiones en el ADN de 8-oxoguanina
(8-oxoG), que no se reparan de forma suficiente ni por la vía BER ni por la vía MMR, lo que genera principalmente
transversiones de dinucleótidos GC a TA a nivel del ADN, lo que da lugar a la muerte celular. Además, se ha planteado
65 la hipótesis de que existe una frecuencia de mutaciones máxima que un tumor puede tolerar, por encima de la cual un
aumento adicional de mutaciones sería perjudicial. Por lo tanto, se ha propuesto tratar adicionalmente los tumores MMR-
2
E13717473
ES 2 906 023 T3 11-02-2022
con análogos de nucleósidos mutagénicos hasta que se obtenga un nivel crítico de mutaciones que dé como resultado
una ablación del tumor similar a una catástrofe por error. Sin embargo, hasta la fecha, estos esfuerzos no se han
traducido en opciones de tratamiento clínicamente eficaces. Alternativamente, las mutaciones secundarias que se
producen como resultado de la deficiencia en MMR también pueden ser un objetivo (Dorard et al., 2011). No obstante,
5 los estudios que caracterizan los espectros de mutación secundaria de tumores deficientes en MMR se han limitado a
observaciones en uno o unos pocos loci informadores, o se han centrado exclusivamente en mutaciones en secuencias
de punto caliente conocidas. Aunque fueron capaces de establecer que las mutaciones afectan con mayor frecuencia a
las repeticiones mononocleotídicas y dinucleotídicas, el espectro de mutaciones somáticas que se produce en estos
tumores sigue estando caracterizado deficientemente.
10
Dado que la presencia de deficiencia en MMR principalmente en tumores colorrectales y endometriales representa una
forma familiar de cáncer, y dado que los tumores presentan espectros de mutación característicos de deficiencia en
MMR, se utilizan generalmente pruebas diagnósticas que evalúan la deficiencia en MMR.
15 Con mucho, el procedimiento más común para detectar MSI es medir la longitud de un amplicón de reacción en cadena
de la polimerasa que contiene el microsatélite completo. Esto requiere ADN, un par de cebadores de los cuales uno a
menudo está marcado de forma fluorescente en los extremos, un secuenciador y un programa informático adecuado.
Alternativamente, si el amplicón está secuenciado, se puede contar sencillamente el número de unidades de repetición.
La MSI también puede diagnosticarse indirectamente mediante la detección de la pérdida de tinción por
20 inmunohistoquímica (IHC) de uno de los genes de reparación de errores de apareamiento, dado que esto también
apunta a una anomalía en la reparación de errores de apareamiento. Los procedimientos inmunohistoquímicos y
genéticos se caracterizan por un número considerable de falsos negativos y, por este motivo, las evaluaciones
combinadas a nivel inmunohistoquímico y genético se realizan en un entorno de diagnóstico de rutina.
25 Existen al menos 500.000 microsatélites en el genoma humano y, dado que una MMR defectuosa no afecta a todos los
microsatélites de un tumor determinado, es importante estudiar más de un microsatélite y estudiar los microsatélites que
se ven afectados por inestabilidad con frecuencia. Como los marcadores de microsatélites se eligieron originariamente
de forma bastante aleatoria por los investigadores, basándose en sus propios experimentos, se celebró una conferencia
en Bethesda, MD, para discutir los problemas y hacer sugerencias para promover la coherencia entre estudios. Esta dio
30 como resultado una recomendación para un panel marcador "estándar de oro", conocido como el panel Bethesda 9. Este
panel consta de tres repeticiones dinucleotídicas (D2S123, D5S346, D17S250) y dos repeticiones mononucleotídicas
(BAT26, BAT25) y sigue siendo la prueba estándar para MSI. Se propuso considerar un tumor positivo en MSI si el 40%
o más de los marcadores analizados eran inestables (también denominados de MSI alto o MSI-H). Si se utiliza el panel
de cinco marcadores, esto significa que se denomina MSI cuando al menos dos de los mismos son positivos; no
35 obstante, a menudo cuatro o los cinco son positivos en tumores con MSI. Los tumores que dan negativo en los cinco
marcadores se denominan estables en microsatélites (MSS). Para los tumores que dieron positivo en 1 marcador tumoral
(o en < 30% de los marcadores tumorales), se propuso el término MSI-L9. Una repetición T-20 en la 3' UTR del gen
MTX1 se notificó como un marcador MSI adicional para el cáncer colorrectal (Morandi et al. 2011, Int J Colorectal Dis 27:
647-656).
40
Aunque el panel Bethesda todavía se considera el criterio a seguir, se sabe que tiene una sensibilidad bastante baja
(también dependiendo de qué gen MMR esté mutado). Por ejemplo, para pacientes con mutaciones MLH1, la
sensibilidad es del 80%, pero para pacientes con mutaciones MSH6, es de solo el 55%10. Esto se puede mejorar
añadiendo marcadores10 adicionales, pero aún así, los pacientes con MSI-H real pueden presentarse como MSI-L o
45 MSS. Esto no deja de ser significativo, ya que el estado de MSI es importante en el pronóstico (generalmente es mejor
para los pacientes con MSI-H11), el tratamiento (los tumores MSI-H no responden a la terapia adyuvante basada en
fluorouracilo (FU), ya que se necesita un sistema MMR intacto para inducir la apoptosis de células con ADN modificado
por FU11-13) y el diagnóstico de varios cánceres (por ejemplo, los del síndrome de Lynch), y los pacientes con cáncer
colorrectal (CCR) recién diagnosticado se criban de forma rutinaria para determinar el estado de MSI. Los inhibidores de
50 PARP (poli (ADP-ribosa) polimerasa) en el contexto de MSI y mutaciones de genes de reparación de ADN se abordan
por Gaymes et al. 2010 (Blood 116:513) y Vilar et al. 2011 (Cancer Res 71: 2632-2642; de forma específicamente
relacionada con la deficiencia en MRE11 en cáncer colorrectal). Se ha divulgado una clase específica de inhibidores de
PARP para el tratamiento de síndrome mielodisplásico y leucemia mieloide aguda (documento WO2012/166151).
55 Otra desventaja significativa es que el panel Bethesda solo se recomienda para el cáncer de colon, aunque se conocen
otros cánceres que muestran MSI9. Parece que esto se debe al hecho de que se identificó de forma bastante aleatoria
que los cinco marcadores estaban mutados en cáncer de colon inestable en microsatélites, pero no se conoce ningún
mecanismo biológico. En el contexto del síndrome de Lynch y MSI, se redactaron directrices Bethesda revisadas, tal
como se aborda por Umar et al. 2004 (J Nat Cancer Inst 96: 261-268).
60
Otra desventaja es de naturaleza técnica. El panel de marcadores Bethesda contiene repeticiones bastante largas (por
ejemplo, el marcador BAT26 contiene una repetición A de 26 nucleótidos), y los productos de PCR típicos utilizados para
determinar el estado de MSI se encuentran muy por encima de 100 pb. Para secuenciar con precisión estos fragmentos
y determinar la longitud exacta de la repetición, normalmente se utilizan procedimientos de secuenciación basados en
65 Sanger junto con electroforesis en gel multicapilar. Sin embargo, cada vez más laboratorios utilizan la secuenciación
denominada de "próxima generación", que emplea técnicas de secuenciación masivamente paralelas. Si bien son más
3
E13717473
ES 2 906 023 T3 11-02-2022
económicas, estas tecnologías utilizan lecturas más cortas y no pueden utilizarse para detectar inestabilidad
microsatelital en el panel de marcadores Bethesda. Como consecuencia, los laboratorios deben mantener dos
secuenciadores: uno para el cribado del panel de marcadores Bethesda y otro para otros experimentos. Sería mucho
más conveniente si no se requiriera un secuenciador especial para determinar el estado de MSI y esta determinación
5 pudiera realizarse en equipos de uso común. El documento US6664064 se refiere a un procedimiento para el análisis de
la curva de fusión de productos de PCR repetitivos.
Por lo tanto, sería ventajoso encontrar marcadores de inestabilidad microsatelital que fueran más sensibles que el
panel Bethesda que se utiliza actualmente y que conservaran al mismo tiempo la especificidad para MSI. De forma
10 ideal, estos marcadores se encuentran utilizando procedimientos de detección no sesgados (es decir, que observen
la totalidad del genoma en lugar de verificar regiones específicas que se supone que están alteradas en el contexto
de la enfermedad). Una ventaja adicional sería la identificación de marcadores que fueran indicativos de MSI como
tales. Es decir, que fueran un marcador general de inestabilidad microsatelital, y no solo de inestabilidad
microsatelital en el cáncer de colon (como es el caso del panel Bethesda). De hecho, esto evitaría la necesidad de
15 encontrar nuevos marcadores para cada cáncer en el que pueda haber presencia de MSI. Una ventaja adicional
sería la identificación de marcadores cuyo estado se pudiera determinar independientemente de la tecnología. Más
particularmente, marcadores que pudieran identificarse utilizando tecnologías de secuenciación de próxima
generación (en lugar de identificarse únicamente mediante secuenciación de Sanger). De esta forma, los
laboratorios no necesitan aferrarse a un aparato que solo utilizan para verificar los marcadores del panel Bethesda.
20 Además, también existe una gran necesidad de optimizar aún más las terapias específicas de MMR, por ejemplo
para predecir de forma más racional su respuesta a las terapias dirigidas. Además, existe la necesidad de encontrar
formas de superar la resistencia a las terapias de uso común, por ejemplo mediante la identificación de terapias a las
que los tumores deficientes en MMR sean sensibles, incluso aunque sean resistentes al tratamiento estándar.
25 Sumario
Es un objeto de la invención proporcionar mejores marcadores para determinar el estado de MSI de un cáncer
particular. Para asegurar que la detección no fuera sesgada, informamos en el presente documento, por primera
vez, de la secuenciación de próxima generación de tumores deficientes en la reparación de errores de
30 apareamiento. Los marcadores se eligen de forma que no estén en microsatélites largos, de modo que su detección
no dependa de la metodología de secuenciación de Sanger. Además, para ampliar la aplicabilidad de marcadores,
se evaluaron marcadores en diferentes tipos de tumores de modo que representaran marcadores de inestabilidad
microsatelital en varios cánceres, y no marcadores específicos del tipo de cáncer. Finalmente, se seleccionaron
marcadores que se encontraran de forma recurrente en los tumores. Es interesante señalar que muchas de las
35 mutaciones (de punto caliente) recurrentes agrupadas en genes afectan a la vía de reparación de roturas de doble
hebra de ADN, y podría demostrarse que esta vía también se ve afectada funcionalmente. Como resultado, se pudo
demostrar que los tumores positivos a estos marcadores son sensibles a la inhibición con inhibidores de enzimas de
reparación por escisión de bases de ADN, tales como los inhibidores de PARP: esto da como resultado una
interacción letal sintética.
40
Tal como se ampliará en la sección Ejemplos, la secuenciación de próxima generación permitió la identificación de
un nuevo panel de marcadores que puede utilizarse para detectar deficiencia en MMR y que estaba de acuerdo con
estas condiciones.
45 Los marcadores identificados se pueden dividir en dos clases: indeles presentes en regiones de microsatélites de
regiones codificantes (es decir, exones) e indeles presentes en regiones no codificantes (más particularmente
regiones 5' y 3' UTR) de genes específicos.
- al menos dos regiones homopoliméricas presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en
la tabla 1, o
55
- al menos tres regiones homopoliméricas seleccionadas de las presentes en los exones de los genes
enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1,
en los que dichas regiones homopoliméricas son regiones de microsatélites que son repeticiones mononucleotídicas
60 de al menos 6 nucleótidos y que no exceden de 20 nucleótidos, y en los que la presencia de un indel en el 2% o más
de las regiones homopoliméricas es indicativa de MSI.
Según otras formas de realización particulares más, las regiones de microsatélites son idénticas a las regiones de
microsatélites identificadas en la tabla 1 o 2 (es decir, las, al menos dos, regiones de microsatélites se seleccionan
65 de la lista de regiones de microsatélites enumeradas en la tabla 1 o 2).
4
E13717473
ES 2 906 023 T3 11-02-2022
Según formas de realización específicas, las regiones de microsatélites presentes en las UTR pueden seleccionarse
de la tabla 4 en lugar de de la tabla 1. Según otras formas de realización específicas, estas regiones de
microsatélites se pueden seleccionar de la tabla 6 en lugar de de la tabla 1.
5 Según formas de realización específicas alternativas pero no exclusivas, las regiones de microsatélites presentes en
los exones de genes se pueden seleccionar de la tabla 5 en lugar de de la tabla 2. Según otras formas de realización
específicas, las regiones se pueden seleccionar de la tabla 7 en lugar de de la tabla 2.
Según formas de realización muy particulares, las regiones de microsatélites pueden seleccionarse de los genes
10 enumerados en la tabla 8.
Según formas de realización particulares, el cáncer o el tumor para el que se diagnostica el estado de MSI se
selecciona del grupo de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un
tumor del síndrome de Lynch.
15
Como los indeles presentes en microsatélites de regiones no codificantes (tales como las regiones 5' y 3' UTR) están
sujetos a menos presión de selección que los indeles presentes en regiones codificantes (dado que estos últimos
causan mutaciones de desplazamiento de marco que dan como resultado una traducción completamente diferente
de la original), pudo demostrarse que los indeles presentes en microsatélites de regiones no codificantes son
20 marcadores más fiables de MSI en todos los tipos de cáncer. De hecho, más del 50% de los marcadores no
codificantes identificados en el presente documento obtienen resultados positivos cuando se someten a ensayo en
tumores deficientes en MMR con MSI comprobada. Para los marcadores exónicos, todavía más de 1/3 obtuvo
resultados positivos cuando se sometieron a ensayo en estos tumores. Esto explica por qué se prevé utilizar al
menos tres marcadores cuando al menos parte de los marcadores se encuentren en regiones exónicas.
25
También se prevé particularmente utilizar combinaciones de marcadores presentes en regiones exónicas y
marcadores presentes en regiones no codificantes. Por ejemplo, según formas de realización particulares, las, al
menos dos, regiones de microsatélites en las que se determina la presencia de un indel son al menos dos regiones
de microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la
30 tabla 1 y en al menos dos regiones de microsatélites seleccionadas de las presentes en los exones de los genes
enumerados en la tabla 2.
Según formas de realización específicas, se prevé utilizar más marcadores que al menos dos o tres. El uso de más
marcadores normalmente producirá un diagnóstico más preciso (aunque este beneficio deberá compensarse con un
35 aumento de los costes. Además, una vez que se supera un determinado umbral de marcadores, el valor relativo de
añadir otro marcador es limitado, ya que no necesariamente añade información). Por lo tanto, según formas de
realización particulares, se utilizan al menos cuatro, cinco, seis, siete u ocho marcadores (es decir, indeles presentes
en regiones de microsatélites seleccionadas de entre las presentes en los exones de los genes enumerados en la
tabla 2 y/o las presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1). Según otras
40 formas de realización particulares, la presencia de al menos 8, 9, 10, 11 o 12 indeles en regiones de microsatélites
seleccionadas de entre las presentes en los exones de los genes enumerados en la tabla 2 y/o las presentes en las
regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1 se utilizan para determinar el estado de MSI.
Según incluso otras formas de realización particulares, se utilizan todavía más marcadores, por ejemplo al menos
15, al menos 20, al menos 25, al menos 30, al menos 35, al menos 40 marcadores o al menos 50 marcadores.
45
Según formas de realización específicas, al menos un marcador utilizado es un marcador exónico presente en un
gen no asociado previamente con cáncer, o en un gen que no se sabía previamente que estuviera afectado en
tumores deficientes en MMR. Por lo tanto, se prevé que el microsatélite o los microsatélites seleccionados de entre
los presentes en los exones de los genes enumerados en la tabla 2 comprendan al menos un microsatélite presente
50 en un gen seleccionado de la lista de: SETD1B, RBMXL1, CCDC150, OR7E24, C15orf40, KIAA2018, LTN1,
SLC22A9, CDH26, DDX27, EXOSC9, FAM111B, KIAA0182, KIAA1919, MIS18BP1, PRRT2, TMEM60, AQP7,
ARV1, CCDC168, ELAVL3, F8, FETUB, HPS1, NBEAL1, P4HTM, PIGB, RBM43, RG9MTD1, SRPR, y TMEM97.
Según formas de realización aún más específicas, al menos un microsatélite está presente en un gen seleccionado
de la lista de: SETD1B, TMEM60, DDX27, EXOSC9, FAM111B y KIAA1919. Según formas de realización
55 alternativas, SEC31A, CNOT2, RNF145, RNPC3, SLC35F5, TMBIM4, CD3G, DOCK3, MYO10 y PRRG1 también
pueden utilizarse en estas listas.
Según formas de realización específicas alternativas, al menos un marcador utilizado es un indel presente en un
homopolímero de entre 10 y 15 bases de repetición situado en una región 5' o 3' UTR.
60
Un panel de marcadores particularmente previsto son los microsatélites presentes en los genes que se muestran
en la tabla 3. Por lo tanto, según estas formas de realización, se proporcionan procedimientos en los que se
determina la presencia de un indel en al menos dos regiones de microsatélites en una muestra del ADN tumoral,
en los que las, al menos dos, regiones de microsatélites son regiones de microsatélites de los 56 genes que se
65 muestran en la tabla 3.
5
E13717473
ES 2 906 023 T3 11-02-2022
Según formas de realización particulares, el estado de MSI se puede caracterizar además de la forma siguiente: si el
17% o más de las regiones de microsatélites estudiadas contienen un indel, el tumor es MSI-H, si entre el 2% y el
17% de las regiones de microsatélites contiene un indel, el tumor es MSI-L, y si menos del 2% de las regiones de
microsatélites contienen un indel, el tumor es estable en microsatélites (MSS). A modo de ejemplo, para un panel de
5 56 marcadores, si 0 o 1 marcadores son positivos, el tumor se clasifica como MSS, para 2 a 9 marcadores positivos,
el tumor es MSI-L, y para 10 o más marcadores positivos, el tumor se clasifica como MSI-H. Alternativamente, el
intervalo del panel Bethesda se puede extrapolar (0 de 10 marcadores positivos es MSS, 1 o 2 de cada 10
marcadores positivos es MSI-L, 3 o más marcadores positivos es MSI-H; que corresponde a límites de entre el 1 y el
9% de marcadores positivos para la distinción entre MSS y MSI-L y de más del 20% de marcadores positivos para la
10 clasificación como MSI-H).
Según un aspecto específico, los marcadores de indeles de microsatélites proporcionados en el presente documento
pueden detectarse independientemente de la tecnología utilizada. Sin embargo, se prevé particularmente que la
determinación de la presencia de un indel no se realice mediante un procedimiento basado en la secuenciación de
15 Sanger. Esto se debe a que el proceso de detección de la inestabilidad microsatelital utilizando el panel de
marcadores Bethesda se realiza normalmente mediante la secuenciación de Sanger, un protocolo que resulta
bastante engorroso. Según formas de realización adicionales, se prevé particularmente determinar la presencia de
un indel por medio de procedimientos de extensión de un único par de bases (tales como Sequenom MassArray),
tecnologías de hibridación de ADN (por ejemplo, Taqman), análisis de la curva de fusión (incluido HRM) o una
20 tecnología similar.
Según otro aspecto, se proporciona el uso de un panel de biomarcadores tal como se describe en las
reivindicaciones 18 a 24 para determinar la MSI en una muestra tumoral. Según formas de realización particulares,
el panel de biomarcadores comprende al menos la mitad de las regiones de microsatélites enumeradas en la tabla 3.
25 Según otras formas de realización particulares más, el panel de biomarcadores está representado por las 56
regiones de microsatélites enumeradas en la tabla 3.
En particular, se prevé que este panel de biomarcadores pueda utilizarse para detectar el estado de MSI en un
cáncer. En consecuencia, el uso de este panel de biomarcadores se proporciona en el diagnóstico de inestabilidad
30 microsatelital en cáncer.
En consecuencia, los paneles de biomarcadores descritos en el presente documento se proporcionan para su uso
como diagnóstico. Incluso más particularmente, los paneles de biomarcadores tal como se describen en el presente
documento se proporcionan para su uso en el diagnóstico de inestabilidad microsatelital en cáncer.
35
Tal como se muestra en la sección Ejemplos, los marcadores de indeles proporcionados en el presente documento
están enriquecidos en genes implicados en las vías de reparación de roturas de doble hebra de ADN y afectan a su
funcionalidad. Como consecuencia, las células en las que están presentes estos marcadores son sensibles a
letalidad sintética por inhibición de la reparación por escisión de bases de ADN. Esto ofrece nuevas oportunidades
40 terapéuticas, ya que los tumores positivos en MSI a menudo son resistentes a las quimioterapias estándar utilizadas.
55 Según formas de realización específicas, las células cancerosas son células obtenidas de un sujeto, y el cribado de
la sensibilidad al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN se utiliza
para guiar el tratamiento del sujeto. Según formas de realización alternativas, el cribado de sensibilidad se usa para
estratificar o clasificar al sujeto para un ensayo clínico.
60 Según formas de realización particulares, la presencia de MSI se establece mediante un procedimiento descrito en
el presente documento. Según formas de realización particulares adicionales, la presencia de MSI se establece
utilizando un panel de biomarcadores tal como se describe en las reivindicaciones 18 a 24.
Por lo tanto, no solo se proporcionan procedimientos para detectar la sensibilidad de las células cancerosas, sino
65 también procedimientos para diagnosticar la sensibilidad de un sujeto con cáncer al tratamiento con un inhibidor de
una enzima de reparación por escisión de bases de ADN, que comprende las etapas siguientes:
6
E13717473
ES 2 906 023 T3 11-02-2022
- determinar el estado de MSI en una muestra de células cancerosas obtenidas del sujeto;
- correlacionar el estado de MSI con la sensibilidad al tratamiento con un inhibidor de una enzima de reparación
5 por escisión de bases de ADN, siendo la presencia de MSI indicativa de sensibilidad al tratamiento.
Opcionalmente, estos procedimientos contienen una etapa adicional de obtención de una muestra de células
cancerosas del sujeto (antes de la etapa de determinación). La determinación del estado de MSI generalmente se
realiza en las células de la muestra obtenida. En particular, se prevé que la determinación del estado de MSI en una
10 muestra de células cancerosas se realice in vitro.
Según formas de realización particulares, el inhibidor de una enzima de reparación por escisión de bases de ADN es
un inhibidor de PARP. Según formas de realización específicas, las células cancerosas son de un cáncer
seleccionado de la lista de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un
15 tumor del síndrome de Lynch (o cualquier otro tumor del espectro del síndrome de Lynch). Según formas de
realización particulares, la presencia de MSI se establece mediante un procedimiento descrito en el presente
documento.
Según formas de realización particulares adicionales, la presencia de MSI se establece utilizando un panel de
20 biomarcadores tal como se describe en las reivindicaciones 18 a 24 en el presente documento.
También se prevé que los procedimientos según este aspecto pueden contener una etapa adicional de tratamiento
del sujeto con un inhibidor de una enzima de reparación por escisión de bases del ADN (si el sujeto es sensible a
dicho tratamiento, según se ha determinado mediante el estado de MSI).
25
Por lo tanto, también se proporcionan procedimientos para tratar un cáncer con MSI en un sujeto que lo necesite,
que comprenden:
Se prevé que el cáncer se trate mediante la administración del inhibidor al sujeto. Los procedimientos pueden
presentar opcionalmente una etapa adicional de obtención de una muestra de células cancerosas del sujeto (antes
35 de la etapa de determinación de MSI y de establecer la presencia de MSI).
Según formas de realización particulares, el inhibidor de una enzima de reparación por escisión de bases de ADN es
un inhibidor de PARP. Según formas de realización específicas, las células cancerosas son de un cáncer
seleccionado de la lista de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un
40 tumor del síndrome de Lynch. Según formas de realización particulares, la presencia de MSI se establece mediante
un procedimiento descrito en el presente documento.
Según formas de realización particulares adicionales, la presencia de MSI se establece utilizando un panel de
biomarcadores tal como se describe en las reivindicaciones 18 a 24 en el presente documento.
45
Breve descripción de las figuras
50 (a) Frecuencias de mutación promedio (número de mutaciones por base, mpb) en el tumor deficiente en MMR y en
dos tumores competentes en MMR. (b) Frecuencia de mutación estratificada por indeles y sustituciones. (c-d) La
fracción de indeles (c) y sustituciones (d) observada en microsatélites, homopolímeros (longitud superior a 5 pb),
homopolímeros cortos (longitud de 3 a 5 pb) y "regiones no en repetición" en comparación con su fracción esperada
en estas regiones. (e-f) Frecuencias de indeles (e) y sustituciones (f) en el tumor deficiente en MMR estratificadas en
55 regiones exónicas, intergénicas e intrónicas.
(a) Patrones de sustitución somática en secuencias de genoma completo de melanoma, cáncer de pulmón de
60 células pequeñas, cáncer de pulmón de células no pequeñas, tumor endometrial deficiente en MMR, dos tumores
endometriales competentes en MMR y ADN de línea germinal correspondiente (glóbulos blancos periféricos) del
paciente con tumor endometrial. (b-c) Estratificación de la frecuencia de sustitución somática en tumores deficientes
en MMR (b) y competentes en MMR (c) por dinucleótido, estando el primer nucleótido mutado. Las frecuencias de
sustitución normalizadas reflejan el número de dinucleótidos afectados dividido por el número de esos dinucleótidos
65 en el genoma completo, expresado como porcentaje de las frecuencias de sustitución totales. (d) Modelado de
regresión lineal multivariante de características del genoma que predicen frecuencias de sustituciones en el tumor
7
E13717473
ES 2 906 023 T3 11-02-2022
deficiente en MMR. Se muestran mapas de calor de los datos de características del genoma ordenados según el
número de sustituciones que visualizan las correlaciones entre las frecuencias de sustitución y las características del
genoma. Los valores T resultantes del modelo lineal se muestran para cada característica del genoma en los
gráficos de barras a la derecha de los mapas de calor e indican la importancia (el sombreado en gris es igual a P >
5 0,01) y la dirección de la correlación. Para acomodar las diferentes escalas de cada característica en un solo mapa
de calor, los datos de características del genoma se muestran distribuidos por percentiles, indicando el blanco y el
rojo, respectivamente, los centiles bajo y alto. Las transiciones G:C>A:T en sitios CpG se agruparon en ventanas de
10 Mb ya que los números eran insuficientes para el modelado por ventana de 1 Mb. (e) Frecuencia de
sustituciones, transiciones (excluidas G:C>A:T en CG) y transversiones en el hipermutador por ventana de 1 Mb,
10 frente al tiempo de replicación de esa ventana agrupada por decil. Las frecuencias se muestran en relación con las
ventanas que se replican más temprano. Las barras de error indican el error estándar de la media (P < 0,01 para
sustituciones y transiciones en tiempos de replicación superiores a 0,2). (f) Frecuencia de sustituciones, transiciones
(excluidas G:C>A:T en CG) y transversiones dentro y fuera de las islas CpG, con respecto a su frecuencia en el
genoma completo en el hipermutador. (g) Modelado de regresión lineal multivariante de características del genoma
15 que predicen la frecuencia de indeles en el tumor deficiente en MMR. El mapa de calor y el gráfico de barras son tal
como se describen para el panel (d). (h) Fracción de homopolímeros afectados por un indel estratificada por
nucleótido en el tumor deficiente en MMR en comparación con la fracción en el genoma completo de homopolímeros
con ese contenido de nucleótidos. (i) Fracción de todos los indeles que insertan o eliminan el número de bases
indicado. (j-k) La distancia entre una sustitución somática y el indel (j) o sustitución (k) somáticos más cercanos en el
20 hipermutador, y la distancia esperada basada en 200 modelos aleatorios.
(a) Frecuencias de mutación promedio en los exones codificantes de 10 tumores deficientes en MMR y 4 tumores
25 competentes en MMR. (b) Frecuencia de mutación promedio en los exones codificantes de 10 tumores deficientes
en MMR frente a 4 tumores competentes en MMR estratificada para indeles y sustituciones. (c-d) Estratificación de
frecuencias de sustitución por dinucleótido (estando el primer nucleótido mutado) en exones deficientes en MMR (c)
y un conjunto de sustituciones de novo de la línea germinal publicadas (d). Las frecuencias de sustitución
normalizadas representadas en la gráfica reflejan el número de dinucleótidos afectados dividido por el número de
30 esos dinucleótidos en el genoma completo y expresado como porcentaje del total de frecuencias de sustitución
somática. (e) La fracción de indeles observada en microsatélites, homopolímeros, homopolímeros cortos y en
regiones no en repetición en tumores deficientes en MLH1 y MSH2 en comparación con la fracción del genoma
completo de estas regiones.
35 Figura 4. Mutaciones de punto caliente en el exoma, 5' y 3' UTR de tumores deficientes en MMR.
(a) Fracción de homopolímeros en función de su longitud en regiones codificantes, 5' y 3' UTR. (b) Fracción de
homopolímeros afectados por un indel en función de la longitud del homopolímero para regiones codificantes, 5' y 3'
UTR. (c) Frecuencias medias de indeles somáticos en las regiones codificantes, 5' y 3' UTR de tumores deficientes
40 en MMR. (d) Fracción de homopolímeros afectados de forma recurrente por un indel en función de la longitud del
homopolímero para las regiones codificantes, 5' y 3' UTR.
Figura 5. El panel de mutación de punto caliente Bethesda y 56 marcadores para evaluar la MSI. El panel Bethesda
ampliado y un panel de 56 mutaciones de punto caliente en exones, 5' y 3' UTR identificadas por secuenciación del
45 exoma se analizaron en una serie independiente de 114 tumores endometriales primarios no seleccionados. Los
resultados se codificaron por colores según estado de inestabilidad microsatelital alta (MSI-H), inestabilidad
microsatelital baja (MSI-L) o estable en microsatélites (MSS) basándose en el panel Bethesda ampliado.
Figura 6. Mutaciones somáticas que afectan a la vía de reparación de DSB de ADN por HR. Diagrama de la vía de
50 reparación de DSB por HR (adaptado del diagrama de la vía de recombinación homóloga IPA). Los genes marcados
en naranja (con fondo gris) portan mutaciones somáticas en nuestro propio conjunto de tumores deficientes en MMR
o en tumores MSI-H del conjunto de datos TCGA disponible públicamente.
temporal indicado (P < 0,05). (e) Tasas de proliferación celular para cada uno de los cultivos celulares (las células
deficientes en MMR se muestran en azul (8 inferiores en el gráfico) y las células competentes en MMR se muestran
en rojo (cuatro superiores en el gráfico)). En resumen, las células deficientes en MMR se caracterizaron por una
disminución de la proliferación dependiente de la dosis, mientras que las células competentes en MMR no
5 respondieron a olaparib (P = 2,0E-7 mediante medición repetida; véase también la figura 7c).
Descripción detallada
Definiciones
10
La presente invención se describirá con respecto a formas de realización particulares y con referencia a
determinados dibujos, pero la invención no se limita a las mismas, sino únicamente a las reivindicaciones. Cualquier
signo de referencia en las reivindicaciones no se interpretará como una limitación del alcance. Los dibujos descritos
son solo esquemáticos y no limitantes. En los dibujos, el tamaño de algunos de los elementos puede estar
15 exagerado y no estar dibujado a escala con fines ilustrativos. Cuando se utiliza en la presente descripción y las
reivindicaciones el término "que comprende", no excluye otros elementos o etapas. Si se utiliza un artículo indefinido
o definido cuando se hace referencia a un sustantivo singular, por ejemplo "un" o "una", "el" o "la", este incluye un
plural de ese sustantivo a menos que se indique específicamente lo contrario.
20 Además, los términos primero, segundo, tercero y similares en la descripción y en las reivindicaciones se utilizan
para distinguir entre elementos similares y no necesariamente para describir un orden secuencial o cronológico.
Debe entenderse que los términos así utilizados son intercambiables en circunstancias apropiadas y que las formas
de realización de la invención descritas en el presente documento pueden funcionar en otras secuencias diferentes a
las descritas o ilustradas en el presente documento.
25
Los siguientes términos o definiciones se proporcionan únicamente para ayudar en la comprensión de la invención.
A menos que se definan específicamente en el presente documento, todos los términos utilizados en el presente
documento tienen el mismo significado que tendrían para un experto en la técnica de la presente invención. Los
facultativos se dirigen particularmente a Sambrook et al., Molecular Cloning: A Laboratory Manual, 2ª ed., Cold
30 Spring Harbor Press, Plainsview, Nueva York (1989); y Ausubel et al., Current Protocols in Molecular Biology
(Suplemento 47), John Wiley & Sons, Nueva York (1999), para obtener definiciones y términos de la técnica. Las
definiciones proporcionadas en el presente documento no deben interpretarse de forma que tengan un alcance
inferior al comprendido por un experto en la técnica.
35 El término "microsatélite" o "regiones de microsatélites", tal como se utiliza en el presente documento, se refiere a
repeticiones mono-, di-, tri-, tetra-, penta- o hexanucleotídicas en una secuencia de nucleótidos, que consta de al
menos dos unidades repetidas y que presenta una longitud mínima de 6 bases. Una subclase particular de
microsatélites incluye los homopolímeros.
40 "Homopolímero", tal como se utiliza en el presente documento, se refiere a una región de microsatélites que es una
repetición de mononucleótidos de al menos 6 bases; en otras palabras, un tramo de al menos 6 residuos
consecutivos A, C, T o G si se considera al nivel del ADN. Más particularmente, al determinar los microsatélites, se
considera el ADN genómico de un sujeto (o el ADN genómico de un cáncer presente en el sujeto).
45 El término "estado de MSI", tal como se utiliza en la solicitud, se refiere a la presencia de inestabilidad microsatelital
(MSI), un cambio clonal o somático en el número de unidades de nucleótidos de ADN repetidas en microsatélites. El
estado de MSI puede ser uno de tres clases discretas: MSI-H, también conocido como MSI alta, MSI positiva o MSI,
MSI-L, también conocido como MSI baja, o estabilidad en microsatélites (MSS), también conocido como ausencia de
MSI. Por lo general, para ser clasificado como MSI-H, al menos el 20% de los marcadores utilizados para clasificar
50 el estado de MSI deben tener una puntuación positiva, mientras que para la clasificación de MSS, menos del 2,5%
tiene una puntuación positiva. Si un número intermedio de marcadores tiene una puntuación positiva, el tumor se
clasifica como MSI-L. Téngase en cuenta que, como estos límites iniciales se derivan del panel de marcadores
Bethesda ampliado (que consta de solo 10 marcadores), dado que normalmente se evaluarán menos de 100
marcadores y el número de marcadores positivos es un número entero, los porcentajes son aproximados. La
55 diferencia entre MSS y MSI-L se encontrará típicamente entre el 1 y el 9% de los marcadores que obtienen una
puntuación positiva (cuando se evalúan 10 marcadores, esto significa que 1 marcador positivo da como resultado
una clasificación MSI-L), mientras que la diferencia entre MSI-L y MSI-H se encontrará generalmente entre el 15 y el
25% de marcadores positivos (es decir, por encima de ese umbral, un tumor es MSI-H, por debajo del mismo es
MSI-L). Alternativamente, en lugar de realizar la distinción en tres clases, solo se evalúa la diferencia entre presencia
60 y ausencia de inestabilidad microsatelital, en cuyo caso el estado es presencia de MSI o ausencia de MSI (= MSS).
Teniendo en cuenta la correlación entre la ausencia de un sistema intacto de reparación de errores de apareamiento
(MMR) y la presencia de MSI, diagnosticar la presencia de MSI (o diagnosticar el estado de MSI) puede interpretarse
como un diagnóstico de deficiencia en MMR. Sin embargo, téngase en cuenta que la MMR puede ser funcional o
deficiente, no existe una clase intermedia. Por lo tanto, MSI-L también corresponde a deficiencia en MMR; esta
65 situación equivale a evaluar solo la presencia o ausencia de MSI.
9
E13717473
ES 2 906 023 T3 11-02-2022
"Diagnosticar el estado de MSI de un tumor" o "diagnosticar el estado de MSI de un tumor presente en un sujeto" o
"diagnosticar el estado de MSI de un sujeto" o "determinar el estado de MSI de un tumor (o sujeto)" se consideran
sinónimos en el presente documento. Determinar (o diagnosticar) el estado de MSI normalmente implica extraer la
conclusión de MSI basándose en la detección de la presencia de uno o más indeles en las regiones de
5 microsatélites en investigación, o la conclusión de la ausencia de inestabilidad microsatelital basada en no detectar
indeles en las regiones de microsatélites en investigación. En consecuencia, "determinar la presencia de un indel" en
una región de microsatélites significa evaluar o detectar la presencia o la ausencia de un indel en dicha región de
microsatélites. Asimismo, determinar la presencia de un indel en al menos dos regiones de microsatélites significa
evaluar o detectar la presencia o ausencia de un indel en cada una de dichas, al menos dos, regiones de
10 microsatélites. La presencia de al menos un indel es indicativa de MSI (tal como se explica en la solicitud, el número
exacto de marcadores positivos necesarios para establecer MSI dependerá del número de marcadores utilizados).
Un "indel", tal como se utiliza en el presente documento, se refiere a una clase de mutación que incluye tanto
inserciones como deleciones y la combinación de las mismas. Un indel en una región de microsatélites da como
15 resultado una ganancia o una pérdida neta de nucleótidos. La presencia de un indel se puede establecer mediante
comparación con el ADN en el que no está presente (por ejemplo, mediante comparación del ADN de una muestra
tumoral con el ADN de la línea germinal del sujeto que tiene el tumor) o, especialmente en el caso de microsatélites
u homopolímeros monomórficos, mediante comparación con la longitud conocida del microsatélite, en particular
contando el número de unidades repetidas. Según formas de realización específicas, los indeles particularmente
20 contemplados tienen una longitud de entre 1 y 5 nucleótidos (es decir, la longitud del microsatélite u homopolímero
es de 1 a 5 nucleótidos más larga o más corta que la longitud normal conocida del microsatélite u homopolímero).
Según otras formas de realización específicas, los indeles tienen una longitud de 1 a 4 nucleótidos, 1 a 3 nucleótidos
o 1 o 2 nucleótidos. Téngase en cuenta que, como los indeles pueden ser una combinación de una inserción y una
deleción, la secuencia de ácido nucleico alterada puede ser mayor que la diferencia de longitud (por ejemplo, una
25 deleción de 5 nucleótidos combinada con una inserción de 3 nucleótidos conduce a una longitud alterada de 2, pero
la secuencia del microsatélite también puede haber cambiado). Sin embargo, más típicamente, un indel será una
inserción o una deleción, típicamente de 1 o 2 nucleótidos.
Un "microsatélite monomórfico" es aquel en el que todos los individuos, en particular todos los individuos de una
30 población determinada, comparten el mismo número de unidades de repetición. Este se diferencia de un
"microsatélite polimórfico", que se utiliza para referirse a microsatélites en los que más del 1% de una población
determinada muestra heterocigosidad por el número de unidades de repetición. A modo de ejemplo, el marcador
BAT26 está compuesto por 26 adeninas en más del 99% de los europeos étnicos, mientras que los alelos con
diferentes números de adeninas en esta ubicación (por ejemplo, 15, 20, 22, 23) se observan hasta en el 25% de
35 africanos étnicos, incluidos los afroamericanos17. Por lo tanto, BAT26 es un microsatélite monomórfico en los
europeos y un microsatélite polimórfico en los africanos16.
Una "muestra de ADN tumoral" se refiere a cualquier muestra que pueda usarse como base para la secuenciación
en la que esté presente ADN de un cáncer. El término "cáncer", tal como se utiliza en el presente documento, se
40 refiere a diferentes enfermedades que implican el crecimiento celular no regulado, también denominado neoplasia
maligna. El término "tumor" se utiliza como sinónimo en la solicitud. Se prevé que este término abarque todos los
tipos de tumores sólidos (carcinoma, sarcoma, blastoma), pero también abarca explícitamente tipos de cáncer no
sólidos tales como leucemia, linfoma o mieloma. Por lo tanto, una "muestra de ADN tumoral" también puede ser una
muestra de sangre de una persona con leucemia. Normalmente, una muestra de ADN tumoral se ha aislado en un
45 punto de un sujeto, particularmente un sujeto con cáncer. Opcionalmente, se ha sometido a una o más formas de
pretratamiento (por ejemplo, lisis, fraccionamiento, separación, purificación) con el fin de secuenciar el ADN, aunque
también se prevé que el ADN se secuencie de una muestra no tratada. Tal como se utiliza en el presente
documento, el sustantivo "sujeto" se refiere a un vertebrado individual, más particularmente a un mamífero individual,
de la forma más particular a un ser humano individual. Un "sujeto", tal como se utiliza en el presente documento es
50 típicamente un ser humano, pero también puede ser un mamífero, particularmente animales domésticos tales como
gatos, perros, conejos, cobayas, hurones, ratas, ratones y similares, o animales de granja tales como caballos,
vacas, cerdos, cabras, ovejas, llamas y similares. Un sujeto también puede ser un vertebrado no mamífero, tal como
un pez, un reptil, un anfibio o un ave; en esencia, cualquier animal que pueda desarrollar cáncer cumple con la
definición.
55
El término "cáncer colorrectal", tal como se utiliza en el presente documento, incluye neoplasias malignas de colon
(C18 en ICD-10), neoplasias malignas de la unión rectosigmoidea (C19 en ICD-10), neoplasias malignas del recto
(C20 en ICD-10) y neoplasias malignas del ano y del canal anal (C21 en ICD-10).
60 El término "síndrome de Lynch", tal como se utiliza en el presente documento, se refiere a una afección genética
autosómica dominante que tiene un alto riesgo de desarrollar cáncer de colon o colorrectal, así como otros cánceres
que incluyen cáncer endometrial, de ovario, de estómago, de intestino delgado, del aparato hepatobiliar, del aparato
urinario superior, del cerebro y de piel. El mayor riesgo de estos cánceres se debe a mutaciones heredadas que
alteran la reparación de errores de apareamiento del ADN. El nombre antiguo de la afección es HNPCC.
65
10
E13717473
ES 2 906 023 T3 11-02-2022
Un "inhibidor de una enzima de reparación por escisión de bases de ADN", tal como se utiliza en el presente
documento se refiere a una sustancia que puede interferir con la función de reparación por escisión de bases del
producto génico, ya sea a nivel del ADN (inhibiendo la formación del producto génico relevante, es decir, previniendo
la transcripción o interfiriendo con la misma), a nivel de ARN (neutralizando o desestabilizando el ARNm para
5 prevenir la traducción o interferir con la misma) o a nivel de proteína (neutralizando o inhibiendo la proteína
involucrada en BER). Se prevé particularmente que el inhibidor sea un inhibidor de PARP, ya que dichos inhibidores
están bien caracterizados. Se prevén más particularmente los inhibidores de PARP-1 y/o de PARP-2, ya que estas
enzimas son las PARP más activamente implicadas en BER. Sin embargo, los inhibidores de otras PARP también
pueden ser útiles. A este respecto, publicaciones recientes sugieren que el inhibidor de PARP iniparib, cuyo uso está
10 explícitamente previsto, inhibe otras PARP distintas de PARP-1 y 2, en particular PARP-5 y 6 (Ji J, Lee MP, Kadota
M, et al. Pharmacodynamic and pathway analysis of three presumed inhibitors of poly (ADP-ribose) polymerase:
ABT-888, AZD 2281 y BSI201. Actas de la 102ª Reunión Anual de la Asociación Estadounidense para la
Investigación del Cáncer; 2-6 de abril de 2011; Orlando, Fla. AACR. 2011. Resumen Nº 4527; Maegley KA, Bingham
P, Tatlock JH et al. All PARP inhibitors are not equal: an in vitro mechanistic comparison of PF-01367338 to iniparib.
15 J Clin Oncol. 2011; 29 (supl; resumen e13576); Nagourney RA, Kenyon KR, Francisco FR, et al. Functional analysis
of PARP inhibitors AZD 2281 and BSI-201 in human tumor primary cultures: a comparison of activity and
examination of synergy with cytotoxic drugs. J Clin Oncol. 2011; 29 (supl; resumen e13599)).
Los ejemplos de inhibidores de PARP incluyen, pero sin limitación: iniparib, olaparib, rucaparib, veliparib, CEP 9722,
20 MK 4827, BMN-673 y 3-aminobenzamida.
Descripción
Los errores de replicación del ADN que se producen en células deficientes en la reparación de errores de
25 apareamiento (MMR) persisten como mutaciones de errores de apareamiento y predisponen a una serie de tumores.
A este respecto, se secuenciaron los primeros genomas de tumores deficientes en MMR, lo que permitió la
evaluación no sesgada de errores de replicación del ADN. Se observó que las tasas de mutación aumentaron
drásticamente con respecto a tumores competentes en MMR. Las mutaciones de inserción o deleción (indel) se
produjeron con mayor frecuencia y se limitaron en gran medida a tramos homopoliméricos, mientras que las
30 sustituciones de un solo par de bases consistieron principalmente en transiciones A:T>G:C y G:C>A:T y se ubicaron
con mayor frecuencia cerca de indeles. Como las tasas de sustituciones fueron más altas en los indeles somáticos
cercanos, esto sugiere que las mutaciones de indel actúan como sitios mutagénicos durante la replicación del ADN.
Debido a la selección clonal negativa, las tasas de mutación somática fueron inferiores en el exoma que en el resto
del genoma, mientras que debido a la selección positiva, se produjeron algunas mutaciones exónicas en varios
35 tumores deficientes en MMR. Estas mutaciones recurrentes afectaron específicamente a los genes expresados en el
tejido correspondiente normal, lo que sugiere que representan impulsores de la progresión tumoral deficiente en
MMR.
11
E13717473
ES 2 906 023 T3 11-02-2022
Tabla 1. Indeles recurrentes más comunes en las regiones 5' y 3' UTR para 16 muestras tumorales deficientes en
MMR (presentes en al menos 4 de 16 muestras tumorales). Las dos últimas columnas indican la frecuencia con la
que el homopolímero se ve afectado por una inserción o una deleción, respectivamente.
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
19
E13717473
ES 2 906 023 T3 11-02-2022
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
24
E13717473
ES 2 906 023 T3 11-02-2022
(continuación)
(continuación)
(continuación)
(continuación)
28
E13717473
ES 2 906 023 T3 11-02-2022
(continuación)
(continuación)
(continuación)
31
E13717473
ES 2 906 023 T3 11-02-2022
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
Debe señalarse que algunos de los genes enumerados en la tabla 1 tienen más de un indel recurrente en las
5 regiones UTR (por ejemplo, CALN1, EIF4G3, KDM5A), lo que aumenta la probabilidad de que estas regiones
genómicas no se vieran afectadas aleatoriamente, sino que se sometieran a una selección positiva.
Es importante señalar que también los homopolímeros de las regiones exónicas se ven afectados con mayor
frecuencia por indeles en los tumores deficientes en MMR. Tal como se explica en, por ejemplo, el ejemplo 4, esto
10 no se basa en la longitud de la secuencia, sino que es debido a la selección clonal positiva. Por lo tanto, aunque por
lo general presentan mutaciones recurrentes con menos frecuencia, estas mutaciones podrían ser impulsoras de la
progresión del tumor. En la tabla 2 se proporciona una lista de los 31 genes afectados con mayor frecuencia por
indeles en sus regiones exónicas.
15
45
E13717473
ES 2 906 023 T3 11-02-2022
46
E13717473
ES 2 906 023 T3 11-02-2022
47
E13717473
ES 2 906 023 T3 11-02-2022
48
E13717473
ES 2 906 023 T3 11-02-2022
49
E13717473
ES 2 906 023 T3 11-02-2022
50
E13717473
ES 2 906 023 T3 11-02-2022
51
E13717473
ES 2 906 023 T3 11-02-2022
Tal como se detalla en la sección Ejemplos, más del 50% de los marcadores tomados de la tabla 1 tienen una
5 puntuación positiva en un conjunto aleatorio de tumores deficientes en MMR, mientras que este también es el caso
de más de un tercio de los marcadores exónicos enumerados en la tabla 2. Esto permite clasificar correctamente el
tumor deficiente en MMR como positivo a MSI con alta precisión y certeza.
En consecuencia, se proporcionan procedimientos para diagnosticar el estado de MSI de un tumor, que comprenden
10 determinar la presencia de un indel en al menos dos regiones homopoliméricas en una muestra del ADN del tumor,
en el que las, al menos dos, regiones homopoliméricas son
- al menos dos regiones homopoliméricas presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en
la tabla 1, o
15
- al menos tres regiones homopoliméricas seleccionadas de las presentes en los exones de los genes
enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1,
en los que dichas regiones homopoliméricas son regiones de microsatélites que son repeticiones
mononucleotídicas de al menos 6 nucleótidos y que no exceden de 20 nucleótidos, y en los que la presencia de al
20 menos un indel en el 2% o más de las regiones homopoliméricas es indicativa de MSI.
En particular, las regiones de microsatélites son regiones homopoliméricas. Son más particularmente idénticas a las
regiones homopoliméricas enumeradas en la tabla 1 o 2.
25 En particular, se prevé utilizar varios marcadores, ya que esto aumenta el poder de clasificación de MSI y aumenta
la sensibilidad. En particular, se utiliza una mezcla de marcadores UTR de la tabla 1 y marcadores exónicos de la
tabla 2. Varios marcadores pueden ser al menos 2 de cada lista, pero el número total de marcadores en particular es
de al menos 5, al menos 8, al menos 10, al menos 12, al menos 15, al menos 20.
30 Alternativamente, en lugar de la tabla 1, los marcadores se pueden elegir de la tabla 4, o de la tabla 6 o la tabla 8.
En lugar de la tabla 2, los marcadores se pueden seleccionar de la tabla 5, o de la tabla 7 o la tabla 8.
Según formas de realización específicas, al menos un marcador utilizado es un marcador exónico presente en un
gen no asociado previamente con cáncer, o en un gen que no se sabía previamente que estuviera afectado en
35 tumores deficientes en MMR. Por lo tanto, se prevé que el microsatélite o los microsatélites seleccionados entre los
presentes en los exones de los genes enumerados en la tabla 2 comprendan al menos un microsatélite presente en
un gen seleccionado de la lista de: SETD1B, RBMXL1, CCDC150, OR7E24, C15orf40, KIAA2018, LTN1, SLC22A9,
CDH26, DDX27, EXOSC9, FAM111B, KIAA0182, KIAA1919, MIS18BP1, PRRT2, TMEM60, AQP7, ARV1,
CCDC168, ELAVL3, F8, FETUB, HPS1, NBEAL1, P4HTM, PIGB, RBM43, RG9MTD1, SRPR, y TMEM97. Según
40 formas de realización aún más específicas, al menos un microsatélite está presente en un gen seleccionado de la
lista de: SETD1B, TMEM60, DDX27, EXOSC9, FAM111B y KIAA1919. Según formas de realización alternativas,
SEC31A, CNOT2, RNF145, RNPC3, SLC35F5, TMBIM4, CD3G, DOCK3, MYO10 y PRRG1 también se puede
utilizar en estas listas.
45 Según formas de realización específicas alternativas, al menos un marcador utilizado es un indel presente en un
homopolímero de entre 10 y 15 bases de repetición situadas en una región 5' o 3' UTR. Los ejemplos particulares de
dichos homopolímeros incluyen, pero sin limitación, homopolímeros en las regiones 3' UTR de la lista de genes
siguiente: WIPF2, NARG2, AHCYL1, C17orf63, CD5L, CEP170, COL5A2, CSNK1G3, DIDO1, EIF4G3, GSK3B,
KCNMB4, MAPK1IP1L, NPR3, PI15, PRTG, RASGRP1, SH3KBP1, SHROOM3, SLC5A3, UBE2Z, ZBTB33,
50 ZNF275, AGPAT3, APH1B, BCL11A, BMPR1B, CALN1, CASK, CBFB, CBX5, CCDC85C, CNOT7, CYP1B1,
DRAM2, EDA2R, EDEM3, EGR1, EIF4G3, FAM20B, FCHSD2, FLT1, FMO2, G3BP2, HELZ, HRNR, IER3IP1,
KCNG1, KCNK1, KLF3, LHX9, LRRC8D, LYRM1, MED13, MYO5B, NCEH1, PPP1R12A, PPP1R3D, RAB11FIP1,
RAB6C, SAMD12, SEMA6A, SLAIN2, SMAD4, TMED7, TMEM57, TMEM65, TNPO1, TOR1AIP2, TRAK2, TRIP11,
UST, VEGFA, ZBTB7A, ZKSCAN1, ZNF12, y ZNF169.
55
Se diseñó un panel de biomarcadores que consistía en una selección de 56 marcadores tomados de la tabla 1 y 2
(véase la sección Ejemplos). Según formas de realización particulares, estos marcadores se utilizan para
diagnosticar el estado de MSI. Estos 56 marcadores se enumeran en la tabla 3.
60
52
E13717473
ES 2 906 023 T3 11-02-2022
53
E13717473
ES 2 906 023 T3 11-02-2022
54
E13717473
ES 2 906 023 T3 11-02-2022
Los marcadores de este panel que están especialmente previstos para su uso (ya que son particularmente sensibles
a la aparición recurrente de indeles) incluyen uno o más de la lista de MYL1, DIDO1, UBE2Z, RYR3, TMEM65,
BTBD7, KDM5A, ABAT, PPM1A, UBA6 y ZNF185. También se prevén adicionalmente ARL10, GRIA2 y TMC7,
particularmente cuando se evalúa el estado de MSI de tumores colorrectales. Estos son tanto sensibles como
5 específicos (es decir, detectan pequeños casos de MSI falsos positivos).
Según formas de realización muy específicas, el panel de 56 marcadores se puede complementar con microsatélites
de MSH6 (indel exónico) y/o SULF2 (deleción en 3' UTR).
10 Según formas de realización alternativas, no se evalúan indeles en MSH6, ya que este es un gen de deficiencia en
MMR conocido. Aunque MSH3 también se conoce como un gen de deficiencia en MMR, la deficiencia de este gen
generalmente no se asocia con MSI27. Sin embargo, según formas de realización particulares, no se utilizan indeles
en MSH3 como marcador.
15 Tal como se detalla en la sección Ejemplos, se puede aplicar una etapa de filtrado adicional a los marcadores de la
tabla 1, excluyendo marcadores presentes como variantes en la línea germinal de nuestra base de datos genómica
patentada. Téngase en cuenta que todas estas son variantes raras, ya que no están presentes en dbSNP o en la
base de datos 1000 Genomes. Esta lista de marcadores se muestra en la tabla 4 (recurrencia mínima en 4 de 16
muestras tumorales).
20
Tabla 4. Indeles recurrentes más comunes en las regiones 5' y 3' UTR para 16 muestras tumorales deficientes en
MMR, después de una etapa de filtrado adicional.
55
E13717473
ES 2 906 023 T3 11-02-2022
(continuación)
56
E13717473
ES 2 906 023 T3 11-02-2022
(continuación)
57
E13717473
ES 2 906 023 T3 11-02-2022
(continuación)
58
E13717473
ES 2 906 023 T3 11-02-2022
(continuación)
59
E13717473
ES 2 906 023 T3 11-02-2022
(continuación)
60
E13717473
ES 2 906 023 T3 11-02-2022
(continuación)
61
ES 2 906 023 T3
(continuación)
62
ES 2 906 023 T3
(continuación)
63
ES 2 906 023 T3
(continuación)
64
ES 2 906 023 T3
(continuación)
65
ES 2 906 023 T3
(continuación)
66
ES 2 906 023 T3
(continuación)
67
ES 2 906 023 T3
(continuación)
68
ES 2 906 023 T3
(continuación)
69
ES 2 906 023 T3
(continuación)
70
ES 2 906 023 T3
(continuación)
71
ES 2 906 023 T3
(continuación)
72
ES 2 906 023 T3
(continuación)
73
ES 2 906 023 T3
(continuación)
74
ES 2 906 023 T3
(continuación)
75
ES 2 906 023 T3
(continuación)
76
ES 2 906 023 T3
(continuación)
77
ES 2 906 023 T3
(continuación)
78
ES 2 906 023 T3
(continuación)
79
ES 2 906 023 T3
(continuación)
80
ES 2 906 023 T3
(continuación)
81
ES 2 906 023 T3
(continuación)
82
ES 2 906 023 T3
(continuación)
83
ES 2 906 023 T3
(continuación)
84
ES 2 906 023 T3
(continuación)
85
ES 2 906 023 T3
(continuación)
86
ES 2 906 023 T3
(continuación)
87
ES 2 906 023 T3
(continuación)
88
ES 2 906 023 T3
(continuación)
Se ha aplicado el mismo filtrado adicional a los marcadores de la tabla 2; los resultados se enumeran en la tabla 5.
5
Tabla 5. Indeles recurrentes más comunes en regiones exónicas para 16 muestras de tumores deficientes en MMR,
después de una etapa de filtrado adicional.
89
ES 2 906 023 T3
(continuación)
90
ES 2 906 023 T3
(continuación)
91
ES 2 906 023 T3
(continuación)
Según formas de realización particulares, los genes en los que está presente más de un indel recurrente en las
5 regiones UTR son particularmente adecuados como marcador. En estas formas de realización, al menos uno de los
genes se selecciona de la lista de ARHGEF11, CBLN2, DIO2, MBNL1 (todos los marcadores 5’UTR), ACVR1C,
ANKIB1, ATXN1, BCL11A, BCL11B, BCL7A, BOD1L, BTBD7, C11orf58, C14orf101, CACNB4, CALN1, CANX,
CASK, CBFB, CBL, CBX5, CCND1, CCND2, CLCN5, CRTC1, CSNK1E, CYP1B1, DCUN1D5, DDHD1, DLGAP2,
DSTYK, DTNA, DUT, DYRK2, EBF1, EFNA5, EIF4G3, ELAVL3, EPS15, ERBB2IP, ERBB4, EVI5, FAM116A,
10 FAM126B, FAM20B, FAM46A, FBN2, FBXO27, FGF9, FGFR1OP2, FOXN2, FOXN3, FOXP1, GABRB2, GDAP2,
GNAI2, GSK3B, HAS2, HDAC4, HELZ, HIPK2, HNRNPA3, HNRNPK, HUWE1, IGFBP5, INSR, KDM5A, KIAA0825,
KIAA1324, KIF1B, KLHL4, LARP4B, LIN7C, LMO4, LPHN3, LYRM7, MAP1B, MAPK1IP1L, MDM2, MED1, MED13,
MED28, MESDC1, MEX3A, MGAT4A, MKLN1, MLL2, NARG2, NCEH1, NPNT, NPR3, NR2F2, NUFIP2, OPA3,
OTUD4, OXR1, PALM2, PAPD5, PDGFA, PIGM, PLAGL2, PPP2R3A, PRPF40A, PRTG, RAB11FIP2, RAB8B,
15 RBM12B, RBMS3, RC3H1, RORA, RPRD2, RUNDC3B, SAMD12, SAR1A, SATB2, SDC4, SENP1, SENP5,
SH3KBP1, SH3RF1, SIPA1L3, SLAIN2, SLC7A11, SMAD3, SMAD4, SMAD5, SORL1, SOST, SOX4, SPCS3,
SRRM4, ST7L, SYNJ2BP, TACC1, TFAP2B, TLCD2, TMEM57, TMTC3, TNRC6B, TNRC6C, TRIM66, TRPS1,
UBN2, USP43, VEZF1, WDR82, XKR6, XYLT1, ZBTB7A, ZNF238, ZNF737, ZNF740 (todos los marcadores 3’UTR),
CPLX4, DDX3X, GABRG2, PIK3R1, PTP4A2, SATB1, SEMA6A, y STK11 (afectados en 5’ y 3’ UTR).
20
No obstante, téngase en cuenta que los genes en los que solo un homopolímero se ve afectado de forma recurrente
en las regiones UTR pueden ser igualmente buenos como marcadores, por ejemplo porque solo hay una región
homopolimérica en la UTR, o porque hay una clara preferencia por la aparición de indeles en un homopolímero con
respecto al otro. Este último se observa, por ejemplo, en UTR de genes tales como CACNB4, EIF4G3, FAM20B,
25 LPHN3 o PRTG, en los que más de un homopolímero se ve afectado de forma recurrente, pero un homopolímero se
ve afectado con más frecuencia que el o los otros, aunque la longitud del homopolímero y la composición son
comparables.
También los genes con regiones exónicas que se ven afectados de forma recurrente por más de un indel están
30 particularmente previstos como marcadores. Por lo tanto, según formas de realización específicas, CASP5, MIAT,
TROVE2 y TSIX se prevén particularmente como marcadores exónicos; más particularmente se prevén CASP5 y TSIX.
Otra lista particular de marcadores UTR previstos son los que se identificaron en los primeros 11 tumores deficientes
en MMR sólidos. Esta lista se proporciona en la tabla 6, los indeles recurrentes comunes se definen como los que se
35 producen en al menos 3 de las 11 muestras.
Tabla 6. Indeles recurrentes más comunes en las regiones 5' y 3' UTR
para 11 muestras tumorales deficientes en MMR.
(continuación)
93
ES 2 906 023 T3
(continuación)
94
ES 2 906 023 T3
(continuación)
95
ES 2 906 023 T3
(continuación)
96
ES 2 906 023 T3
(continuación)
97
ES 2 906 023 T3
(continuación)
98
ES 2 906 023 T3
(continuación)
99
ES 2 906 023 T3
(continuación)
100
ES 2 906 023 T3
(continuación)
101
ES 2 906 023 T3
(continuación)
102
ES 2 906 023 T3
(continuación)
103
ES 2 906 023 T3
(continuación)
104
ES 2 906 023 T3
(continuación)
105
ES 2 906 023 T3
(continuación)
106
ES 2 906 023 T3
(continuación)
107
ES 2 906 023 T3
(continuación)
108
ES 2 906 023 T3
(continuación)
109
ES 2 906 023 T3
(continuación)
110
ES 2 906 023 T3
(continuación)
111
ES 2 906 023 T3
(continuación)
112
ES 2 906 023 T3
(continuación)
113
ES 2 906 023 T3
(continuación)
114
ES 2 906 023 T3
(continuación)
115
ES 2 906 023 T3
(continuación)
116
ES 2 906 023 T3
(continuación)
117
ES 2 906 023 T3
(continuación)
118
ES 2 906 023 T3
(continuación)
119
ES 2 906 023 T3
(continuación)
120
ES 2 906 023 T3
(continuación)
121
ES 2 906 023 T3
(continuación)
122
ES 2 906 023 T3
(continuación)
123
ES 2 906 023 T3
(continuación)
124
ES 2 906 023 T3
(continuación)
125
ES 2 906 023 T3
(continuación)
126
ES 2 906 023 T3
(continuación)
127
ES 2 906 023 T3
(continuación)
128
ES 2 906 023 T3
(continuación)
129
ES 2 906 023 T3
(continuación)
130
ES 2 906 023 T3
(continuación)
131
ES 2 906 023 T3
(continuación)
132
ES 2 906 023 T3
(continuación)
133
ES 2 906 023 T3
(continuación)
134
ES 2 906 023 T3
(continuación)
135
ES 2 906 023 T3
(continuación)
136
ES 2 906 023 T3
(continuación)
137
ES 2 906 023 T3
(continuación)
138
ES 2 906 023 T3
(continuación)
139
ES 2 906 023 T3
(continuación)
140
ES 2 906 023 T3
(continuación)
141
ES 2 906 023 T3
(continuación)
142
ES 2 906 023 T3
(continuación)
143
ES 2 906 023 T3
(continuación)
144
ES 2 906 023 T3
(continuación)
145
ES 2 906 023 T3
(continuación)
146
ES 2 906 023 T3
(continuación)
147
ES 2 906 023 T3
(continuación)
148
ES 2 906 023 T3
(continuación)
149
ES 2 906 023 T3
(continuación)
150
ES 2 906 023 T3
(continuación)
151
ES 2 906 023 T3
(continuación)
152
ES 2 906 023 T3
(continuación)
153
ES 2 906 023 T3
(continuación)
154
ES 2 906 023 T3
(continuación)
155
ES 2 906 023 T3
(continuación)
156
ES 2 906 023 T3
(continuación)
157
ES 2 906 023 T3
(continuación)
158
ES 2 906 023 T3
(continuación)
159
ES 2 906 023 T3
(continuación)
160
ES 2 906 023 T3
(continuación)
161
ES 2 906 023 T3
(continuación)
162
ES 2 906 023 T3
(continuación)
163
ES 2 906 023 T3
(continuación)
164
ES 2 906 023 T3
(continuación)
165
ES 2 906 023 T3
(continuación)
166
ES 2 906 023 T3
(continuación)
167
ES 2 906 023 T3
(continuación)
168
ES 2 906 023 T3
(continuación)
169
ES 2 906 023 T3
(continuación)
170
ES 2 906 023 T3
(continuación)
171
ES 2 906 023 T3
(continuación)
Asimismo, otra lista particular de marcadores exónicos previstos son los que se identificaron en los primeros 11
tumores sólidos deficientes en MMR. Esta lista se proporciona en la tabla 7, los indeles recurrentes comunes se
definen como los que aparecen en al menos 3 de 11 muestras.
172
ES 2 906 023 T3
173
ES 2 906 023 T3
174
ES 2 906 023 T3
175
ES 2 906 023 T3
176
ES 2 906 023 T3
En la tabla 8 se enumera una lista adicional prevista particular de la que se pueden seleccionar marcadores. Según
formas de realización específicas, las, al menos dos, regiones de microsatélites UTR o al menos tres regiones de
microsatélites (tal como se han descrito anteriormente) son regiones seleccionadas de las enumeradas en la tabla 8.
Sin embargo, según formas de realización alternativas muy específicas, los marcadores se seleccionan de la tabla 1
5 y/o 2 y no contienen un marcador enumerado en la tabla 8. Los marcadores ilustrativos en este caso incluyen, pero
sin limitación, LLRC8D, SAMD12, SEPT7, CASK, FAM20B, HELZ, KCNK1, LHX9, LYRM1, TMEM26, TRIP11,
ZBTB7A, ZKSCAN1, ZNF217, WIPF2, COL5A2, ZBTB33, AGPAT3, BMPR1B, CNOT7, EDEM3, G3BP2, HRNR,
KLF3, TNPO1, TRAK2, ZNF169, BDNF, OIT3, CNOT2, LTN1, MBD4, SLC22A9, ATR, CDH26, KIAA2018, RNF145,
TGFBR2, y TMBIM4.
10
Tabla 8. Indeles recurrentes en regiones 5' y 3' UTR y en exones para muestras tumorales deficientes en MMR.
177
ES 2 906 023 T3
(continuación)
178
ES 2 906 023 T3
(continuación)
179
ES 2 906 023 T3
(continuación)
Según formas de realización particulares, la longitud de los homopolímeros utilizados como marcadores no excederá
5 de 20 nucleótidos o no excederá de 15 nucleótidos (por ejemplo, para permitir una detección más eficaz de la
presencia de un indel). Por lo tanto, según formas de realización particulares, los marcadores se seleccionan de, por
ejemplo, cualquiera de las tablas 1 a 8, pero solo de los marcadores que tienen menos de 20 nucleótidos o menos
de 15 nucleótidos. Esta longitud más corta es particularmente ventajosa en comparación con los marcadores de la
técnica anterior (por ejemplo, el marcador BAT25 y BAT26).
10
Particularmente, en algunas formas de realización, la longitud de los homopolímeros utilizados como marcadores no
excede de 15 nucleótidos, 14 nucleótidos, 13 nucleótidos, 12 nucleótidos o incluso 11 nucleótidos. Por otra parte,
según formas de realización particulares, los homopolímeros contemplados tienen al menos 6 nucleótidos, al menos
7 nucleótidos, al menos 8 nucleótidos, al menos 9 nucleótidos o incluso al menos 10 nucleótidos de longitud. Según
15 formas de realización específicas particulares, se prevé que la longitud de marcador de al menos un marcador (y
hasta todos los marcadores utilizados) se encuentre entre 7 y 15 nucleótidos, entre 8 y 15 nucleótidos, entre 8 y 14
nucleótidos, entre 8 y 13 nucleótidos, entre 9 y 13 nucleótidos, entre 10 y 13 nucleótidos, entre 8 y 12 nucleótidos,
entre 9 y 12 nucleótidos, entre 8 y 11 nucleótidos o entre 9 y 11 nucleótidos.
20 Es importante señalar que los marcadores descritos anteriormente se pueden utilizar para determinar el estado de
MSI independientemente del tipo de cáncer. Por lo tanto, en principio, se puede realizar un diagnóstico del estado de
MSI con los marcadores proporcionados en el presente documento para cada tipo de cáncer. No obstante, dado que
la MSI está presente con mayor frecuencia en cánceres con una deficiencia en genes de reparación de errores de
apareamiento, se prevé particularmente diagnosticar el estado de MSI en una muestra tumoral de tumores en los
25 que la deficiencia en MMR tiene lugar con más frecuencia que en otros tipos. En consecuencia, la muestra de
cáncer es normalmente una muestra seleccionada de un cáncer que sea cáncer colorrectal, cáncer endometrial,
cáncer de ovario, cáncer gástrico, leucemia y un tumor del espectro del síndrome de Lynch.
Diagnosticar el estado de MSI generalmente implica extraer la conclusión de detectar la presencia de MSI o no (esto
30 es equivalente a detectar la ausencia de MSI). Normalmente, la detección de la presencia de MSI se basará en la
detección de uno o más indeles en las regiones de microsatélites en investigación. Cuantos más genes marcadores
presentados en las tablas 1-3 del presente documento tengan una indel en una región de microsatélites, mayor será
la probabilidad de que el tumor se caracterice por inestabilidad microsatelital.
35 Generalmente, la MSI se puede clasificar como MSI-H, MSI-L y MSS. Según formas de realización particulares, si el
20% (o el 25%) o más de las regiones de microsatélites utilizadas para diagnosticar el estado de MSI contienen un
180
ES 2 906 023 T3
indel, el tumor es MSI-H, si entre el 2,5% y el 20% (25%) de las regiones de microsatélites contiene un indel, el
tumor es MSI-L, y si menos del 2,5% de las regiones de microsatélites contiene un indel, el tumor es estable en
microsatélites. Según formas de realización alternativas, la MSI puede clasificarse como MSI-H si el 17% o más de
las regiones de microsatélites utilizadas para diagnosticar el estado de MSI contienen un indel; si entre el 2% (o el
5 2,5%) y el 17% de las regiones de microsatélites contienen un indel, el tumor es MSI-L, y si menos del 2% (o el
2,5%) de las regiones de microsatélites contiene un indel, el tumor es estable en microsatélites. La última
clasificación es particularmente preferida cuando se utiliza un número elevado (por ejemplo, 25 o más) de
marcadores. Se utilizan porcentajes en lugar de números absolutos, ya que un experto en la técnica puede variar el
número de marcadores. Como pauta general, los porcentajes deben corresponder más o menos a los porcentajes
10 aplicados en el reconocido panel Bethesda. Por ejemplo, si se utilizan 8 marcadores, el tumor será MSS solo si
ninguno de los marcadores de microsatélites contiene un indel; será MSI-H si 2 o más marcadores son positivos,
mientras que será MSI-L si solo un marcador contiene un indel. Dado que es evidente a partir de este ejemplo que
un marcador positivo más o menos puede afectar al diagnóstico si se usa un número limitado de marcadores, se
prevé particularmente el uso de más marcadores. Esto es particularmente útil para clasificar de forma fiable los
15 tumores como MSI-L. Por ejemplo, con la clasificación del 2-17%, si se usa el panel de marcadores preferido de 56
marcadores, un tumor es MSS si 0 o 1 marcadores tienen una puntuación positiva, MSI-L si de 2 a 9 marcadores
tienen una puntuación positiva y MSI-H si 10 o más marcadores tienen una puntuación positiva.
El trabajo publicado también sugiere que los tumores MMR tienen una respuesta distinta a los tratamientos estándar
20 y las terapias dirigidas emergentes. Las investigaciones preclínicas sugieren, por ejemplo, que los tumores
deficientes en MMR muestran resistencia a las terapias con 5-fluorouracilo, anti-EGFR y VEGF25,26. Se desconoce el
motivo preciso de esta heterogeneidad, pero la presencia o la ausencia de mutaciones secundarias (recurrentes)
como consecuencia de la deficiencia en MMR podría determinar el resultado del tratamiento. Por ejemplo,
observamos una mutación recurrente en KRAS, que actúa como un predictor de respuesta negativa establecido de
25 terapias anti-EGFR. Es interesante señalar que la mayor parte de las mutaciones recurrentes en tumores
endometriales también afectan específicamente a genes expresados en el endometrio normal y se expresaron de
forma diferencial en tumores MMR- con respecto a MMR+, lo que sugiere una selección clonal positiva de estas
mutaciones. La identificación de mutaciones recurrentes también revela varias dianas terapéuticas novedosas para
el tratamiento de tumores deficientes en MMR.
30
Por lo tanto, según algunas formas de realización particulares, los procedimientos de diagnóstico del estado de MSI
de un tumor, tal como se presentan en el presente documento, pueden comprender además una etapa de elección
del régimen de tratamiento en función del estado de MSI (es decir, en función de si se encontró que el tumor es MSI-
H, MSI-L o MSS).
35
Todos los procedimientos actuales se basan en la detección de indeles en regiones de microsatélites del genoma.
Se describirán brevemente las metodologías de uso frecuente para el análisis de muestras de ácido nucleico para
detectar indeles. No obstante, puede utilizarse en la invención cualquier procedimiento conocido en la técnica para
detectar la presencia de indeles.
40
a. Hibridación específica de alelos
Esta técnica, también conocida de forma común como hibridación de oligonucleótidos específicos de alelos (ASO)
(por ejemplo, Stoneking et al., Am. J. Hum. Genet. 48: 70-382, 1991; Saiki et al., Nature 324,163-166,1986;
45 documento EP 235.726 y documento WO 89/11548), se basa en la distinción entre dos moléculas de ADN que
difieren en una base mediante hibridación de una sonda de oligonucleótidos que es específica para una de las
variantes con un producto amplificado obtenido al amplificar la muestra de ácido nucleico. Este procedimiento
normalmente emplea oligonucleótidos cortos, por ejemplo de 15-20 bases de longitud. Las sondas están diseñadas
para hibridarse diferencialmente con una variante frente a otra. Los principios y las pautas para diseñar dicha sonda
50 están disponibles en la técnica, por ejemplo en las referencias citadas en el presente documento. Las condiciones
de hibridación deben ser lo suficientemente rigurosas como para que haya una diferencia significativa en la
intensidad de hibridación entre alelos y producir una respuesta esencialmente binaria, por lo que una sonda se
hibrida con solo uno de los alelos. Algunas sondas están diseñadas para hibridarse con un segmento de ADN diana
de forma que el sitio polimórfico se alinee con una posición central (por ejemplo, en un oligonucleótido de 15 bases
55 en la posición 7; en un oligonucleótido de 16 bases en la posición 8 o 9) de la sonda, pero este diseño no es
necesario.
Los formatos de ensayo adecuados para detectar híbridos formados entre sondas y secuencias de ácido nucleico
65 diana en una muestra son conocidos en la técnica e incluyen el formato de diana inmovilizada (dot-blot
(transferencia puntual)) y los formatos de ensayo de sonda inmovilizada (dot-blot inverso o line-blot (transferencia
181
ES 2 906 023 T3
lineal)). Algunos formatos de ensayo de dot blot y dot blot inverso se describen en las patentes de Estados Unidos
Nº 5.310.893, 5.451.512, 5.468.613 y 5.604.099.
En un formato dot-blot, el ADN diana amplificado se inmoviliza sobre un soporte sólido, tal como una membrana de
5 nailon. El complejo membrana-diana se incuba con la sonda marcada en condiciones de hibridación adecuadas, la
sonda no hibridada se elimina mediante lavado en condiciones rigurosas adecuadas y se inspecciona la membrana
para determinar la presencia de sonda unida.
En el formato dot-blot inverso (o line-blot), las sondas se inmovilizan sobre un soporte sólido, tal como una
10 membrana de nailon o una placa de microvaloración. El ADN diana se marca, normalmente durante la amplificación,
mediante la incorporación de cebadores marcados. Se pueden marcar uno o los dos cebadores. El complejo de
membrana-sonda se incuba con el ADN diana amplificado marcado en condiciones de hibridación adecuadas, el
ADN diana no hibridado se elimina mediante lavado en condiciones rigurosas adecuadas y la membrana se
inspecciona para determinar la presencia de ADN diana unido. En el ejemplo se describe un ensayo de detección
15 line-blot inverso.
Los indeles también se pueden detectar utilizando procedimientos de amplificación específica de alelos o de
20 extensión de cebadores. Estas reacciones generalmente implican el uso de cebadores que están diseñados para
dirigirse específicamente a un polimorfismo por medio de un error de apareamiento en el extremo 3' de un cebador.
La presencia de un error de apareamiento afecta a la capacidad de una polimerasa de extender un cebador cuando
la polimerasa carece de actividad correctora de errores. Por ejemplo, para detectar una secuencia de alelos usando
un procedimiento basado en amplificación específica de alelos o en extensión, se diseña un cebador
25 complementario al alelo normal de un microsatélite (es decir, sin indeles) de forma que el nucleótido del extremo
terminal 3' se hibride con la secuencia que contiene el número correcto de repeticiones. La presencia del alelo
particular puede determinarse por la capacidad del cebador para iniciar la extensión. Si el extremo terminal 3'
presenta un error de apareamiento, se impide la extensión.
30 En algunas formas de realización, el cebador se utiliza junto con un segundo cebador en una reacción de
amplificación. El segundo cebador se hibrida en un sitio no relacionado con el microsatélite. La amplificación se
produce a partir de los dos cebadores, dando lugar a un producto detectable que significa que la forma alélica
particular está presente. Los procedimientos basados en amplificación específica de alelos o en extensión se
describen en, por ejemplo, el documento WO 93/22456, las patentes de Estados Unidos Nº 5.137.806, 5.595.890,
35 5.639.611 y la patente de Estados Unidos Nº 4.851.331.
Utilizando genotipado basada en amplificación específica de alelos, la identificación de los alelos requiere solo la
detección de la presencia o la ausencia de secuencias diana amplificadas. Los procedimientos para la detección de
secuencias diana amplificadas son bien conocidos en la técnica. Por ejemplo, electroforesis en gel y los ensayos de
40 hibridación de sonda descritos se utilizan a menudo para detectar la presencia de ácidos nucleicos.
En un procedimiento alternativo sin sonda, el ácido nucleico amplificado se detecta supervisando el aumento en la
cantidad total de ADN bicatenario en la mezcla de reacción, y se describe, por ejemplo, en la patente de Estados
Unidos Nº 5.994.056; y las publicaciones de patente europeas Nº 487.218 y 512.334. La detección de ADN
45 bicatenario diana se basa en el aumento de la fluorescencia de varios tintes de unión a ADN, por ejemplo, SYBR
Green, que se muestra cuando se unen a ADN bicatenario.
Como apreciará un experto en la técnica, los procedimientos de amplificación específica de alelos se pueden realizar
en reacciones que emplean múltiples cebadores específicos de alelos para dirigirse a alelos particulares. Los
50 cebadores para dichas aplicaciones multiplex generalmente se marcan con marcas distinguibles o se seleccionan de
forma que los productos de amplificación producidos a partir de los alelos sean distinguibles por tamaño. Así, por
ejemplo, ambos alelos pueden identificarse en una sola muestra utilizando una única amplificación mediante análisis
en gel del producto de amplificación.
55 Como en el caso de las sondas específicas de alelo, un cebador oligonucleotídico específico de alelo puede ser
exactamente complementario a uno de los alelos polimórficos en la región de hibridación o puede tener algunos
errores de apareamiento en posiciones distintas del extremo terminal 3' del oligonucleótido, que dan lugar a errores
de apareamiento en sitios no polimórficos en ambas secuencias de alelos.
60 c. Sondas detectables
El genotipado también se puede realizar utilizando un "TaqMan®" o "ensayo de 5'-nucleasa", tal como se describe en
65 las patentes de Estados Unidos Nº 5.210.015, 5.487.972 y 5.804.375; y Holland et al., 1988, Proc. Natl. Acad. Sci.
USA 88: 7276-7280. En el ensayo TaqMan®, se añaden durante la reacción de amplificación sondas de detección
182
ES 2 906 023 T3
marcadas que se hibridan dentro de la región amplificada. Las sondas se modifican para evitar que actúen como
cebadores para la síntesis de ADN. La amplificación se realiza usando una ADN polimerasa que tiene actividad de
exonucleasa 5' a 3'. Durante cada etapa de síntesis de la amplificación, cualquier sonda que se hibrida con el ácido
nucleico diana cadena abajo del cebador en extensión se degrada por la actividad de exonucleasa 5' a 3' de la ADN
5 polimerasa. Por lo tanto, la síntesis de una nueva hebra diana también da como resultado la degradación de una
sonda, y la acumulación de producto de degradación proporciona una medida de la síntesis de secuencias diana.
La sonda de hibridación puede ser una sonda específica de alelo que discrimina entre los alelos con y sin indeles.
Alternativamente, el procedimiento se puede realizar usando un cebador específico de alelo y una sonda marcada
10 que se une al producto amplificado.
Se puede utilizar cualquier procedimiento adecuado para detectar el producto de degradación en un ensayo de 5'
nucleasa. A menudo, la sonda de detección se marca con dos tintes fluorescentes, uno de los cuales es capaz de
extinguir la fluorescencia del otro tinte. Los tintes se unen a la sonda, normalmente uno unido al extremo 5' y el otro
15 a un sitio interno, de modo que la extinción se produce cuando la sonda se encuentra en un estado no hibridado y de
tal modo que la escisión de la sonda por la actividad de exonucleasa 5' a 3' de la ADN polimerasa se produce entre
los dos tintes. La amplificación da como resultado la escisión de la sonda entre los tintes con una eliminación
concomitante de la extinción y un aumento en la fluorescencia observable del tinte inicialmente extinguido. La
acumulación de producto de degradación se supervisa mediante la medición del aumento de la fluorescencia de la
20 reacción. Las patentes de Estados Unidos Nº 5.491.063 y 5.571.673 describen ambas procedimientos alternativos
para detectar la degradación de la sonda que se produce concomitantemente con la amplificación.
25 Las sondas detectables tras un cambio estructural secundario también son adecuadas para la detección de un
polimorfismo, incluidos indeles. Las sondas de estructura secundaria o de estructura de tallo-bucle ejemplificadas
incluyen balizas moleculares o cebador/sondas Scorpion®. Las sondas de baliza molecular son sondas de ácido
oligonucleico monocatenario que pueden formar una estructura de horquilla en la que normalmente se colocan un
fluoróforo y un extintor en los extremos opuestos del oligonucleótido. En cualquier extremo de la sonda, las
30 secuencias complementarias cortas permiten la formación de un tallo intramolecular, lo que permite que el fluoróforo
y el extintor se dispongan en una proximidad estrecha. La porción de bucle de la baliza molecular es complementaria
a un ácido nucleico diana de interés. La unión de esta sonda a su ácido nucleico diana de interés forma un híbrido
que fuerza la separación del tallo. Esto provoca un cambio de conformación que aleja el fluoróforo y el extintor y da
lugar a una señal fluorescente más intensa. Las sondas de baliza molecular son, sin embargo, muy sensibles a una
35 pequeña variación de secuencia en la diana de la sonda (Tyagi S. y Kramer F. R., Nature Biotechnology, vol. 14,
páginas 303-308 (1996); Tyagi et al., Nature Biotechnology, vol. 16, páginas 49-53 (1998); Piatek et al., Nature
Biotechnology, vol. 16, páginas 359-363 (1998); Marras S. et al., Genetic Analysis: Biomolecular Engineering, vol.
14, páginas 151-156 (1999); Tpp I. et al, BioTechniques, Vol 28, páginas 732-738 (2000)). Un cebador/sonda
Scorpion® comprende una sonda de estructura de tallo-bucle unida covalentemente a un cebador.
40
d. Secuenciación de ADN y extensiones de una única base
Los indeles también se pueden detectar mediante secuenciación directa. Los procedimientos incluyen, por ejemplo,
procedimientos basados en secuenciación didesoxi y otros procedimientos tales como la secuencia de Maxam y
45 Gilbert (véase, por ejemplo, Sambrook et al., anteriormente).
Otro procedimiento similar para caracterizar indeles no requiere el uso de una PCR completa, sino que normalmente
utiliza solo la extensión de un cebador mediante una única molécula de ácido didesoxirribonucleico (ddNTP)
65 marcada con fluorescencia que es complementaria al nucleótido que se va a investigar. El nucleótido presente en el
183
ES 2 906 023 T3
sitio polimórfico se puede identificar mediante la detección de un cebador que se ha extendido por una base y está
marcado de forma fluorescente (por ejemplo, Kobayashi et al., Mol. Cell. Probes, 9: 175-182, 1995).
e. Electroforesis
5
Los productos de amplificación generados utilizando la reacción en cadena de la polimerasa se pueden analizar
mediante el uso de electroforesis en gel de gradiente desnaturalizante. Se pueden identificar diferentes alelos
basándose en las diferentes propiedades de fusión dependientes de la secuencia y la migración electroforética del
ADN en solución (véase, por ejemplo, Erlich, ed., PCR Technology, Principles and Applications for DNA
10 Amplification, W. H. Freeman and Co, Nueva York, 1992, Capítulo 7).
20 Los alelos de secuencias diana pueden diferenciarse utilizando el análisis de polimorfismo de conformación
monocatenaria, que identifica diferencias de bases mediante la alteración en la migración electroforética de
productos de PCR monocatenarios, tal como se describe, por ejemplo, por Orita et al., Proc. Nat. Acad. Sci. 86,
2766-2770 (1989). Los productos de PCR amplificados pueden generarse tal como se ha descrito anteriormente, y
calentarse o desnaturalizarse de otro modo, para formar productos de amplificación monocatenarios. Los ácidos
25 nucleicos monocatenarios pueden replegarse o formar estructuras secundarias que dependen parcialmente de la
secuencia de bases. Las diferentes movilidades electroforéticas de los productos de amplificación monocatenarios
pueden estar relacionadas con la diferencia de secuencia de bases entre alelos de genes diana.
Originariamente, la disociación de hebras se observó mediante mediciones de absorbancia UV, pero las técnicas
basadas en mediciones de fluorescencia son ahora el enfoque más común. La disociación dependiente de la
temperatura entre dos hebras de ADN se puede medir utilizando un fluoróforo intercalador de ADN, tal como SYBR
45 green, EvaGreen o sondas de ADN marcadas con fluoróforo.
Una técnica alternativa es el análisis de fusión de alta resolución (HRM). Están disponibles comercialmente muchos
tintes e instrumentos de alta resolución para realizar análisis de curvas de fusión o HRM; incluidas la mayor parte de
las máquinas qPCR.
50
Los procedimientos de detección de indeles a menudo emplean oligonucleótidos marcados. Los oligonucleótidos se
pueden marcar incorporando un marcador detectable por medios espectroscópicos, fotoquímicos, bioquímicos,
inmunoquímicos o químicos. Los marcadores útiles incluyen tintes fluorescentes, marcadores radiactivos, por
ejemplo 32P, reactivos densos en electrones, enzimas, tales como peroxidasa o fosfatasa alcalina, biotina o
55 haptenos y proteínas para las que se encuentran disponibles antisueros o anticuerpos monoclonales. Las técnicas
de marcado son bien conocidas en la técnica (véase, por ejemplo, Sambrook et al., anteriormente).
Según otro aspecto, el panel de biomarcadores tal como se describe en el presente documento se proporciona para
su uso como diagnóstico. En particular, se prevé que este panel de biomarcadores se pueda utilizar para detectar el
estado de la MSI en un cáncer o para determinar la MSI en una muestra tumoral. En consecuencia, el uso de este
5 panel de biomarcadores se proporciona en el diagnóstico de inestabilidad microsatelital (o del estado de MSI) en el
cáncer.
Aunque también se prevé explícitamente el uso de menos marcadores, los paneles de biomarcadores
particularmente adecuados para determinar la MSI en una muestra tumoral son paneles de biomarcadores que
10 comprenden al menos ocho marcadores (regiones de microsatélites). Dicho panel de biomarcadores comprende al
menos ocho regiones de microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los
genes enumerados en la tabla 1 y las presentes en los exones de los genes enumerados en la tabla 2. Los, al
menos ocho, marcadores pueden ser al menos 10 marcadores, al menos 12 marcadores, al menos 16 marcadores,
al menos 20 marcadores, al menos 25 marcadores o incluso más. Según formas de realización muy particulares, el
15 panel de biomarcadores comprende al menos la mitad de las regiones de microsatélites enumeradas en la tabla 3.
Según otras formas de realización particulares más, el panel de biomarcadores está representado por las 56
regiones de microsatélites enumeradas en la tabla 3.
Según formas de realización particulares, los marcadores se seleccionan de aquellos que son más recurrentes, es
20 decir, marcadores que aparecen en al menos un tercio o al menos la mitad de los tumores deficientes en MMR. En
consecuencia, los marcadores se seleccionan de los marcadores que aparecen al menos 5 veces de 16 (por
ejemplo, en las tablas 1 y 2, o en las tablas 4 y 5), 6 veces de 16, 7 veces de 16 o al menos 8 veces de 16 tumores.
O aparecen al menos 4 veces de 11 (por ejemplo, en la tabla 6 y 7), al menos 5 veces de 11, al menos 6 veces de
11 tumores.
25
Según otras formas de realización más, se proporciona un kit para determinar MSI en una muestra tumoral, que
comprende las herramientas para genotipar el panel de biomarcadores (es decir, las, al menos ocho, regiones de
microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla
1 y las presentes en los exones de los genes enumerados en la tabla 2). Más particularmente, el kit se adaptará al
30 panel o paneles de biomarcadores particularmente previstos. Según formas de realización específicas, el kit también
puede contener las herramientas para genotipar el panel de marcadores Bethesda, o el panel de marcadores
Bethesda ampliado. Dichos kits son especialmente adecuados para realizar una comparación lado a lado de los
marcadores con el panel Bethesda. También se prevé que un kit solo tome un subconjunto del panel de marcadores
Bethesda (por ejemplo, de 1 a 5 marcadores en lugar de los 10). En tal caso, se prevé explícitamente que se
35 incluyan los marcadores BAT25 y BAT26, ya que generalmente se consideran los más fiables. No hace falta decir
que esto también significa que los procedimientos de diagnóstico de MSI descritos en el presente documento
también pueden contener además una etapa de determinación del estado de uno o más marcadores del panel de
marcadores Bethesda ampliado (además del uso de los marcadores descritos en el presente documento).
40 Tal como se muestra en la sección Ejemplos (particularmente en los ejemplos 8 y 9), los marcadores de indeles
proporcionados en el presente documento están enriquecidos en genes implicados en las vías de reparación de
roturas de doble hebra de ADN y afectan a su funcionalidad. Como consecuencia, las células en las que están
presentes estos marcadores son sensibles a letalidad sintética mediante la inhibición de la reparación por escisión
de bases de ADN. Esto ofrece nuevas oportunidades terapéuticas, ya que los tumores positivos a MSI a menudo
45 son resistentes a las quimioterapias estándar utilizadas.
Según formas de realización particulares, la presencia de MSI es indicativa de la sensibilidad de las células
60 cancerosas al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN; es decir, las
células cancerosas morirán, dejarán de crecer o proliferarán menos cuando se traten con dicho inhibidor.
Según formas de realización específicas, las células cancerosas son células obtenidas de un sujeto, y el cribado de
la sensibilidad al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN se utiliza
65 para guiar el tratamiento del sujeto. Según formas de realización alternativas, el cribado de sensibilidad se usa para
estratificar o clasificar al sujeto para un ensayo clínico.
185
ES 2 906 023 T3
Según formas de realización particulares, la presencia de MSI se establece mediante un procedimiento descrito en
el presente documento, es decir, un procedimiento que comprende determinar la presencia de un indel en al menos
dos regiones de microsatélites en una muestra del ADN tumoral, en el que las, al menos dos, regiones de
5 microsatélites son
- al menos dos regiones de microsatélites presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en
la tabla 1, o
10 - al menos tres regiones de microsatélites seleccionadas de las presentes en los exones de los genes
enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1,
15 Según otras formas de realización particulares, la presencia de MSI se establece usando un panel de biomarcadores
tal como se describe en el presente documento, es decir, un panel de biomarcadores que comprende al menos ocho
regiones de microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes
enumerados en la tabla 1 y los presentes en los exones de los genes enumerados en la tabla 2. Según otras formas
de realización específicas más, el panel de biomarcadores comprende al menos ocho regiones de microsatélites
20 seleccionadas de las enumeradas en la tabla 3.
Según formas de realización muy específicas, los procedimientos también pueden comprender una etapa de
secuenciación de genes implicados en la vía de recombinación homóloga.
25 Por lo tanto, no solo se proporcionan procedimientos de cribado de la sensibilidad de las células cancerosas, sino
también procedimientos para diagnosticar la sensibilidad de un sujeto con cáncer al tratamiento con un inhibidor de
una enzima de reparación por escisión de bases de ADN, que comprenden las etapas siguientes:
- determinar el estado de MSI en una muestra de células cancerosas obtenidas del sujeto;
30
- correlacionar el estado de MSI con la sensibilidad al tratamiento con un inhibidor de una enzima de reparación
por escisión de bases de ADN, en los que la presencia de MSI es indicativa de sensibilidad al tratamiento.
Opcionalmente, estos procedimientos contienen una etapa adicional de obtención de una muestra de células
35 cancerosas del sujeto (antes de la etapa de determinación). La determinación del estado de MSI generalmente se
realiza en las células de la muestra obtenida. En particular, se prevé que la determinación del estado de MSI en una
muestra de células cancerosas se realice in vitro.
Según formas de realización particulares, el inhibidor de una enzima de reparación por escisión de bases de ADN es
40 un inhibidor de PARP. Según formas de realización específicas, las células cancerosas provienen de un cáncer
seleccionado de la lista de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un
tumor del síndrome de Lynch (o cualquier otro tumor del espectro del síndrome de Lynch). Según formas de
realización particulares, la presencia de MSI se establece mediante un procedimiento descrito en el presente
documento, es decir, un procedimiento que comprende determinar la presencia de un indel en al menos dos
45 regiones de microsatélites en una muestra del ADN tumoral, en el que las, al menos dos, regiones de microsatélites
son
- al menos dos regiones de microsatélites presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en
la tabla 1, o
50
- al menos tres regiones de microsatélites seleccionadas de las presentes en los exones de los genes
enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1,
65 Por lo tanto, también se proporcionan procedimientos para tratar un cáncer con MSI (o, de forma equivalente,
deficiencia en MMR) en un sujeto que lo necesita, que comprenden:
186
ES 2 906 023 T3
- administrar un inhibidor de una enzima de reparación por escisión de bases de ADN al sujeto.
5
Para procedimientos relacionados con el diagnóstico de la sensibilidad de un sujeto con cáncer al tratamiento con un
inhibidor de una enzima de reparación por escisión de bases de ADN, o al tratamiento de un sujeto que tiene cáncer
con MSI, se prevé particularmente que este cáncer sea resistente a al menos una terapia estándar, particularmente
una terapia estándar seleccionada de entre 5-FU (5-fluorouracilo, efudex), carboplatino, cisplatino o terapia dirigida
10 (particularmente terapia dirigida, dirigida contra EGFR (por ejemplo, gefitinib, erlotinib, cetuximab, panitumumab) o
contra Braf.
Se prevé que el cáncer se trate administrando el inhibidor al sujeto. Los procedimientos pueden tener opcionalmente
una etapa adicional de obtención de una muestra de células cancerosas del sujeto (antes de la etapa de
15 determinación de MSI y de establecer la presencia de MSI).
Según formas de realización particulares, el inhibidor de una enzima de reparación por escisión de bases de ADN es
un inhibidor de PARP. Según formas de realización específicas, las células cancerosas son de un cáncer
seleccionado de la lista de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un
20 tumor del síndrome de Lynch. Según formas de realización particulares, la presencia de MSI se establece mediante
un procedimiento descrito en el presente documento, es decir, un procedimiento que comprende determinar la
presencia de un indel en al menos dos regiones de microsatélites en una muestra del ADN tumoral, en el que las, al
menos dos, regiones de microsatélites son
25 - al menos dos regiones de microsatélites presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en
la tabla 1, o
- al menos tres regiones de microsatélites seleccionadas de las presentes en los exones de los genes
enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1,
30
en el que la presencia de al menos un indel es indicativa de MSI.
Según otras formas de realización particulares, la presencia de MSI se establece usando un panel de biomarcadores
tal como se describe en el presente documento, es decir, un panel de biomarcadores que comprende al menos ocho
35 regiones de microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes
enumerados en la tabla 1 y las presentes en los exones de los genes enumerados en la tabla 2.
Debe entenderse que aunque se han abordado en el presente documento formas de realización particulares,
configuraciones específicas así como materiales y/o moléculas para células y procedimientos según la presente
40 invención, se pueden realizar varios cambios o modificaciones en la forma y detalle sin apartarse del alcance y el
espíritu de la presente invención. Los ejemplos siguientes se proporcionan para ilustrar mejor las formas de
realización particulares y no deben considerarse limitantes de la solicitud. La solicitud está limitada solo por las
reivindicaciones.
45 Ejemplos
Ejemplo 1. Secuenciación del genoma completo de un tumor endometrial con deficiencia en MMR
Para seleccionar tumores deficientes en MMR para la secuenciación del genoma completo, se utilizaron pruebas
50 diagnósticas estándar, incluidas inmunohistoquímica de proteínas MMR (MLH1, MSH2 y MSH6), evaluación de la
inestabilidad microsatelital (MSI) utilizando el panel Bethesda ampliado (Pinol et al., 2005) y perfilado de metilación
del promotor MLH1. Los resultados de inmunohistoquímica e hipermetilación del promotor MLH1 se muestran como
las 3 líneas superiores en la tabla 9. El estado de inestabilidad microsatelital (MSI) se analizó en 10 loci diferentes
que contenían secuencias de repetición mononucleotídicas o dinucleotídicas (respectivamente 2 y 8 marcadores),
55 utilizando el panel recomendado por las directrices internacionales para la evaluación de la MSI, es decir, el panel
Bethesda revisado (Boland et al., 1998; Dietmaier et al., 1997). Las amplificaciones por PCR se realizaron en dos
pentaplexos: Multiplex A (BAT25, BAT26, D5S346, D17S250, D2S123) y multiplex B (BAT40, D17S787, D18S58,
D18S69, TGFβ-RII). Los cebadores directos se marcaron con 6-FAM, HEX, VIC o TET. Los amplicones de ADN
tumoral y normal del mismo paciente se analizaron en un analizador genιtico ABI 3130 (Applied Biosystems). El
60 tumor 1 fue fuertemente positivo a 7 de los 8 marcadores exitosos, mientras que los otros dos tumores fueron
negativos. Esto confirma que el tumor 1 es deficiente en MMR. Los resultados se resumen en la tabla 10. En la tabla
11 se incluye mαs informaciσn sobre las muestras tumorales.
Se seleccionaron un tumor EM deficiente en MMR, que presentaba un estado MSI positivo y ausencia de expresión
65 de MSH6 (tabla 9), y dos tumores EM competentes en MMR. Usando tecnología Complete Genomics® (CG),
obtuvimos datos de secuenciación de alta cobertura del tumor y muestras normales correspondientes (en promedio
187
ES 2 906 023 T3
95,2x y 77,1x, respectivamente), que posteriormente se analizaron utilizando una anotación y un conducto de filtrado
previamente desarrollados (Reumers et al., 2011). El tumor deficiente en MMR mostró un fenotipo hipermutador
claro, que contenía mutaciones somáticas significativamente más novedosas que los otros tumores utilizando el
procedimiento calldiff de CGAtools™ verificado (http://cgatools.sourceforge.net) (tabla 12, mutaciones somáticas
5 usando calldiff). Este algoritmo está diseñado para encontrar diferencias entre dos genomas del mismo individuo,
tales como un par tumor-normal.
Tabla 9. Pruebas diagnósticas estándar para evaluar la deficiencia en MMR. Todos los tumores se secuenciaron
utilizando o bien tecnología de secuenciación del genoma completo Complete Genomics (CG) o bien
enriquecimiento del exoma Truseq combinado con tecnología de secuenciación de Illumina. Para cada tumor, se
25 muestran la inestabilidad microsatelital (MSI) utilizando el panel Bethesda ampliado, la inmunohistoquímica estándar
de las proteínas MMR (MLH1, MSH2 y MSH6) y el estado de metilación del promotor MLH1. Los asteriscos (*)
indican la presencia de una tinción nuclear positiva débil en una minoría de las células tumorales.
30
188
ES 2 906 023 T3
189
ES 2 906 023 T3
Tabla 11. Muestras tumorales e información clínica. La tabla enumera información detallada para las tres muestras
tumorales seleccionadas. Todos los tumores eran tumores primarios, no tratados previamente con quimioterapia, de
5 pacientes sin antecedentes familiares de cánceres hereditarios.
190
ES 2 906 023 T3
191
ES 2 906 023 T3
Los estudios en organismos modelo y líneas celulares revelaron que las mutaciones somáticas que se producen
debido a la deficiencia de MMR involucran principalmente inserciones/deleciones (indeles) que afectan a las
5 secuencias de microsatélites (repeticiones dinucleotídicas a hexanucleotídicas con una longitud mínima de 6 bases y
al menos dos unidades de repetición) y homopolímeros (repeticiones mononucleotídicas con una longitud mínima de
6 bases) (Ellegren, 2004). Para probar esta hipótesis, estratificamos el genoma en cuatro clases diferentes utilizando
las definiciones siguientes:
10 - Regiones de microsatélites: repeticiones di-, tri-, tetra-, penta- o hexanucleotídicas que constan de al menos dos
unidades repetidas y con una longitud mínima de 6 bases.
- Regiones de no repetición: el resto del genoma, es decir, cada base que no forma parte de una secuencia de
repetición simple.
20 Las regiones genómicas que siguen estas definiciones se determinaron escaneando los archivos de secuencia (en
formato FASTA) utilizando la herramienta "grepseq" (http://code.google.com/p/grepseq/). A nivel del genoma
completo, la composición general de repetición fue la siguiente: microsatélites (7,9%), homopolímeros (1,9%),
homopolímeros cortas (19,8%) y regiones no en repetición (70,4%).
25 En nuestro hipermutador, observamos que las mutaciones somáticas se ubican con mayor frecuencia en
homopolímeros de lo esperado en función de su aparición en el genoma completo (no se muestra). Observamos que
las mutaciones somáticas se acumulan con mayor frecuencia en homopolímeros (47,7%) en comparación con su
aparición en el genoma completo (1,9%). El 35,5%, el 10,7% y el 6,2% de las mutaciones somáticas se ubicaron en
regiones de no repetición, homopolímeros cortos y microsatélites, respectivamente. En comparación con la aparición
30 de estas regiones en el genoma completo (es decir, el 70,4%, el 19,8% y el 7,9% para regiones de no repetición,
homopolímeros cortos y microsatélites, respectivamente), las mutaciones somáticas se vieron afectadas con menos
frecuencia de lo esperado en estas regiones.
Además, observamos que los indeles eran de hecho más frecuentes que las sustituciones de pares de bases
35 individuales (57,4% de indeles frente a 42,6% de sustituciones; figura 1b), pero afectaban predominantemente a los
homopolímeros (81,3%) y no a los microsatélites (figura 1c). Las sustituciones no afectaron preferentemente a los
homopolímeros o los microsatélites (figura 1d). Las mutaciones se produjeron con tanta frecuencia en los intrones
como en el resto del genoma, pero claramente menos en los exones (excluyendo las regiones no traducidas (UTR)
5' y 3'). Para indeles, esta disminución fue más pronunciada que para sustituciones (74,7% frente a 14,3%; figuras
40 1e,f). La corrección por el número de homopolímeros o la longitud de homopolímeros en las regiones exónicas,
intergénicas e intrónicas confirmó que esta reducción no podía atribuirse a menos homopolímeros o a
homopolímeros más cortos. La mayor parte de los indeles exónicos dieron como resultado mutaciones de
desplazamiento de marco heterocigóticas (160 indeles de desplazamiento de marco frente a 3 indeles sin
desplazamiento de marco), lo que sugiere que son mutaciones de pérdida de función que experimentan una
45 selección clonal negativa.
Los estudios que evaluaron las sustituciones somáticas en un melanoma inducido por luz ultravioleta (Pleasance et
50 al., 2010a) y un adenocarcinoma de pulmón inducido por humo de tabaco (Pleasance et al., 2010b) revelaron que,
respectivamente, tienen lugar con frecuencia transiciones G:C>A:T y transversiones G:C>T:A en estos tumores. Al
evaluar las sustituciones somáticas en nuestro hipermutador, se observó un patrón claramente distinto, en el que el
71,5% de todas las sustituciones representaron transiciones A:T>G:C y G:C>A:T en comparación con solo el 50,1%
en los tumores competentes en MMR (figura 2a). Sorprendentemente, en el hipermutador, las transiciones G:C>A:T
55 ocurrieron con mayor frecuencia en el contexto de un dinucleótido CG (en el que C experimenta la sustitución y G
representa el nucleótido siguiente), mientras que las transiciones A:T>G:C ocurrieron independientemente del
contexto de dinucleótidos y con mayor frecuencia que en los tumores competentes en MMR (figuras 2b-c).
A continuación, para identificar aquellas características que proporcionan un mejor ajuste al patrón de mutación del
60 hipermutador, usamos regresión lineal para correlacionar los diversos tipos de sustituciones con 9 características
genómicas previamente implicadas en la explicación de la variabilidad genética en la población humana (Hodgkinson
y Eyre-Walker, 2011) (figura 2d; las 9 características son la distancia al telómero, el tiempo de replicación, las
repeticiones simples, la composición de GC, el contenido de CpG, la isla CpG, el contenido de génico, la
hipersensibilidad a la DNasa y los sitios de unión de la lámina nuclear). Aunque no pudimos observar una
65 correlación con el contenido de genes, la hipersensibilidad a la DNasa o los dominios asociados a la lámina (no se
muestra), la distancia al telómero, el tiempo de replicación, el contenido de repetición simple, la composición de GC
192
ES 2 906 023 T3
En general, la mayor parte de las características genómicas que se correlacionan con la frecuencia de mutación en
35 la población general también se correlacionan con sustituciones somáticas en el tumor deficiente en MMR, lo que
sugiere que una parte considerable de la diversidad genética humana surge debido a errores de apareamiento que
escapan a MMR. En apoyo de esta noción, observamos frecuencias de mutación muy similares en el ADN somático
y de línea germinal del hipermutador, en las bases de datos 1000 Genomes Project y dbSNP de ratón
(respectivamente el 71,5%, el 68,3%, el 66,9% y el 67,1% de todas las sustituciones representaron transiciones). En
40 particular, la frecuencia de sustitución somática por unidad cromosómica (100 kb) en el hipermutador está
fuertemente correlacionada con el número de líneas germinales correspondientes (R2= 0,90 y 1000 Genomes
Project SNP (R2= 0,90) en la misma unidad, pero no con la frecuencia de sustitución somática en los genomas de
adenocarcinoma de pulmón o melanoma (R2= 0,53 y 0,37).
A continuación, evaluamos el patrón de indeles somático en el hipermutador. Como era de esperar, dado que la
mayor parte de indeles se ubicaron en homopolímeros, se observó una fuerte correlación entre las repeticiones
simples y la frecuencia de indeles (figura 2g). Casi todos los indeles afectaron a los homopolímeros A o T (94,0%;
50 figura 2h), pero aunque el 92,2% de los homopolímeros consisten en bases A o T, los homopolímeros C o G
parecen igualmente propensos a acumular indeles. Además, hasta el 96,4% de los indeles consistían en
desplazamientos de marco de 1 o 2 pb (figura 2i), lo que confirma que MSH6 está involucrado principalmente en la
reparación de indeles de 1 o 2 pb. Las deleciones fueron ligeramente menos frecuentes que las inserciones (47,7%
frente a 52,3%; P < 10E-6). Al calcular para cada sustitución somática la distancia al indel somático más cercano,
55 observamos que las sustituciones se ubicaron, respectivamente, 3,8 y 3,4 veces más frecuentemente dentro de una
distancia < 5 o < 10 pb de lo esperado basándose en una distribución aleatoria de sustituciones e indeles (figura 2j).
De forma similar, aunque no hubo evidencia de kataegis (tormentas somáticas) (Nik-Zainal et al., 2012), las
sustituciones somáticas se agruparon 7,6 veces más frecuentemente que lo predicho por el modelado aleatorio
(figura 2k). Se observó el mismo agrupamiento de sustituciones en los tumores competentes en MMR (no se
60 muestra), aunque con una frecuencia general más baja, lo que sugiere que la aparición de estos agrupamientos está
suprimida por MMR. Sorprendentemente, estas observaciones son similares a los genomas eucariotas, en los que el
número de sustituciones se eleva cerca de otras sustituciones e indeles (McDonald et al., 2011; Tian et al., 2008).
65
193
ES 2 906 023 T3
Tumor IHC MLH1 IHC MSH2 IHC MSH6 MSI (Bethesda) Hipermetilación de MLH1
MMR- 2 - (*) + - + +
MMR- 3 - + + + +
MMR- 4 + - - - -
MMR- 5 + - - + -
MMR- 6 + + - + -
MMR- 7 - - - - +
MMR- 8 + - - - -
MMR- 9 + - + + N/A
MMR- 10 + + - + N/A
MMR- 11 - + + + N/A
194
ES 2 906 023 T3
(continuación)
Tumor IHC MLH1 IHC MSH2 IHC MSH6 MSI (Bethesda) Hipermetilación de MLH1
MMR+ 3 + + + - -
MMR+ 4 + + + - -
MMR+ 5 + + + - -
MMR+ 6 + + + - -
Para la prueba de inestabilidad microsatelital, a continuación se enumeran los resultados detallados de todos los
5 marcadores incluidos en el panel Bethesda ampliado.
Tumor MTD 25 MTD 26 D5S346 D17S250 D2S123 TGFB MTD 40 D18S58 D17S787 D18S69
MMR- 2 + + + N/A N/A N/A - N/A - +
MMR- 3 - + - + + + - + - -
MMR- 4 - - - - - - N/A - - -
MMR- 5 + - + + + + N/A - - -
MMR- 6 + - + + + - + - - +
MMR- 7 - - - - - - - - - -
MMR- 8 - - - - - - - - - -
MMR- 9 + + + + + - + N/A + +
MMR- 10 + + + - + - + N/A + +
MMR- 11 + + + + - - + N/A + +
MMR+ 3 - - - - - - - - - -
MMR+ 4 - - - - - - - - - -
MMR+ 5 - - - - - - - - - -
MMR+ 6 - - - - - - - - - -
10 Sorprendentemente, los tumores MMR- 4, 7 y 8 fueron negativos a MLH1, MSH2 o MSH6 según lo evaluado por
inmunohistoquímica, pero no se identificaron como tumores positivos a MSI utilizando el panel Bethesda. Esta
observación muy probablemente ilustra que el panel Bethesda actual para el diagnóstico de MSI no reconoce varios
tumores positivos a MSI. Sin embargo, utilizando nuestro panel mejorado de 56 marcadores (tabla 3 y ejemplo 7),
pudimos confirmar que estos tumores deficientes en MMR eran positivos a MSI.
15
3.2 Secuenciación, mapeo y llamada de variantes para exomas secuenciados con la tecnología HiSeq2000 de
Illumina
La secuenciación del exoma del ADN del tumor y de la línea germinal correspondiente mediante una tecnología de
20 secuenciación independiente (Illumina®) revelaron que cada tumor deficiente en MMR contenía en promedio 1.497
eventos somáticos frente a 39 para los tumores competentes en MMR (aumento de 38,9 veces; figura 3a). En los
tumores deficientes en MMR, una gran mayoría de estos (78,4%) representaron sustituciones (figura 3b), la mayor
parte de las cuales fueron transiciones A:T>G:C y G:C>A:T (81,5%). Las mutaciones restantes representaron
indeles somáticos, que estaban muy enriquecidos en homopolímeros (55,9%).
25
En resumen, los exomas se capturaron utilizando el kit de enriquecimiento de exomas TruSeq de Illumina (8 rxns),
después del enriquecimiento, las bibliotecas enriquecidas se sometieron a secuenciación por Illumina (HiSeq 2000).
La secuenciación de extremos emparejados (2x75 pb) se realizó con kits TruSeq SBS. Se usó BWA para alinear las
lecturas sin procesar de cada carril de secuenciación (en formato fastq) con el genoma de referencia humano
30 (NCBI37/hg19) usando parámetros predeterminados. Las lecturas alineadas se procesaron y se clasificaron con
SAMtools (v.0.1.13) y los duplicados de PCR se eliminaron con Picard MarkDuplicates (http://picard.sourceforge.net,
v1.32). La recalibración de bases, el realineamiento local alrededor de indeles y la llamada de variantes de un solo
nucleótido se realizaron utilizando el kit GenomeAnalysisToolKit (GATK v1.0.4487). Adicionalmente, también
filtramos todas las variantes comunes de las listas de mutaciones somáticas. Esto se realizó utilizando varias pistas
35 de datos, que se aplicaron a las listas de variantes utilizando el comando intersectBed de BEDTools (Quinlan y Hall,
2010). Las sustituciones somáticas y los indeles se validaron mediante genotipado por Sequenom MassARRAY. Los
datos generales de mutación después del filtrado de calidad y la validación se proporcionan en la tabla 16.
195
ES 2 906 023 T3
196
ES 2 906 023 T3
Los efectos dependientes del contexto revelaron un fuerte efecto CG para las transiciones G:C>A:T (figura 3c).
Curiosamente, las sustituciones de novo de la línea germinal identificadas por secuenciación del exoma mostraron
efectos dependientes del contexto similares, lo que confirma la noción de que las mutaciones subyacentes a la
variación genética humana y la enfermedad surgen a menudo debido a errores de apareamiento que escapan a la
5 MMR (figura 3d). Además, aunque el número de eventos somáticos fue ligeramente superior en tumores CCR que
en tumores EM (en promedio, 2278 frente a 1161 eventos), no observamos diferencias claras en el patrón de
mutación entre ambos tipos de cáncer (no se muestra).
Asimismo, la estratificación de los patrones de mutación según la deficiencia de MLH1 o MSH2 no reveló diferencias
10 obvias. En particular, aunque observamos que los indeles eran ligeramente más comunes en los microsatélites
(12,0% y 11,2% frente al 5,4% en el exoma del hipermutador), los homopolímeros seguían siendo los más afectados
(figura 3e), lo que confirma que los indeles en tumores deficientes en MLH1 o en MSH2 afectan preferentemente a
los homopolímeros, en lugar de a los microsatélites.
Mientras que la frecuencia de mutación observada en los exomas de tumores deficientes en MMR reveló evidencia
20 de selección negativa, algunas mutaciones también pueden ser objeto de selección positiva. Es más probable que
estas mutaciones aparezcan como mutaciones de punto caliente (recurrentes). Por lo tanto, evaluamos cuántos
homopolímeros se vieron afectados de forma recurrente en tumores deficientes en MMR. Por lo tanto, los 10
exomas deficientes en MMR, junto con el exoma extraído del genoma completo del hipermutador, se analizaron para
detectar la aparición de sustituciones e indeles recurrentes. Se generaron dos conjuntos de mutaciones recurrentes:
25 datos para sustituciones o indeles recurrentes en al menos 3, o al menos 4 de 11 tumores.
Se detectaron mutaciones de punto caliente en 11 tumores deficientes en MMR. Se generaron listas de variantes
para mutaciones recurrentes en tres (cuatro) o más muestras. En primer lugar intentamos excluir el hecho de que
estas mutaciones de punto caliente representan errores de secuenciación. Existe la posibilidad de que las
30 mutaciones de punto caliente sean falsos positivos, ya que pueden generarse mediante llamadas de variantes
sistemáticas de falsos positivos en los tumores o mediante llamadas sistemáticas de falsos negativos en las
muestras normales. Por lo tanto, realizamos una etapa de filtrado adicional. En particular, recopilamos todas las
variantes identificadas en cada uno de los 11 exomas normales endometriales y 3 exomas normales colorrectales.
Cada mutación de punto caliente que también estaba presente como una variante de la línea germinal en al menos
35 uno de estos exomas se consideró un error sistemático y se eliminó del conjunto de datos. Esto dio como resultado
una gran reducción de las sustituciones recurrentes, mientras que el efecto sobre los indeles recurrentes fue muy
limitado (tabla 17).
3 o más 33 84 5 82
4 o más 8 45 0 44
Las 5 sustituciones de punto caliente en 3 o más tumores se sometieron a validación por Sequenom. De estas
sustituciones, solo se confirmó una. Además, intentamos validar todos los indeles recurrentes en cuatro o más
muestras. De estos 44 indeles recurrentes, 26 indeles pudieron genotiparse con éxito y todos se confirmaron
45 mediante el genotipado de Sequenom (tasa de validación del 100%). Dada la alta tasa de validación de indeles
somáticos recurrentes y no recurrentes, no buscamos más validaciones para los indeles restantes (n = 18), pero
consideramos todos los indeles recurrentes como verdaderos indeles positivos.
Dado que en los tumores deficientes en MMR los indeles se limitaron principalmente a homopolímeros, limitamos
50 nuestros análisis a indeles que afectan de forma recurrente a regiones homopoliméricas. Realizamos un cribado de
los 30.111 homopolímeros exónicos capturados con TruSeq de Illumina en cada uno de los 11 tumores deficientes
en MMR. La tabla 18 enumera el número de homopolímeros que se vieron afectados de forma recurrente en
tumores deficientes en MMR.
197
ES 2 906 023 T3
Tabla 18. Lista de homopolímeros con indeles en regiones exónicas en 11 tumores deficientes en MMR
2 173
3 38
4 26
5 8
6 5
7 3
8 1
9 1
En total, 1.493 homopolímeros se vieron afectados al menos una vez, 255 se vieron afectados al menos dos veces,
5 82 se vieron afectados tres veces y 44 se vieron afectados de forma recurrente en al menos 4 de 11 tumores. Estos
82 homopolímeros afectados se consideraron mutaciones de punto caliente. 4 de 82 mutaciones de punto caliente
se ubicaron en genes del censo de cáncer conocidos (RPL22, MSH6, MLL3 y BRAF). 41 de 82 mutaciones de punto
caliente se ubicaron en genes previamente implicados en tumores deficientes en MMR u otros tipos de cáncer. La
lista de estas mutaciones se proporciona en la tabla 7. El análisis se amplió analizando adicionalmente 5 líneas de
10 células tumorales primarias. Esto dio lugar a un total de 149 homopolímeros exónicos afectados de forma recurrente
en al menos 4 de 16 tumores deficientes en MMR. Los detalles de estas mutaciones de punto caliente se pueden
encontrar en la tabla 2. Cuando se aplicó una etapa de filtrado adicional, excluyendo no solo las variantes comunes
presentes en la base de datos 1000 Genomes y la base de datos dbSNP, sino también las variantes en nuestra base
de datos patentada de más de 100 individuos, se obtuvieron 103 homopolímeros exónicos afectados de forma
15 recurrente, que se enumeran en la tabla 5.
De los 44 homopolímeros afectados en al menos 4 de los 11 tumores, 21, 18, 1 y 4 consistían en tramos A, T, G o C,
respectivamente. Para los 82 homopolímeros afectados en al menos 3 de los 11 tumores, respectivamente 34, 31, 7
y 10 consistieron en tramos A, T, G o C (no se muestra). La longitud de los homopolímeros afectados de forma
20 recurrente varió de 7 nucleótidos a 25 nucleótidos. Sin embargo, se puede observar un fuerte sesgo hacia
homopolímeros con una longitud de 7-11 nucleótidos afectados en al menos 3 de 11 veces (no se muestra).
25 Para evaluar si los indeles recurrentes aparecen como consecuencia de la selección positiva o aparecen
aleatoriamente como resultado de una mayor frecuencia de indeles en los tumores deficientes en MMR, calculamos
el número esperado de indeles recurrentes basándonos en la frecuencia de indeles observada en el genoma
completo en el hipermutador. Dado que el deslizamiento de la polimerasa durante la replicación es más probable
que ocurra en homopolímeros largos, se espera que las mutaciones de indeles afecten más fácilmente a los
30 homopolímeros de mayor longitud. Por lo tanto, calculamos la frecuencia esperada (fe,genoma) para cada longitud de
homopolímero de entre 6 y 11 bases, ya que estos representan la mayor parte de los homopolímeros exónicos
(99,7%, figura 4a).
198
ES 2 906 023 T3
Tal como se ha mencionado, la frecuencia observada en el hipermutador (fe,genoma) se utilizó para calcular el número
esperado de homopolímeros afectados en el exoma (multiplicando el número esperado de indeles por homopolímero
por el número de homopolímeros de esta longitud en el exoma). Después calculamos el número de homopolímeros
de una longitud determinada que se ven afectados en los 11 tumores deficientes en MMR. Este número se promedia
5 con respecto a los 11 exomas deficientes en MMR y se denomina frecuencia observada (fo,exoma) de un
homopolímero de una longitud determinada que se ve afectado. Después se calculan las veces del enriquecimiento
con respecto al número esperado de indeles en homopolímeros de esta longitud como la relación de las frecuencias
observadas y esperadas. Hubo un enriquecimiento débil en el número de indeles que aparecen en homopolímeros
de longitud 8-11 en estos exomas (véase la tabla 20).
10
Tabla 20
Suponiendo que cada homopolímero de la misma longitud tiene una probabilidad igualmente alta de verse afectado,
15 la probabilidad de que los homopolímeros se vean afectados en dos o tres tumores independientes se puede
calcular como el producto de la probabilidad de que un homopolímero se vea afectado en un tumor (es decir, la
frecuencia observada en el genoma completo fgenoma).
Como tal, la frecuencia esperada de que un homopolímero se vea afectado en tres tumores se calculó de la forma
20 siguiente:
fe,recurrente en 3 = (fe,genoma)3
25 fe,recurrente en 4 = (fe,genoma)4
Para calcular el número esperado de indeles recurrentes en tres, respectivamente cuatro, tumores, multiplicamos las
frecuencias esperadas por el número de homopolímeros en el exoma, y por el número de formas en que podemos
extraer 3, resp. 4, muestras de 11 muestras (es decir, el número de combinaciones C(3,11) y C(4,11)). Por lo tanto,
30 el número de indeles recurrentes esperados en 11 tumores se calcula de la forma siguiente:
7 9 7,84E-02 114,80
8 25 5,76E-01 43,38
9 18 5,54E-01 32,47
10 16 2,27E-01 70,56
11 11 1,93E-01 57,12
40
199
ES 2 906 023 T3
7 1 7,26E-04 1377,52
8 11 1,79E-02 615,67
9 9 2,82E-02 319,62
10 10 1,29E-02 776,36
11 11 1,41E-02 782,52
En resumen, aunque la mayor parte de los homopolímeros presentes en el exoma constan de 6 nucleótidos, la
mayor parte de los homopolímeros afectados de forma recurrente presentaron una longitud de 8-11 nucleótidos. Por
lo tanto, evaluamos la posibilidad de que estos homopolímeros se vieran afectados de forma recurrente debido a su
10 mayor longitud. Calculamos la probabilidad en el genoma completo de que un homopolímero de una longitud
específica se viera afectado por un indel en el hipermutador y encontramos que el número de mutaciones
observadas en el exoma era mayor de lo esperado para cada longitud de homopolímero. También calculamos la
probabilidad en el genoma completo de observar indeles recurrentes en homopolímeros de una longitud específica y
encontramos que el número observado de mutaciones recurrentes exónicas en > 2 o > 3 tumores era mucho mayor
15 de lo esperado para cada longitud de homopolímero, lo que indica que los homopolímeros exónicos no se vieron
afectados de forma recurrente debido al aumento de la longitud. Esto indica que estos indeles en estos
homopolímeros se seleccionan positivamente en estos cánceres.
Conclusión
20
En total, 1.238 de 30.111 homopolímeros se vieron afectados una vez, mientras que 173 homopolímeros se vieron
afectados dos veces. Además, 82 homopolímeros se vieron afectados por el mismo indel en al menos 3 tumores. De
ellos, 27 y 8 homopolímeros estaban presentes en 4 o 5 tumores, y 5 estaban presentes en 6 tumores (tabla 7 y tabla
23). Por el contrario, solo se identificó una única sustitución (G13D en KRAS) en más de un tumor deficiente en MMR.
25
Tabla 23. Genes afectados por indeles en al menos 3 de los 11 exomas deficientes en MMR
Número de muestras
Genes afectados*
afectadas
9 SETD1B
8 CASP5
7 RPL22, RBMXL1
6 SEC31A, OR7E24, MSH6, CCDC150, MYL1, ASTE1
5 SLC22A9, CNOT2, C15orf40, LTN1, KIAA2018, RGS12, RNF145, PHF2
4 WDTC1, RNPC3, FAM111B, NDUFC2, CASP5, TMBIM4, MIS18BP1, PRRT2, CTCF,
KIAA0182, TAF1B, SMC6, SLC35F5, ACVR2A, COBLL1, DDX27, CDH26, TGFBR2,
MBD4, ATR, EXOSC9, TTK, GRIK2, KIAA1919, MAP3K4, TMEM60
3 ARV1, KCNMA1, HPS1, ADD3, UVRAG, CD3G, SRPR, WNK1, CHD4, SENP1,
MYO1A. GLI1, CCDC168, PIGB, TMEM97, COIL, RNF43, ELAVL3, RBM43, NBEAL1,
NRIP1, P4HTM, DOCK3, RG9MTD1, ZBTB20, FETUB, CLOCK, MYO10, MSH3,
SPINK5, IGF2R, BRAF, MLL3, PRKDC, UBR5, AQP7, PRRG1, F8
Ejemplo 5. Los indeles recurrentes en las 3' y 5' UTR afectan a los homopolímeros largos
30
Dado que las 5' y 3' UTR son críticas para determinar la expresión génica, también evaluamos mutaciones en estas
regiones. En particular, utilizando datos del exoma de tumores deficientes en MMR, pudimos evaluar de forma fiable
hasta el 83,9% y el 91,9% de estas regiones.
200
ES 2 906 023 T3
Para evaluar si cualquiera de las regiones 5' UTR y 3' UTR se vieron afectadas por mutaciones recurrentes, se
5 cribaron 5.367 y 59.259 homopolímeros ubicados en las 5' UTR y 3' UTR capturadas en el exoma de 10 tumores
deficientes en MMR, respectivamente. Estos homopolímeros también se cribaron en las 5' UTR y las 3' UTR de la
muestra de hipermutador con el genoma completo secuenciado, de modo que el número total de tumores en los que
pudimos cribar las 5' y 3' UTR fue de 11 tumores deficientes en MMR. Eliminamos cada mutación de punto caliente
que también estaba presente como una variante de la línea germinal en al menos una de 11 muestras deficientes en
10 MMR.
Los indeles recurrentes en homopolímeros fueron mucho más frecuentes en regiones 5' y 3' UTR de lo esperado a
partir de las observaciones en el exoma: en las regiones 3' UTR observamos 1.142 indeles recurrentes en al menos
4 de 11 tumores y 1.812 en al menos 3 de 11 tumores, mientras que en las 5' UTR observamos 50 indeles
15 recurrentes en al menos 4 de 11 tumores y 89 en al menos 3 de 11 tumores. Estos indeles recurrentes se muestran
en la tabla 6. Cuando se tomaron en cuenta las 5 muestras adicionales deficientes en MMR, se obtuvieron como
resultado 2.648 indeles recurrentes en 4 de 16 tumores para las regiones 3' UTR y 155 indeles recurrentes en 4 de
16 tumores para las regiones 5' UTR. Esta lista de indeles recurrentes frecuentes en homopolímeros en regiones
UTR (presentes en al menos 4 de los 16 tumores deficientes en MMR) se muestra en la tabla 1. En este caso
20 también, una etapa de filtrado adicional, que excluye no solo las variantes comunes presentes en la base de datos
1000 Genomes y la base de datos dbSNP, sino también variantes presentes en nuestra base de datos patentada de
más de 100 individuos, redujeron el número de homopolímeros afectados de forma recurrente en las regiones UTR a
1.314 indeles recurrentes en 4 de 16 tumores para las regiones 3' UTR y 88 indeles recurrentes en 4 de cada de 16
tumores para las regiones 5' UTR, que se enumeran en la tabla 4.
25
Por el contrario, las sustituciones recurrentes fueron muy raras: se encontraron 3 sustituciones recurrentes en al
menos 4 de 11 tumores y 18 en al menos 3 de 11 tumores, mientras que en las regiones 5' UTR se observó 1
sustitución recurrente en tres muestras, y no se encontraron sustituciones en 4 o más muestras.
30 5.1.1. Longitud del homopolímero y recurrencia de la mutación somática en regiones exónicas, 5' UTR y 3' UTR
Para evaluar si los indeles recurrentes en las regiones 5' y 3' UTR también son resultado de la selección clonal
positiva o simplemente aparecen debido al contenido de homopolímeros, evaluamos la distribución de longitud de
los homopolímeros en función de su ubicación en los exones, 5' UTR y 3' UTR. Observamos que hay muchos más
35 homopolímeros en las 3' UTR y mucho menos homopolímeros en las 5' UTR. Los homopolímeros en la 3' UTR
también fueron más largos que en el exoma. Por ejemplo, el exoma contiene 29.733 (98,7%) homopolímeros de
longitud < 9 nucleótidos, mientras que las 5' UTR y las 3' UTR contienen 4.857 (90,5%) y 49.769 (84,0%)
homopolímeros de longitud < 9 nucleótidos, respectivamente. A pesar del mayor número de homopolímeros de
longitud corta (6 o 7) en la 3' UTR que en el exoma (no se muestra), el número de homopolímeros afectados en la 3'
40 UTR y el exoma fue más o menos igual (no se muestra). En la 3' UTR se ubicaron muchos indeles en los
homopolímeros largos, es decir, homopolímeros con una longitud de 9, 10, 11, >= 12 pares de bases.
Al evaluar los indeles recurrentes en las 5' y 3' UTR y el exoma, observamos que también el número de indeles
recurrentes fue mucho mayor en la 3' UTR que en la 5' UTR o el exoma. Los indeles recurrentes en las 3' UTR
45 afectaron principalmente a los homopolímeros con una longitud > 9 pares de bases. Sorprendentemente, a pesar del
mayor número de homopolímeros de longitud 7 u 8 en la 3' UTR que en el exoma y a pesar del mayor número de
indeles en homopolímeros de longitud 7 u 8 en la 3' UTR que en el exoma, hubo más indeles recurrentes que
afectaban a homopolímeros de longitud 7 u 8 en el exoma que en la 3' UTR. Los indeles recurrentes en la 3' UTR
afectaron principalmente a los homopolímeros de longitud 11 y >= 12.
50
Para verificar que el aumento de la fracción de homopolímeros afectados de forma recurrente con una longitud < 9
en el exoma no se debe a diferencias generales en las distribuciones de longitud de los homopolímeros en las
diferentes regiones, corregimos la frecuencia de indeles (es decir, la fracción de homopolímeros afectados) en
homopolímeros de longitud < 9 por la aparición general de estos homopolímeros en las diferentes regiones. La
55 fracción corregida se calculó de la forma siguiente:
Esta frecuencia de mutación corregida se calculó después para las tres regiones diferentes (exoma, 5' UTR y 3'
60 UTR). Después de esta corrección, se observó aún el enriquecimiento para homopolímeros recurrentes más cortos
en el exoma (39,2% con longitud < 9) en comparación con las 5' (19,5%) y 3' UTR (2,2%). Estos datos indican
claramente que la longitud del homopolímero determina críticamente qué homopolímeros se ven afectados de forma
recurrente en las regiones 5' y 3' UTR, mientras que en el exoma, la longitud de homopolímeros y el efecto de la
201
ES 2 906 023 T3
mutación sobre la ventaja del crecimiento clonal determinan qué homopolímeros se ven afectados de forma
recurrente. La tabla 24 muestra una descripción general de los datos descritos en los párrafos anteriores.
Porcentaje de homopolímeros afectados de forma recurrente con longitud < 9 41,5% 3,4% 3,9%
Por lo tanto, en resumen, en las 5' y 3' UTR, los homopolímeros son más largos que en las regiones codificantes
(figura 4a); además, los homopolímeros más largos en las UTR tienen una mayor propensión a acumular indeles
(figura 4b). En conjunto, esto da lugar a una frecuencia de indeles más alta en las 5' y 3' UTR que en las regiones
10 codificantes (aumento de 3,8 y 10,7 veces, respectivamente; figura 4c). Sin embargo, en las UTR, las mutaciones de
punto caliente se reducen en los homopolímeros largos. Por ejemplo, solo estaban presentes 3 (de 89; 3,4%) y 71
(de 1.812; 3,9%) mutaciones de punto caliente en homopolímeros afectados de las 5' y 3' UTR < 9 pb de longitud
(tabla 24), mientras que en regiones codificantes había presencia de hasta 34 (de 82; 41,5%) de dichas mutaciones
de punto caliente (figura 4d). En general, esto sugiere que la longitud del homopolímero determina críticamente qué
15 homopolímeros se ven afectados frecuentemente en las regiones 5' y 3' UTR, mientras que en las regiones
codificantes, el impacto de la mutación sobre la ventaja del crecimiento clonal codetermina qué homopolímero se ve
afectado con mayor frecuencia.
Los datos de expresión de genes en tejido endometrial normal se descargaron del Atlas de expresión génica23
(http://www.ebi.ac.uk/gxa/) utilizando la consulta "todos los genes sobreexpresados/subexpresados/expresados no
diferencialmente en Homo sapiens, endometrio". Esta consulta dio como resultado 14.664 genes, de los cuales
35 9.021 se sobreexpresaron en el endometrio normal, 463 se subexpresaron y 5.180 mostraron expresión no
diferencial. Dado que la sobreexpresión y la subexpresión se calcularon con respecto a los perfiles de expresión
génica general en diferentes tipos de tejido, es difícil evaluar si los genes subexpresados están efectivamente
ausentes (no expresados) o simplemente expresados a un nivel inferior. Sin embargo, para los genes
sobreexpresados significativamente en el tejido endometrial, podemos argumentar con seguridad que al menos
40 desempeñan un papel dentro del endometrio normal. Por lo tanto, en este análisis nos hemos limitado a los genes
sobreexpresados en el endometrio normal.
Las mutaciones de diferentes conjuntos de datos se compararon con los datos de expresión derivados: todos los
genes mutados en tumores competentes en MMR (genes MMR+), todos los genes mutados en tumores deficientes
45 en MMR (genes MMR-), todos los genes afectados de forma recurrente en tumores deficientes en MMR (definidos
como 3 de 11 muestras, genes recurrentes), y finalmente todos los indeles recurrentes en regiones exónicas
(exónicos recurrentes). Este análisis indicó que las mutaciones recurrentes (de punto caliente) estaban
sobrerrepresentadas en genes que estaban sobreexpresados en tejido endometrial normal. Los datos completos
para estos análisis se muestran en la tabla 25.
50
202
ES 2 906 023 T3
Las mutaciones de diferentes conjuntos de datos se compararon con los datos de expresión derivados: todos los
genes mutados en tumores competentes en MMR (genes MMR+), todos los genes mutados en tumores deficientes
en MMR (genes MMR-), todos los genes afectados de forma recurrente en tumores deficientes en MMR (definidos
15 como 3 de 11 muestras, genes recurrentes), y finalmente todos los indeles recurrentes en regiones exónicas
(exónicos recurrentes). Este análisis reveló que las mutaciones de punto caliente se enriquecieron entre el conjunto
de genes expresados diferencialmente en tumores inestables en microsatélites.
Tabla 26. Análisis de genes específicos para cánceres colorrectales con MSI
20
Conjunto de datos (n = 4.874 genes) Genes Genes Genes Exónicos
deficientes en competentes en recurrentes recurrentes
MMR MMR
Genes en el conjunto de datos 7.084 380 994 82
Expresados diferencialmentes en MSI-H 1.524 (21,5%) 63 (16,6%) 211 (21,2%) 28 (34,1%)
Resumen
Utilizando datos de expresión disponibles públicamente del Atlas de expresión génica (Kapushesky et al., 2010),
25 evaluamos si los genes afectados por la misma mutación en al menos 3 tumores deficientes en MMR (en lo
sucesivo, mutaciones de punto caliente) se expresaron en tejido EM normal. De todos los genes mutados en
tumores competentes en MMR y deficientes en MMR, el 58% y el 64% se expresaron en tejido EM en comparación
con el 88% de los genes afectados por mutaciones de punto caliente (tabla 25). Se obtuvieron datos similares para
tejido de mucosa normal (no se muestran). Además, al evaluar las diferencias de expresión entre tumores
30 deficientes en MMR y tumores competentes en MMR (Banerjea et al., 2004), observamos que el 20% de los genes
afectados por mutaciones no de punto caliente frente al 32% de los genes afectados por mutaciones de punto
caliente se expresaron de forma diferencial. Por lo tanto, las mutaciones de punto caliente afectan preferentemente a
genes que se expresan en tejido normal y alteran su expresión, lo que indica que son el resultado de una selección
clonal positiva en el tumor.
35
Ejemplo 7. Las mutaciones recurrentes detectan de forma fiable MSI en varios tipos de tumores
45 Hay dos criterios por los que creemos que es posible mejorar el panel de diagnóstico que se utiliza actualmente para
detectar inestabilidad microsatelital. En primer lugar, determinamos mutaciones recurrentes en tumores deficientes
en MMR de una forma no sesgada: mediante la realización de experimentos de secuenciación del genoma completo
203
ES 2 906 023 T3
y del exoma y simplemente observando qué posiciones se vieron afectadas de forma recurrente. La detección de
forma no sesgada sugiere que las mutaciones de punto caliente más frecuentes serán las más sensibles para
detectar MSI. En segundo lugar, la mayor parte de los indeles recurrentes que identificamos estaban ubicados en la
3' UTR. Los indeles recurrentes en las 5' y 3' UTR no se someten a una selección positiva estricta, pero están
5 determinados principalmente por la longitud del homopolímero afectado, y es poco probable que se produzcan
enriquecimientos específicos de tejido. Estos dos criterios aseguran que i) hemos elegido marcadores que, sin un
conocimiento a priori de su función, se ven afectados de forma recurrente en múltiples muestras tumorales y ii)
tienen una serie de marcadores que probablemente sean independientes del tipo de cáncer. Para el último, los
indeles seleccionados de las 5' y 3' UTR pueden ser más útiles.
10
Para obtener la mayor sensibilidad, solo usamos mutaciones que aparecen en 4 o más muestras. Para los indeles
recurrentes de 5' y 3' UTR, se dio prioridad a los indeles que afectaban a 5 o más muestras. Los 44 indeles exónicos
recurrentes, 1.142 indeles de 3' UTR recurrentes y 50 indeles de 5' UTR recurrentes resultantes se utilizaron para
diseñar un panel basado en Sequenom para detectar deficiencia en MMR. Dado que los indeles recurrentes se
15 ubicaron en regiones homopoliméricas, el diseño de cebadores de una PCR multiplex de Sequenom fue complejo.
Después de amplios experimentos de optimización, se generaron con éxito seis ensayos que genotipaban 56
mutaciones de punto caliente. De las 56 mutaciones de punto caliente, 11 se localizaron en exones, 40 en 3' UTR y
5 en 5' UTR, respectivamente. Nos referimos a este panel como el panel de 56 marcadores. Los detalles completos
de estas 56 mutaciones se pueden encontrar en la tabla 3.
20
7.2 Evaluación diagnóstica de MSI en tumores endometriales
A continuación, el panel de 56 marcadores se aplicó a una serie adicional de 114 tumores endometriales resecados
quirúrgicamente no seleccionados, que consistían en 7 carcinomas endometriales de células claras, 69 endometrioides,
25 18 endometrioides serosos mixtos, 10 serosos y 10 no clasificados. Todos los tumores eran tumores endometriales
primarios no tratados previamente con quimioterapia. Se dispuso de tejido recién congelado para cada uno de estos
tumores. La tasa de éxito de genotipado de los marcadores seleccionados fue alta (en promedio el 98,7%). El número de
marcadores positivos para una muestra varió entre 0 y 33, con un promedio general de 6,5 marcadores positivos por
muestra. De forma análoga al panel Bethesda, definimos tres categorías de inestabilidad microsatelital: estable en
30 microsatélites (MSS, 0 de 10 marcadores en Bethesda, 0 o 1 de 56 marcadores en el panel de 56 marcadores), baja
inestabilidad microsatelital (MSI-L, 1-2 de 10 marcadores en el panel Bethesda, entre 2 y 9 marcadores en un panel de
56 marcadores) y alta inestabilidad microsatelital (MSI-H, 3 o más de 10 marcadores en Bethesda, 10 o más de 56 en un
panel de 56 marcadores). Según estas categorías para el panel de 56 marcadores, 65 tumores (57,0%) se definen como
MSS. 33 tumores (29,0%) y 16 tumores (14,0%) se definen como MSI-H y MSI-L respectivamente. De estos 33 tumores
35 MSI-H, Bethesda identificó 29 tumores como MSI-H (> 2 marcadores positivos), 3 tumores como MSI-L y un tumor como
MSS. A la inversa, Bethesda no identificó ningún tumor MSI-H que no fuera identificado por nuestro panel de mutaciones
de punto caliente (tal como se muestra en la figura 5). Este resultado muestra que el panel de 56 marcadores tuvo un
mejor rendimiento que el panel Bethesda para esta serie de tumores endometriales. Los datos de los tumores
colorrectales son comparables (no se muestran).
40
7.3 Firmas de mutaciones en otros tipos de tumores
También aplicamos nuestro panel de 56 marcadores a otros tipos de tumores (tumores de ovario y leucemia). Se
seleccionaron 4 muestras MSI-H, incluyendo 1 de tumor de ovario y 3 muestras de líneas celulares de leucemia
45 (DND41, CCRF-CEM y SUPT1). Para evaluar si nuestras observaciones en tumores endometriales/colorrectales
deficientes en MMR eran extrapolables a otros tipos de tumores, se secuenciaron el tumor de ovario MSI-H, dos
tumores de ovario que se detectaron como MSS y sus muestras normales correspondientes, así como tres líneas
celulares de leucemia MSI-H y una línea celular de leucemia MSS (RPMI-8402).
50 Los 3 pares de tumores de ovario normales fueron tumores primarios, no tratados previamente con quimioterapia,
recolectados durante la cirugía. Se secuenció el exoma del tumor de ovario deficiente en MMR (MMR- Ovárico 1),
junto con su ADN normal correspondiente, utilizando la captura TruSeq de Illumina. El mismo conducto de análisis
que se describió anteriormente se utilizó para el análisis de estos datos del exoma. Los datos del exoma de dos
tumores ováricos MMR+ (MMR+ Ovárico 1 y 2), junto con sus muestras normales correspondientes, se extrajeron de
55 los datos existentes del genoma completo. En particular, ambos pares tumor-normal competentes en MMR ya
estaban disponibles de otro proyecto y se secuenciaron utilizando Complete Genomics. Los datos de la secuencia
del genoma completo se han depositado en el Archivo Europeo de Genomas y Fenomas con el número de acceso
EGAS00001000158. Para estos genomas se utilizaron los mismos análisis que se describen en los Ejemplos
anteriores del presente documento.
60
Además, se secuenció el exoma de 4 líneas celulares de leucemia utilizando captura de Nimblegen. Los exomas se
capturaron utilizando Nimblegen SeqCap EZ Human Exome Library v2.0. Se construyeron bibliotecas de ADN de
preenriquecimiento según el protocolo estándar de la Guía de preparación de muestras de ADN de extremos
emparejados de Illumina. El enriquecimiento del exoma se realizó según las instrucciones del fabricante. Se realizó
65 una ronda (72 horas) de hibridaciones basadas en cebo biotinilado, seguida de unión de perlas magnéticas de
estreptavidina, una etapa de lavado y una etapa de elución. Se realizó un enriquecimiento por PCR de 18 ciclos
204
ES 2 906 023 T3
después de la elución y las bibliotecas enriquecidas se sometieron a secuenciación de Illumina (HiSeq 2000). La
secuenciación de extremos emparejados (2 x 51 pb) se realizó con kits TruSeq SBS. Se utilizó un carril para un
exoma. La información clínica detallada de todas las muestras se incluye en la tabla 27. La tabla 28 enumera todas
las mutaciones encontradas en los genes MMR en todas las muestras de ovario y leucemia.
5
Tabla 27. Información clínica para tumores de ovario y de leucemia
En el tumor de ovario deficiente en MMR (MMR- Ovárico 1), se detectaron 2.045 nuevas sustituciones somáticas y
280 nuevos indeles somáticos. Debido a que la tasa de validación en los otros tumores deficientes en MMR era muy
alta en tumores en los que se había secuenciado tanto el genoma completo como el exoma (véase anteriormente),
15 no se realizó una validación adicional para este tumor. En los dos tumores de ovario competentes en MMR se
detectaron respectivamente 32 y 42 sustituciones somáticas nuevas y 12 y 18 indeles somáticos nuevos. Debido a la
baja tasa de validación en tumores competentes en MMR en general, todas las mutaciones somáticas en los dos
tumores de ovario competentes en MMR se validaron utilizando Sequenom MassARRAY. Se confirmaron
respectivamente 16 y 20 sustituciones como sustituciones verdaderas en los dos tumores de ovario competentes en
20 MMR. No se confirmó ningún indel en ninguno de los tumores. Para estas mutaciones somáticas, observamos los
mismos patrones que los observados en los tumores EM/CCR (datos no mostrados).
Los exomas de cuatro líneas celulares de leucemia se secuenciaron usando tecnología Illumina HiSeq, tal como se
ha descrito anteriormente. Dado que no había muestras de ADN normal correspondiente disponibles para estas
25 líneas celulares, no pudimos distinguir entre mutaciones somáticas o de línea germinal. Sin embargo, utilizando el
conducto de filtrado de variantes comunes descrito anteriormente, pudimos eliminar las variantes que aparecen con
más frecuencia. Tal como se observó anteriormente en tumores deficientes en MMR, los indeles se ubicaron
principalmente en los homopolímeros de las muestras de leucemia deficientes en MMR. Por otra parte, la muestra
competente en MMR no mostró este patrón (no se muestra).
30
Para las sustituciones, los patrones en muestras deficientes MMR y competentes en MMR fueron muy similares (no
se muestra). En particular, estos patrones revelaron que la mayor parte de las sustituciones no estaban ubicadas en
regiones de repetición. Al igual que en los tumores endometriales/colorrectales deficientes en MMR, las
sustituciones en muestras deficientes en MMR se componían principalmente de transiciones (73,0% frente a 27,0%
35 de transversiones, respectivamente).
Resumen
Seleccionamos 56 de las mutaciones de punto caliente más frecuentes identificadas por secuenciación del exoma:
45 se encontraban en las UTR, que son menos propensas a la selección clonal y, por lo tanto, podrían detectar MSI
40 en tumores de diferentes tipos de tejidos, y 11 se encontraban en regiones codificantes. El genotipado de 114
tumores EM resecados quirúrgicamente para estas 56 mutaciones reveló que 33 (29,0%) tumores fueron positivos
para ≥ 10 marcadores (MSI-alta o MSI-H) y 16 (14,0%) tumores para 2 a 9 marcadores (MSI-baja o MSI-L). Los 65
205
ES 2 906 023 T3
tumores restantes (57,0%) fueron positivos para < 2 marcadores y eran tumores estables en microsatélites (MSS)
(figura 5). De 33 tumores MSI-H, Bethesda identificó solo 29 tumores como MSI-H (> 2 marcadores positivos). Los 4
tumores discordantes contenían una mutación de desplazamiento de marco en MSH6 o eran deficientes para MSH6
en histopatología, lo que confirma que eran MSI-H. A la inversa, Bethesda no identificó ningún tumor MSI-H que no
5 fuera identificado por nuestro panel de mutaciones de punto caliente.
Finalmente, evaluamos si las mutaciones de punto caliente también estaban presentes en tumores de ovario y en
leucemia. En primer lugar, utilizando nuestro panel de 56 marcadores, seleccionamos 1 tumor de ovario y 3 líneas
celulares de leucemia (DND41, CCRF-CEM y SUPT1) que fueron positivas para 20, 25, 23 y 21 marcadores
10 respectivamente, así como 2 tumores de ovario y una línea celular de leucemia (RPMI8402) sin marcadores
positivos. La secuenciación del exoma de los tumores de ovario y sus muestras normales correspondientes confirmó
que el tumor de ovario MSI-H contenía sustancialmente más eventos somáticos que los 2 tumores de MSS
correspondientes, incluida una deleción de desplazamiento de marco en MSH6. Aunque no pudimos distinguir entre
mutaciones somáticas o de línea germinal en las líneas celulares de leucemia, ya que no se disponía de ADN de
15 línea germinal correspondiente, las sustituciones y los indeles también fueron más frecuentes en las líneas celulares
MSI-H (Nota S9). Se observaron dos mutaciones con pérdida de función en MLH1 y una deleción por
desplazamiento de marco en MSH6, lo que confirma que las líneas celulares MSI-H eran deficientes en MMR. Al
evaluar si las mutaciones recurrentes identificadas en tumores endometriales también estaban presentes en los
genomas de ovario y leucemia, notamos que de 384 mutaciones recurrentes en tumores endometriales MMR-, 60,
20 25, 8 y 1 estaban presentes respectivamente en 1, 2, 3 o 4 tumores MMR- (no se muestra). Se observó un
enriquecimiento más pronunciado al limitar las mutaciones recurrentes a las que estaban presentes en al menos 3
tumores endometriales. Finalmente, dado que los indeles recurrentes en el exoma se seleccionan positivamente por
el tejido tumoral mientras que los indeles recurrentes en las 5' y 3' UTR dependen en gran medida de la longitud del
homopolímero, los indeles presentes en las UTR podrían representar mejores marcadores de MSI.
25
Ejemplo 8. Los patrones de mutación de tumores deficientes en MMR afectan a la reparación de roturas de doble
hebra de ADN
Para explorar la relevancia biológica de las mutaciones de punto caliente en tumores deficientes en MMR,
30 realizamos análisis de vías con dos herramientas diferentes, a saber, IPA® y GenomeMuSiC. Estas dos
herramientas utilizan cuatro bases de datos de vías diferentes, es decir, las bases de datos IPA, KEGG, BioCarta y
Reactome. El uso de múltiples herramientas y bases de datos nos permitió obtener una impresión detallada de las
vías afectadas.
El análisis de vías de ingenio (IPA)®, http://www.ingenuity.com/) permite la identificación de las vías biológicas más
relevantes para los genes de interés. El análisis de vías de todos los genes con indeles somáticos (3.022 indeles en
2.231 genes, excluyendo los indeles presentes en los genes MMR, porque estábamos interesados en mutaciones
40 secundarias resultantes de la deficiencia de MMR) usando IPA® reveló que 24 vías están significativamente
enriquecidas (P < 0,05) (no se muestra). El "Papel de BRCA1 en la respuesta al daño al ADN" y la "Reparación de
rotura de doble hebra (DSB) de ADN por recombinación homóloga (HR)" se clasificaron en la posición 1 y 3
respectivamente. Si se restringe la lista de genes de interés a los genes que portan las mutaciones de punto caliente
solamente (1.382 indeles en 452 genes), se revelaron 13 vías significativamente enriquecidas tal como se muestra
45 en la tabla 29. Las vías de "Papel de BRCA1 en la respuesta al daño al ADN" y de "Regulación del punto de control
de ADN G2/M" se clasificaron en la posición 1 y 2, respectivamente.
Tabla 29. Análisis de la vía de los genes portadores de mutaciones de punto caliente
2 Ciclo celular: regulación del punto de control de daño al ADN G2/M 3,08E-03
206
ES 2 906 023 T3
(continuación)
En resumen, IPA® reveló que el "Papel de BRCA1 en la respuesta al daño al ADN" era la principal vía enriquecida
5 utilizando dos conjuntos diferentes de genes de interés, es decir, todos los genes que portan indeles somáticos y
todos los genes con mutaciones de punto caliente. La "Regulación del punto de control del ADN G2/M" y la
"Reparación de rotura de doble hebra (DSB) de ADN por recombinación homóloga (HR)" también fueron muy
significativas.
Además, como se sabe que los genes también son inactivados por indeles que afectan a homopolímeros ubicados
20 en los límites exón/intrón, ampliamos nuestra llamada de mutación a indeles que aparecen en las secuencias de 25
pares de bases cadena arriba y abajo de cada exón. Se realizó la misma llamada de mutación y el mismo conducto
de filtrado que se describieron anteriormente. Detectamos 1.700 indeles adicionales en los límites exón/intrón,
incluida una deleción en el homopolímero del intrón 7 de ATM, una deleción en el homopolímero del intrón 4 de
MRE11 y una inserción en el homopolímero del intrón 5 de FANCD2. Estos tres indeles afectan a 7, 5 y 1 muestras
25 respectivamente. Junto con los 3.022 indeles en las regiones exónicas, el análisis GenomeMuSiC de las 4.722
mutaciones reveló 54 vías mutadas significativamente (FDR < 0,05). La inclusión de indeles en los límites
exón/intrón produjo una señal aún más fuerte para la reparación de DSB de ADN como la principal vía enriquecida.
Considerando todos los análisis, hay 11 genes involucrados en la vía de reparación de DSB por HR. La tabla 30
30 siguiente enumera estos genes y los tumores deficientes en MMR que portan mutaciones en estos genes.
207
ES 2 906 023 T3
Resumen
Dado que los indeles presentes en tumores deficientes en MMR pueden estar sometidos a selección clonal positiva
o negativa, evaluamos si las vías específicas están enriquecidas para estas mutaciones. En promedio, cada tumor
5 deficiente en MMR contenía 309 indeles, 30 de los cuales eran mutaciones de punto caliente. Los análisis de vías de
todos los genes afectados por un indel somático (excepto los genes MMR porque los indeles en estos genes están
provocando deficiencia en MMR) usando IPA® revelaron que el "Papel de BRCA1 en la respuesta al daño al ADN" y
la "Reparación de rotura de doble hebra (DSB) de ADN por recombinación homóloga (HR)" eran las principales vías
enriquecidas (P = 6,5E-03 y P = 1,1E-02, respectivamente). El análisis IPA® de todas las mutaciones de punto
10 caliente reveló que además del "Papel de BRCA1 en la respuesta al daño al ADN" (P = 2,0E-03), la vía de
"Regulación del punto de control de daño al ADN G2/M" también se enriqueció (P = 3,1E-03). Los genes que
mutaron con más frecuencia en estas vías incluyeron, entre varios otros, ATR, BLM, BRCA1, CHEK1 y FANCM (4,
2, 2, 2 y 2 mutaciones, respectivamente; tabla 30). Los análisis de vías de todos los indeles en tumores deficientes
en MMR utilizando GenomeMuSiC, que calcula las vías que están mutadas específicamente basándose en las
15 bases de datos KEGG, BioCarta o Reactome, mientras corrige por la tasa de mutación de fondo, revelaron que,
respectivamente, las vías de "Reparación de ADN", "Reparación por escisión de bases" y "Puntos de control de
daño al ADN G2/M" se clasificaron en las posiciones más altas (P = 6,3E-05, P = 3,1E-04 y P = 9,8E-04,
respectivamente). Además, dado que los genes de reparación de DSB también pueden verse afectados por indeles
con pérdida de función en homopolímeros ubicados en los límites exón/intrón (Ham et al., 2006), ampliamos nuestra
20 llamada de mutación a indeles que aparecen en las secuencias de 25 pb cadena arriba y abajo de cada exón. El
análisis GenomeMuSiC de todas las mutaciones (1.700 indeles de límite exón/intrón y 3.022 indeles exónicos) arrojó
una señal aún más fuerte para la reparación de DSB de ADN como la vía enriquecida principal (por ejemplo, P =
6,8E-07 para la vía "ATR/BRCA" en BioCarta y P = 3,0E-05 para la vía de "Punto de control de daño al ADN G2/M"
en Reactome). En general, cada tumor deficiente en MMR contenía una media de 3,0 ± 0,5 indeles en la vía de
25 reparación de DSB por HR (figura 6).
En un intento de replicar estos hallazgos, analizamos los datos del exoma de 27 tumores CCR MSI-H secuenciados
en el contexto de la red The Cancer Genome Atlas (TCGA, 2012). Aunque estos tumores se secuenciaron con una
profundidad de cobertura promedio de solo 20x, que es bastante baja para detectar indeles de forma fiable en
30 homopolímeros (Reumers et al., 2011), seleccionamos cada uno de los 1.426 indeles con desplazamiento de marco
(en 1.284 genes, sin incluir los genes MMR) que se notificaron para estos tumores, pero además también
seleccionaron 19 indeles identificados por TCGA basándonos en una evaluación separada de 29 homopolímeros
seleccionados mediante un enfoque de genes candidatos. Sorprendentemente, el análisis de IPA de los 1.303 genes
afectados con indeles confirmó que el "Papel de BRCA1 en la respuesta al daño al ADN" fue nuevamente la vía
35 enriquecida principal (P = 0,0148). Los genes mutados en esta vía incluyeron, entre varios otros, RAD50, ATR, BLM
y CHEK1 (7, 5, 2 y 1 mutaciones, respectivamente; figura 6).
40 Para investigar si la vía de reparación de DSB por HR está funcionalmente inactivada en tumores deficientes en
MMR, evaluamos la actividad de reparación de DSB en 8 cultivos de tumores primarios y líneas celulares
cancerosas deficientes en MMR y 4 competentes en MMR. El estado de MMR de estas células se analizó utilizando
el panel de 56 marcadores y se confirmó mediante el panel Bethesda.
45 Se establecieron nueve cultivos primarios de células tumorales endometriales y ovario de pacientes sometidas a
cirugía en la División de Oncología Ginecológica, Hospitales Universitarios de Gasthuisberg, Lovaina (Bélgica). Solo
después de dar su consentimiento informado, los pacientes se incluyeron en el estudio. Se utilizó el siguiente
protocolo para generar cultivos de tumores primarios. En primer lugar, se dispusieron muestras de tumores en medio
RPMI estéril suplementado con penicilina/estreptomicina (1000 U/ml) y fungizona (0,5 µg/ml) (todos de Life
50 Technologies) para su transporte desde la sala de cirugía al laboratorio de cultivo celular. Posteriormente, el tejido
tumoral se lavó con PBS suplementado con penicilina/estreptomicina y fungizona, y el tejido se trituró con cuchillas
estériles. El tejido tumoral se digirió con colagenasas tipo IV (1 mg/ml; Roche) en medio RPMI (Life Technologies)
suplementado con penicilina/estreptomicina y fungizona. También se añadió DNasa I (0,1 mg/ml; Roche) al medio
de digestión. La digestión se realizó con agitación durante 3 h a 37 ºC. A continuación, se preparó una suspensión
55 de células individuales mediante filtración a través de un filtro de 70 µm y se lisaron los glóbulos rojos usando una
solución de cloruro de amonio (Stem Cell Technologies). Finalmente, las células individuales se plaqueron en un
matraz de cultivo de 25 cm2 y el medio se cambió al día siguiente. Después de 1-3 semanas, cuando las células
alcanzaron una confluencia del 60-70%, se eliminaron los fibroblastos usando CD90 antihumano de ratón (Clon
AS02; Dianova) y selección negativa con Mouse Pan IgG Dynabeads (Life Technologies). Posteriormente, los
60 cultivos celulares se sometieron a pases a una confluencia del 70-90% y los cultivos celulares se almacenaron en un
banco de células en diferentes pases. La tabla 31 enumera los diversos cultivos de tumores primarios que se
generaron según este protocolo.
208
ES 2 906 023 T3
Los cultivos de células de tumores primarios se cultivaron en medio RPMI 1640 (Gibco) suplementado con suero
5 bovino fetal al 20%, L-glutamina 2 mM, 100 U/ml de penicilina, 100 µg/ml de estreptomicina, 1 µg/ml de fungizona y
10 µg/ml de gentamicina hasta 20 pases. Todos los cultivos celulares se realizaron en una atmósfera humidificada
que contenía CO2 al 5% a 37 ºC. También se supervisaron de forma rutinaria para detectar contaminación por
micoplasma y no se detectó crecimiento de micoplasma.
10 Se obtuvieron células HEC-1-A, MDA-MB-231 y MCF7, en todos los casos de las Colecciones de Cultivos Tipo
Estadounidenses (ATCC, Manassas, VA, Estados Unidos). Se cultivaron células HEC-1-A en medio 5A de McCoy
(Gibco-BRL, Life Technologies), células MDA-MB-231 y MCF7 en medio de Eagle modificado por Dulbecco (DMEM,
Gibco-BRL), todos complementados con suero bovino fetal al 10% (FBS, Gibco-BRL), L-glutamina 2 mM, 100 U/ml
de penicilina y 100 µg/ml de estreptomicina (todos de Life Technologies). Todas las células humanas se mantuvieron
15 en una atmósfera humidificada que contenía CO2 al 5% a 37 ºC. Las líneas celulares se enumeran en la tabla 32.
Tabla 32
Línea celular Tipo Subtipo Estado BRCA Mutaciones en genes MMR Estado de MMR
Mutación sin sentido en PMS2,
1 HEC-1-A Endometrio Endometrioide WT BRCA1/2 Mutación del sitio de empalme Deficiente
en MSH6
2 MDA-MB-231 Mama TNBC WT BRCA1/2 - Competente
3 MCF7 Mama ER+ PR+ WT BRCA1/2 - Competente
20 Resumen
Habiendo establecido que los tumores deficientes en MMR están enriquecidos en mutaciones de pérdida de función
que afectan a la vía de reparación de DSB por HR, investigamos si esta vía también está funcionalmente inactivada.
Esto es relevante ya que estas mutaciones representan indeles heterocigóticos, cuyos efectos de pérdida de función
25 pueden compensarse por medio del alelo no afectado. Dado que durante la replicación del ADN, las roturas de una
sola hebra (SSB) se convierten en DSB, lo que activa la reparación de DSB por HR, expusimos 8 tumores
deficientes en MMR y 4 tumores competentes en MMR (9 cultivos de tumores primarios y 3 líneas de células
cancerosas) al inhibidor de PARP olaparib, que inhibe la reparación de SSB, y posteriormente se cuantificó el
número relativo de células con focos positivos para γH2AX y RAD51 como una medida del daño al ADN y HR activa,
30 respectivamente. Dado que ninguno de los tumores se sometió a secuenciación del exoma, lo que representa un
conjunto independiente de tumores deficientes en MMR, el estado de MMR se determinó utilizando nuestro panel de
56 marcadores y se confirmó utilizando el panel Bethesda. Aunque no observamos ninguna diferencia en la
formación de focos RAD51 entre cultivos tumorales deficientes MMR y competentes en MMR en ausencia de
olaparib (10 ± 2% de células frente al 13 ± 2% mostraron formación de focos de RAD51, P = 0,74; figura 7a,b), la
35 exposición a olaparib 10 µM desencadenó significativamente menos formación de focos de RAD51 en células
deficientes en MMR que en células competentes en MMR (19 ± 3% frente al 37 ± 4%; P = 0,02; figura 7a,b). Por el
contrario, al investigar el grado de daño al ADN no reparado por inmunofluorescencia H2AX, el olaparib aumentó
drásticamente el número de focos de γH2AX en todas las células independientemente de su estado de MMR (no se
muestra), lo que indica que la extensión del daño al ADN fue similar entre ambos cultivos. Dado que en las células
40 deficientes en BRCA1 o BRCA2, la formación de focos de RAD51 está completamente ausente tras la inhibición de
PARP (Farmer et al., 2005), estos datos sugieren que en las células deficientes en MMR, la vía de reparación de
DSB por HR solo se inactiva parcialmente.
209
ES 2 906 023 T3
Dado que los tumores deficientes en MMR se caracterizan por una actividad reducida de la vía de reparación de
DSB por HR, planteamos la hipótesis de que estos tumores, similares a los tumores deficientes en BRCA1 (Farmer
5 et al., 2005), pueden ser dirigidos selectivamente por inhibición de PARP. Los 8 cultivos deficientes en MMR y los 4
cultivos competentes en MMR se expusieron todos de forma dependiente de la dosis (1, 3 y 10 µM) a olaparib y se
evaluaron los efectos sobre la proliferación. Los cultivos individuales deficientes en MMR, incluidos cada uno de los
6 cultivos de tumores primarios deficientes en MMR, mostraron una disminución de la proliferación dependiente de la
dosis tras la exposición a olaparib, mientras que ninguna de las células competentes en MMR se caracterizó por una
10 respuesta similar. En promedio, 1, 3 y 10 µM de olaparib redujeron la proliferación de células deficientes en MMR en
el 15%, 20% y 42% respectivamente (P = 0,02, P < 0,001 y P < 0,001, respectivamente frente a células no tratadas;
figura 7c), mientras que no se observó ningún efecto en los tumores competentes en MMR a las 48 horas (P = NS
para todas las concentraciones de olaparib; figura 7d). En general, la proliferación también difirió significativamente
entre tumores deficientes y competentes en MMR (P < 0,001 mediante medición repetida). Dado que las células
15 deficientes en BRCA1 y BRCA2 expuestas a, respectivamente, 3 µM y 10 µM de olaparib, se caracterizan por una
disminución del 78% y del 91% en la viabilidad (Farmer et al., 2005; Patel et al., 2012), estos datos "ex vivo"
confirman que las células deficientes en MMR, de forma coherente con su inactivación parcial de la la vía de
reparación de DSB por HR, se sensibilizan por inhibición de PARP.
Se utilizó el sistema analizador de células en tiempo real (RTCA) xCELLigence (Roche Applied Science, Mannheim,
Alemania) para supervisar de forma dinámica las tasas de proliferación celular. El sistema mide la impedancia
eléctrica a través de microelectrodos en la parte inferior de las placas E de cultivo de tejidos. La medición de la
25 impedancia proporciona información cuantitativa sobre el número de células, su viabilidad, su morfología y su
adhesión. Se sembraron 5.000 células/pocillo en la placa E 16 (Roche) en 200 µl de medio. Las células se trataron
con olaparib 24 h después de la siembra hasta la concentración final deseada (1, 3, 10 µM de olaparib). El
porcentaje final de DMSO en todos los pocillos fue del 0,1%. Cada condición de tratamiento se midió por triplicado.
Los valores del índice de células dinámicas se supervisaron en intervalos de 5 minutos durante 48 h después de los
30 tratamientos. Los valores del índice de células se normalizaron con respecto al control tratado con vehículo para
cada célula. La figura siguiente muestra las tasas de proliferación celular para cada uno de los cultivos celulares (las
células deficientes en MMR se muestran en azul y las células competentes en MMR se muestran en rojo). En
resumen, las células deficientes en MMR se caracterizaron por una disminución de la proliferación dependiente de la
dosis, mientras que las células competentes en MMR no respondieron a olaparib (P = 2,0E-7 mediante medición
35 repetida; figuras 7c y e).
Discusión
A este respecto, secuenciamos el primer genoma completo de un tumor deficiente en MMR. Observamos que la
40 mayor parte de las sustituciones somáticas consistían en transiciones de nucleótidos y que los nucleótidos
adyacentes tenían un importante efecto dependiente del contexto sobre la determinación de qué nucleótidos estaban
afectados. Sorprendentemente, estos patrones de sustitución también se observaron en el ADN de línea germinal y
otros organismos eucariotas, y en estos genomas se correlacionaron con características importantes del genoma de
forma similar (Hodgkinson y Eyre-Walker, 2011). En particular, observamos un mayor número de sustituciones en las
45 secuencias de CpG metiladas, lo que involucra a la maquinaria de MMR en la reparación de la desaminación de
citosina metilada y demuestra que la MMR no canónica es fundamental para mantener la integridad genómica.
Además, la desaminación es uno de los procesos más importantes que subyacen a las mutaciones asociadas a
enfermedades humanas y la evolución. Desde esa perspectiva, es interesante notar que observamos una firma muy
50 similar en 10 exomas adicionales de tumores deficientes en MMR, en sustituciones de novo de la línea germinal y en
bases de datos SNP humanas y de ratón. En general, estas observaciones indican que, de forma similar a las
poblaciones bacterianas (Saint-Ruf y Matic, 2006), la reparación incompleta de errores de apareamiento en seres
humanos contribuye a la selección natural a través de la adaptación genética.
55 Aproximadamente la mitad de las mutaciones en el hipermutador representaban indeles. Es importante señalar que,
aunque en indeles de secuenciación de alto rendimiento la detección se carga con tasas muy altas de falsos
positivos, validamos el 92,7% de los indeles utilizando tecnologías ortogonales. La mayor parte de los indeles
afectan específicamente a tramos de homopolímeros. Esto es relevante porque el panel Bethesda ampliado, que se
utiliza actualmente para la clasificación diagnóstica de MSI, tiene únicamente una sensibilidad limitada (80%, 84% y
60 55% para tumores deficientes en MLH1, MSH2 y MSH6 (de la Chapelle y Hampel, 2010)), presumiblemente porque
consiste en 8 marcadores de microsatélites y solo 2 de homopolímeros. Nuestro panel de 56 marcadores de
mutaciones de punto caliente identificadas por secuenciación del exoma fue más sensible para detectar MSI,
especialmente en tumores EM, que se sabe que son más frecuentemente deficientes en MSH6 que en MLH1 o
MSH2. Además, dado que 45 de 56 marcadores se ubicaron en las UTR, que tienen menos probabilidades de
65 impulsar la selección clonal, pudimos detectar MSI-H en cánceres que afectan a diferentes tejidos. Finalmente, dado
que la mayor parte de los 56 marcadores se ubicaron en homopolímeros de ≤ 10 pb de longitud, estos marcadores
210
ES 2 906 023 T3
son compatibles con varias tecnologías de genotipado de bajo a alto rendimiento, tales como la extensión de un solo
par de bases (Sequenom MassArray), tecnologías de hibridación específica de alelos (TaqMan) y análisis de curvas
de fusión (incluido HRM). Los marcadores más sensibles en Bethesda (BAT25 y BAT26) son claramente menos
compatibles, ya que detectan indeles en homopolímeros de 25 y 26 pb.
5
Curiosamente, observamos que varios indeles en el exoma, todos los cuales representaban mutaciones de pérdida
de función, se producían como mutaciones de punto caliente. En promedio, cada tumor contenía 30 mutaciones de
punto caliente, lo que es significativamente alto en comparación con los intentos previos de secuenciación del
cáncer de tumores competentes en MMR (Nik-Zainal et al., 2012; Rausch et al., 2012). Los análisis de vías revelaron
10 además que la vía de reparación de DSB por HR estaba enriquecida en mutaciones; en promedio 3 mutaciones
afectaron a esta vía en cada tumor. Anteriormente se había informado de mutaciones en genes de reparación de
DSB, tales como MRE11A o RAD50, pero estos estudios se centraron en mutaciones específicas en genes
individuales más que en vías, y por este motivo solo pudieron establecer que una fracción de los tumores deficientes
en MMR está mutada en uno de estos genes (Miquel et al., 2007). Además, aunque está bien establecido que las
15 células deficientes en BRCA1 y BRCA2, así como las células deficientes en genes relacionados con la anemia de
Fanconi u otros genes relacionados con HR, son selectivamente hipersensibles a los inhibidores de PARP (Murai et
al., 2012), los datos que demuestran la selectividad de líneas celulares deficientes en MMR a la inhibición de PARP
no han sido concluyentes. El estudio más prometedor, hasta la fecha, observó una correlación débil pero significativa
entre los niveles de expresión de MRE11 y la citotoxicidad al inhibidor de PARP ABT-888, pero el posterior
20 silenciamiento de MRE11 en una línea celular MSS solo modificó modestamente la proliferación a altas
concentraciones del inhibidor (Vilar et al., 2011). Por el contrario, nuestro descubrimiento libre de hipótesis de que la
reparación de DSB por HR es la vía principal afectada por mutaciones de pérdida de función en tumores EM y CCR
deficientes en MMR, tanto en nuestro propio conjunto de datos como en el conjunto de datos públicos de TCGA,
sugiere que las mutaciones en varios genes en la vía cooperan para inactivar la reparación de DSB por HR en
25 tumores deficientes en MMR. El hallazgo de que cada cultivo de tumor primario deficiente en MMR, también aquellos
sin mutaciones MRE11, mostraba un efecto de respuesta a la dosis tras la exposición con olaparib, confirma
funcionalmente el efecto acumulado de estas mutaciones heterocigóticas.
Se han desarrollado varios inhibidores de PARP, tales como olaparib (AZD2281), veliparib (ABT-888) y niraparib
30 (MK-4827). Los estudios iniciales con estos inhibidores revelaron un beneficio clínico significativo en pacientes con
cáncer de mama o de ovario portadoras de mutaciones BRCA1 y BRCA2, sin causar toxicidad excesiva (Tutt et al.,
2010). A pesar de estos resultados alentadores, los inhibidores de PARP aún no se han aprobado (Maxwell y
Domchek, 2012). Uno de los principales obstáculos es la falta de una prueba diagnóstica aprobada por la FDA que
sea rentable. Las pruebas diagnósticas para analizar las mutaciones BRCA1 y BRCA2 no están aprobadas por la
35 FDA y los costes asociados son excesivamente altos. Como resultado, las compañías farmacéuticas han dudado en
iniciar estudios clínicos de fase 3 con inhibidores de PARP (Maxwell y Domchek, 2012). Nuestras observaciones de
que los tumores deficientes en MMR son sensibles a la inhibición de PARP son muy interesantes a este respecto.
En primer lugar, nuestro estudio identifica un segundo subgrupo de tumores que podrían ser sensibles a la inhibición
de PARP. Aunque se puede percibir que los tumores MSI representan solo una pequeña proporción de los tumores
40 CCR y EM, la población absoluta de pacientes con tumores MSI que podría beneficiarse es tan grande, si no mayor,
que la de las mutaciones BRCA1 o BRCA2 o incluso otros agentes dirigidos. En segundo lugar, las pruebas
diagnósticas complementarias para los tumores MSI ya están disponibles, ya sea utilizando procedimientos
tradicionales, como el panel Bethesda, o mediante el perfilado de mutaciones de punto caliente frecuentes. Por lo
tanto, la traducción de nuestras observaciones al entorno clínico podría ser más rápida que para los portadores de
45 mutaciones BRCA1 o BRCA2, y podría acelerarse aún más a través de nuestro panel de marcadores más sensible y
automatizable/escalable. En tercer lugar, existe una gran necesidad clínica de opciones de tratamiento dirigidas en
los tumores MSI. En particular, aunque los tumores de CCR en estadio II o III con MSI se caracterizan por un
pronóstico moderadamente mejorado, los tumores de MSI en el entorno avanzado se asocian con más metástasis
peritoneales y una peor supervivencia general independientemente del régimen de quimioterapia (Smith et al.,
50 2013).
Además, mientras que la resistencia clínica a la inhibición de PARP se ha atribuido a mutaciones secundarias que
restauran las proteínas BRCA1 o 2 de longitud completa, restableciendo así su función en las células tumorales
(Barber et al., 2012), es menos probable que se produzca este mecanismo para cada uno de los genes de
55 reparación de DSB afectados por mutaciones somáticas. Esto sugiere que es menos probable que los tumores
deficientes en MMR desarrollen resistencia contra los inhibidores de PARP, lo que los vuelve terapéuticamente más
valiosos a largo plazo.
Materiales y procedimientos
60
Detección de deficiencia de reparación de errores de apareamiento: para evaluar la expresión de MLH1, MSH2 y
MSH6 en muestras tumorales y de línea germinal correspondiente, se realizó una inmunohistoquímica utilizando los
anticuerpos monoclonales siguientes: clon ES05 para MLH1 (DAKO), clon G219-1129 para MSH2 (BD Pharmagen)
y clon EP49 para MSH6 (Epitomics). El estado de hipermetilación de las regiones promotoras de MLH1 se determinó
65 utilizando el kit SALSA MS-MLPA KIT (MRC-Holland). El estado de MSI se detectó mediante el panel Bethesda
ampliado. Selección y preparación de la muestra: seleccionamos 14 pares tumor-normal endometriales, 3
211
ES 2 906 023 T3
colorrectales y 3 de ovario para la secuenciación. El ADN tumoral se obtuvo a partir de tejido tumoral recién
congelado. Todas las muestras representaron tumores primarios no tratados previamente con quimioterapia. El ADN
normal correspondiente para estas 20 muestras se extrajo de glóbulos blancos periféricos. Se obtuvo un
consentimiento informado de todos los pacientes. Además, se secuenciaron 4 líneas celulares comerciales de
5 leucemia linfoblástica aguda de células T (DND41, CCRF-CEM, SUPT1 y RPMI-8402, obtenidas de DSMZ,
http://www.dsmz.de/). El ADN se extrajo utilizando el kit Qiagen DNAeasy para todas las muestras.
Secuenciación del genoma completo: se seleccionaron 5 pares tumor-normal, incluidos 3 pares EM y 2 pares de
ovario para la secuenciación del genoma completo. La secuenciación de extremos emparejados se realizó utilizando
10 el servicio Complete Genomics®, que incluye análisis de datos primarios (análisis de imágenes, llamadas de bases,
alineamiento y llamadas de variantes). Se utilizó el procedimiento calldiff de CGAtools
(http://cgatools.sourceforge.net) para seleccionar mutaciones somáticas. Para cada mutación somática, CGAtools
comunica una puntuación somática, lo que refleja la confianza de la mutación somática llamada. Las puntuaciones
más altas indican una mayor confianza. Utilizando los datos de validación generados por Sequenom MassARRAY,
15 determinamos el punto de corte óptimo para seleccionar mutaciones somáticas verdaderas y eliminar errores de
secuenciación de falsos positivos. Se aplicaron puntos de corte de puntuación somática a todas las listas de
mutaciones somáticas y para análisis posteriores solo se utilizaron las mutaciones con una puntuación superior a
estos umbrales.
20 Secuenciación del exoma de tumores deficientes en MMR: se capturaron exomas de 15 pares tumor-normal
endometriales, colorrectal y ovario utilizando el kit de enriquecimiento de exomas TruSeq (Illumina). La
secuenciación de extremos emparejados se realizó con los kits TruSeq SBS en el HiSeq2000 (2 x 75 pb para
muestras de ovario y EM, 2 x 100 pb para muestras de CCR). Se capturaron exomas de 4 genomas de leucemia
utilizando la biblioteca de exomas humanos Nimblegen SeqCap EZ v2.0. La secuenciación de Pairedend (2 x 50 pb)
25 se realizó con los kits TruSeq SBS en el HiSeq2000. Para todos los exomas, se usó BWA para alinear las lecturas
sin procesar de cada carril de secuenciación con el genoma de referencia humano usando parámetros
predeterminados. Las lecturas alineadas se procesaron y clasificaron con SAMtools (v.0.1.13) y los duplicados de
PCR se eliminaron con Picard MarkDuplicates. La recalibración de bases, el realineamiento local alrededor de
indeles y la llamada de variantes de un solo nucleótido se realizaron utilizando el kit GenomeAnalysisToolKit
30 (McKenna et al., 2010) (GATK v1.0.4487). Las sustituciones se llamaron usando el genotipador unificado GATK,
mientras que los indeles se detectaron usando Dindel (Albers et al., 2011) (v1.01). El filtrado de calidad inicial en las
sustituciones se realizó en función de la puntuación de calidad proporcionada por el llamador de variantes GATK.
Las mutaciones se retuvieron solo si la puntuación de calidad era superior a Q30 en el tumor y la muestra normal
correspondiente.
35
Anotación de datos del genoma completo y del exoma completo: los datos de la secuencia del genoma completo se
anotaron utilizando ANNOVAR y la pista de anotación UCSC RefGene hg18 (Wang et al., 2010). Las regiones de
repetición se determinaron usando "grepseq" (http://code.google.com/p/grepseq/). Los microsatélites se definieron
como repeticiones di-, tri-, tetra-, penta- y hexanucleotídicas que consisten en al menos dos unidades de repetición y
40 con una longitud mínima de 6 bases, homopolímeros como repeticiones mononucleotídicas con una longitud mínima
de 6 bases, homopolímeros cortos como repeticiones mononucleotídicas de 3, 4 o 5 bases de largo. La anotación de
las regiones de repetición se realizó mediante el comando intersectBed de BEDtools.
Disponibilidad de datos del exoma y del genoma completo: los archivos de variantes sin filtrar de todos los datos del
45 exoma y del genoma completo se han depositado en el Archivo Europeo de Genotipos y Fenotipos
(http://www.ebi.ac.uk/ega) con acceso restringido, con número de acceso EGAS00001000182 y EGAS00001000158.
Cultivos de tumores primarios e inmunofluorescencia: se establecieron nueve cultivos de células tumorales primarias
de endometrio y ovario a partir de tumores de las pacientes sometidas a cirugía. Se cultivaron cultivos de células
50 tumorales primarias en medio RPMI1640 (GIBCO) suplementado con FBS al 20%, L-glutamina 2 mM, penicilina 100
U/ml, estreptomicina 100 µg/ml, fungizona 1 µg/ml y gentamicina 10 µg/ml hasta 20 pases. Se sembraron 25.000
células/pocillo en portaobjetos de 8 pocillos (Nunc) en 400 µl de medio y se cultivaron durante 24 h. Después de la
exposición a olaparib 0 o 10 µM, los portaobjetos se enjuagaron en PBS, se fijaron en paraformaldehído a 37 ºC, se
permeabilizaron con Triton X-100 al 0,1% y se bloquearon con BSA. Las células se tiñeron con anticuerpo
55 monoclonal anti-fosfo-Histona H2A.X de ratón (Millipore clon JBW301, 1:100) o anticuerpo policlonal anti-Rad51 (H-
92) de conejo (Santa Cruz H-92, 1:1000) y se lavaron en Triton X-100 al 0,1% en PBS. Se utilizó Alexa Fluor 488
(Invitrogen) y los portaobjetos se montaron en el reactivo Prolong Gold Antifade que contenía DAPI (Molecular
Probes). El porcentaje de focos de células positivas (> 5 focos por núcleo) se determinó en un microscopio confocal
invertido Zeiss LSM 510 utilizando un objetivo de inmersión en aceite Plan-Neofluar 40x/1,3. Para cada experimento,
60 se analizaron al menos 100 núcleos.
Proliferación celular: se utilizó el analizador de células en tiempo real (RTCA) xCELLigence System (Roche) para
controlar dinámicamente las tasas de proliferación celular. Se sembraron 5.000 células/pocillo en la placa E 16
(Roche) en 200 µl de medio. Se disolvió olaparib (AZD-2281, JS Research Chemicals Trading) en DMSO. 24 h
65 después de la siembra, las células se trataron con olaparib (olaparib 1, 3, 10 µM). Cada condición se midió por
212
ES 2 906 023 T3
triplicado y todos los experimentos se realizaron por duplicado en diferentes puntos temporales. Los valores del
índice de células dinámicas se supervisaron durante 48 h después del tratamiento.
Materiales
5
El anticuerpo monoclonal anti-fosfo-Histona H2A.X (Ser139) de ratón (clon JBW301) era de Millipore Corporation,
Billerica, MA, Estados Unidos. El anticuerpo policlonal anti-Rad51 de conejo (H-92) era de Santa Cruz
Biotechnology, Santa Cruz, CA, Estados Unidos. El olaparib (AZD-2281, lote 3-8/10) se adquirió de JS Research
Chemicals Trading, Schleswig Holstein, Alemania y se preparó como solución madre en DMSO y se almacenaron 10
10 partes alícuotas a -20 ºC hasta su uso. El olaparib se diluyó adicionalmente 1:50 en los medios respectivos antes de
diluirlo 1:20 en el pocillo de la placa.
Inmunotinción de γH2AX
15 El grado de daño al ADN no reparado tras el tratamiento con olaparib se midió con inmunofluorescencia γH2AX.
Cuando hay una rotura de doble hebra en el ADN, H2AX se fosforila en serina 139 y se denomina γH2AX. Para la
inmunotinción de γH2AX, se sembraron 25.000 células/pocillo en portaobjetos de Lab-tek Permanox Chamber de 8
pocillos (Nunc) en 400 µl de medio y se incubaron durante 24 h a 37 ºC, 5% de CO2. Posteriormente, después de 24
h de incubación, las células se expusieron a olaparib 0 o 10 µM, los portaobjetos se enjuagaron en solución salina
20 tamponada con fosfato (PBS) y se fijaron en paraformaldehído al 4% durante 10 minutos a 37 ºC, se permeabilizaron
con Triton X-100 al 0,1% durante 5 minutos y se bloquearon con albúmina de suero bovino (BSA) al 5% durante 10
minutos, ambos a temperatura ambiente. Las células se tiñeron con una dilución 1:100 de anticuerpo monoclonal
anti-fosfo-Histona H2A.X (Ser139) de ratón (clon JBW301, Millipore). El anticuerpo primario se visualizó con IgG de
cabra anti-ratón Alexa Fluor-488 (Alexa) y se montó en el reactivo Prolong Gold Antifade con DAPI (Molecular
25 Probes). El tratamiento con olaparib 10 µM aumentó el número de focos de γH2AX 4-6 veces en comparación con el
valor inicial en todas las células independientemente de su estado de MMR, lo que indica que la medida del daño al
ADN de DSB fue similar entre ambos cultivos.
Inmunotinción de Rad51
30
La proteína RAD51 desempeña un papel importante en la vía de reparación de DSB por HR y la formación de focos
positivos a RAD51 se utiliza como marcador de la reparación de DSB por HR en curso. Para realizar la
inmunotinción RAD51, se sembraron 25.000 células/pocillo en portaobjetos Lab-tek Permanox Chamber de 8
pocillos (Nunc) en 400 µl de medio y se incubaron durante 24 h a 37 ºC, 5% de CO2 hasta el tratamiento con
35 olaparib. Después de 24 h de incubación tras la exposición a olaparib 0 o 10 µM, las células se lavaron con PBS a
temperatura ambiente y se fijaron en paraformaldehído al 3% con Triton X-100 al 0,1% en PBS durante 20 minutos a
37 ºC. Los portaobjetos se incubaron con una dilución 1:1000 de anticuerpo policlonal anti-Rad51 de conejo (H-92)
(Santa Cruz) durante 16 horas a 4 ºC, después se lavaron cuatro veces durante 15 minutos con Triton X-100 al 0,1%
en PBS. El anticuerpo primario se visualizó con IgG de cabra anti-ratón Alexa Fluor-488 (Alexa) y se montó en el
40 reactivo Prolong Gold Antifade con DAPI (Molecular Probes).
Microscopia confocal
Los focos de γH2AX y RAD51 se visualizaron con microscopio confocal invertido Zeiss LSM 510 utilizando un
45 objetivo de inmersión en aceite Plan-Neofluar 40x/1.3 y longitudes de onda de excitación de 488 y 750 nm (láser de
dos fotones coherente Chameleon). Mediante proyección máxima de enfoque, se adquirieron imágenes de
secciones ópticas separadas 1,20 µm y con un espesor de sección de 0,5 µm. Las imágenes se procesaron
utilizando el programa informático LSM510. Los núcleos con > 5 focos se puntuaron como positivos y se contaron al
menos 100 núcleos por cultivo y por condición.
50
Referencias
1. Stratton, M. R., Campbell, P. J. y Futreal, P. A. The cancer genome. Nature 458, 719-724 (2009).
2. Futreal, P. A. et al. A census of human cancer genes. Nat Rev Cancer 4, 177-183 (2004).
3. Loeb, L. A., Loeb, K. R. y Anderson, J. P. Multiple mutations and cancer. Proc Natl Acad Sci U S A 100, 776-781
(2003).
4. Loeb, L. A., Springgate, C. F. y Battula, N. Errors in DNA replication as a basis of malignant changes. Cancer Res
34, 2311-2321 (1974).
5. Loeb, L. A. Human cancers express mutator phenotypes: origin, consequences and targeting. Nat Rev Cancer 11,
450-457 (2011).
213
ES 2 906 023 T3
6. Poulogiannis, G., Frayling, I. M. y Arends, M. J. DNA mismatch repair deficiency in sporadic colorectal cancer and
Lynch syndrome. Histopathology 56, 167-179 (2010).
7. Beckman, R. A. y Loeb, L. A. Negative clonal selection in tumor evolution. Genetics 171, 2123-2131 (2005).
8. Jones, S. et al. Frequent mutations of chromatin remodeling gene ARID1A in ovarian clear cell carcinoma. Science
330, 228-231 (2010).
9. Boland CR, Thibodeau SN, Hamilton SR, et al: A National Cancer Institute Workshop on Microsatellite Instability
for cancer detection and familial predisposition: Development of international criteria for the determination of
microsatellite instability in colorectal cancer. Cancer Res 58:5248-5257, 1998.
10. Palomaki GE, McClain MR, Melillo S, et al: EGAPP supplementary evidence review: DNA testing strategies
aimed at reducing morbidity and mortality from Lynch syndrome. Genetics in Medicine 11:42-65, 2009.
11. Popat S, Hubner R, Houlston RS: Systematic review of microsatellite instability and colorectal cancer prognosis. J
Clinl Oncol 23:609-617, 2005.
12. Ribic CM, Sargent DJ, Moore MJ, et al: Tumor microsatellite-instability status as a predictor of benefit from
Fluorouracil-based adjuvant chemotherapy for colon cancer. N Engl J Med 349:247-257, 2003.
13. Des Guetz G, Schischmanoff O, Nocalas P, et al: Does microsatellite instability predict the efficacy of adjuvant
chemotherapy in colorectal cancer? A systematic review with meta-analysis. Euro J Cancer 45:1890-1896, 2009.
14. Dietmaier, W. et al. Diagnostic microsatellite instability: definition and correlation with mismatch repair protein
expression. Cancer Res 57, 4749-4756 (1997).
15. Umar, A. et al. Revised Bethesda Guidelines for hereditary nonpolyposis colorectal cancer (Lynch syndrome) and
microsatellite instability. J Natl Cancer Inst 96, 261-268 (2004).
16. de la Chapelle, A. y Hampel, H. Clinical relevance of microsatellite instability in colorectal cancer. J Clin Oncol 28,
3380-3387 (2010).
17. Pyatt R, Chadwick RB, Johnson CK, et al: Polymorphic variation at the BAT-25 and BAT-26 loci in individuals of
African origin: Implications for microsatellite instability testing. Am J Pathol 155:349-353, 1999.
18. Lindor, N. M. et al. Immunohistochemistry versus microsatellite instability testing in phenotyping colorectal
tumors. J Clin Oncol 20, 1043-1048 (2002).
19. Simpkins, S. B. et al. MLH1 promoter methylation and gene silencing is the primary cause of microsatellite
instability in sporadic endometrial cancers. Hum Mol Genet 8, 661-666 (1999).
20. Herman, J. G. et al. Incidence and functional consequences of hMLH1 promoter hypermethylation in colorectal
carcinoma. Proc Natl Acad Sci U S A 95, 6870-6875 (1998).
21. Quinlan, A. R. y Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics
26, 841-842 (2010).
22. Banerjea, A. et al. Colorectal cancers with microsatellite instability display mRNA expression signatures
characteristic of increased immunogenicity. Mol Cancer 3, 21 (2004).
23. Kapushesky, M. et al. Gene expression atlas at the European bioinformatics institute. Nucleic Acids Res 38,
D690-698 (2010).
24. Pinol, V. et al. Accuracy of revised Bethesda guidelines, microsatellite instability, and immunohistochemistry for
the identification of patients with hereditary nonpolyposis colorectal cancer. JAMA 293, 1986-1994 (2005).
25. Hewish, M., Lord, C. J., Martin, S. A., Cunningham, D. y Ashworth, A. Mismatch repair deficient colorectal cancer
in the era of personalized treatment. Nat Rev Clin Oncol 7, 197-208 (2010).
26. Heijink, D. M. et al. Perspectives for tailored chemoprevention and treatment of colorectal cancer in Lynch
syndrome. Crit Rev Oncol Hematol (2010).
27. Plaschke, J. et al. Aberrant protein expression and frequent allelic loss of MSH3 in colorectal cancer with low-
level microsatellite instability. Int J Colorectal Dis 27:911-919 (2012).
214
ES 2 906 023 T3
REIVINDICACIONES
1. Un procedimiento para diagnosticar el estado de MSI de un tumor, que comprende determinar la presencia de un
indel en al menos dos regiones homopoliméricas en una muestra del ADN del tumor, en el que las, al menos dos,
5 regiones homopoliméricas son
- al menos dos regiones homopoliméricas presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en
la tabla 1, o
10 - al menos tres regiones homopoliméricas seleccionadas de las presentes en los exones de los genes
enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1,
en el que dichas regiones homopoliméricas son regiones de microsatélites que son repeticiones mononucleotídicas
de al menos 6 nucleótidos y que no exceden de 20 nucleótidos, y en el que la presencia de un indel en el 2% o más
15 de las regiones homopoliméricas es indicativa de MSI.
2. El procedimiento según la reivindicación 1, en el que una de las regiones homopoliméricas se selecciona de las
regiones homopoliméricas de los genes MYL1, DIDO1, UBE2Z, RYR3, TMEM65, BTBD7, KDM5A, ABAT, PPM1A,
UBA6, ZNF185, ARL10, GRIA2 y TMC7 enumerados en la tabla 3.
20
3. El procedimiento según la reivindicación 1, en el que una de las regiones homopoliméricas se selecciona de las
regiones homopoliméricas de los genes MYL1, DIDO1, UBE2Z, RYR3, TMEM65, BTBD7, KDM5A, ABAT, PPM1A,
UBA6 y ZNF185 enumerados en la tabla 3.
5. El procedimiento según la reivindicación 1, en el que al menos una región homopolimérica presente en la región 3'
30 UTR se selecciona de las regiones homopoliméricas presentes en los genes WIPF2, NARG2, AHCYL1, C17orf63,
CD5L, CEP170, COL5A2, CSNK1G3, DIDO1, EIF4G3, GSK3B, KCNMB4, MAPK1IP1L, NPR3, PI15, PRTG,
RASGRP1, SH3KBP1, SHROOM3, SLC5A3, UBE2Z, ZBTB33, ZNF275, AGPAT3, APH1B, BCL11A, BMPR1B,
CALN1, CASK, CBFB, CBX5, CCDC85C, CNOT7, CYP1B1, DRAM2, EDA2R, EDEM3, EGR1, EIF4G3, FAM20B,
FCHSD2, FLT1, FMO2, G3BP2, HELZ, HRNR, IER3IP1, KCNG1, KCNK1, KLF3, LHX9, LRRC8D, LYRM1, MED13,
35 MYO5B, NCEH1, PPP1R12A, PPP1R3D, RAB11FIP1, RAB6C, SAMD12, SEMA6A, SLAIN2, SMAD4, TMED7,
TMEM57, TMEM65, TNPO1, TOR1AIP2, TRAK2, TRIP11, UST, VEGFA, ZBTB7A, ZKSCAN1, ZNF12, y ZNF169
enumerados en la tabla 1 o la tabla 6; y/o en el que al menos una región homopolimérica presente en la región
exónica se selecciona de las regiones homopoliméricas presentes en los genes SETD1B, RBMXL1, CCDC150,
OR7E24, C15orf40, KIAA2018, LTN1, SLC22A9, CDH26, DDX27, EXOSC9, FAM111B, KIAA0182, KIAA1919,
40 MIS18BP1, PRRT2, TMEM60, AQP7, ARV1, CCDC168, ELAVL3, F8, FETUB, HPS1, NBEAL1, P4HTM, PIGB,
RBM43, RG9MTD1, SRPR, TMEM97, SEC31A, RNF145, RNPC3, SLC35F5, TMBIM4, CD3G, DOCK3, MYO10
enumerados en la tabla 2 o la tabla 7.
6. El procedimiento según una cualquiera de las reivindicaciones 1 o 5, en el que las, al menos dos, regiones
45 homopoliméricas son al menos dos regiones homopoliméricas seleccionadas de las presentes en las regiones 5'
UTR o 3' UTR de los genes enumerados en la tabla 1 y al menos dos regiones homopoliméricas seleccionados de
las presentes en los exones de los genes enumerados en la tabla 2.
7. El procedimiento según una cualquiera de las reivindicaciones 1 a 6, en el que las, al menos dos, regiones
50 homopoliméricas se seleccionan de las 56 regiones homopoliméricas que se muestran en la tabla 3.
8. El procedimiento según una cualquiera de las reivindicaciones 1 o 7, en el que las, al menos dos, regiones
homopoliméricas son al menos ocho regiones homopoliméricas.
55 9. El procedimiento según una cualquiera de las reivindicaciones 1 a 8, en el que la MSI se caracteriza además de la
forma siguiente: si el 17% o más de las regiones homopoliméricas contienen un indel, el tumor tiene una MSI alta, si
entre el 2% y el 17% de las regiones homopoliméricas contienen un indel, el tumor tiene una MSI baja y, si menos
del 2% de las regiones homopoliméricas contienen un indel, el tumor es estable en microsatélites.
60 10. El procedimiento según una cualquiera de las reivindicaciones 1 a 8, en el que la MSI se caracteriza además de
la forma siguiente: si el 20% o más de las regiones homopoliméricas contienen un indel, el tumor tiene una MSI alta,
si entre el 2,5% y el 20% de las regiones homopoliméricas contienen un indel, el tumor tiene una MSI baja y, si
menos del 2,5% de las regiones homopoliméricas contienen un indel, el tumor es estable en microsatélites.
215
ES 2 906 023 T3
11. El procedimiento según una cualquiera de las reivindicaciones 1 a 10, en el que la longitud de los
homopolímeros no excede de 15 nucleótidos, no excede de 14 nucleótidos, no excede de 13 nucleótidos, no excede
de 12 nucleótidos o no excede de 11 nucleótidos.
5 12. El procedimiento según una cualquiera de las reivindicaciones 1 a 9, en el que los homopolímeros tienen una
longitud de al menos 6 nucleótidos, de al menos 7 nucleótidos, de al menos 8 nucleótidos, de al menos 9 nucleótidos
o de al menos 10 nucleótidos.
13. El procedimiento según una cualquiera de las reivindicaciones 1 a 10, en el que los homopolímeros tienen una
10 longitud de 7 a 12 nucleótidos, de 7 a 11 nucleótidos o de 8 a 11 nucleótidos.
14. El procedimiento según cualquiera de las reivindicaciones 1 a 10, en el que la longitud de al menos uno de los
homopolímeros se encuentra entre 7 y 15 nucleótidos, se encuentra entre 8 y 15 nucleótidos, se encuentra entre 8 y
14 nucleótidos, se encuentra entre 8 y 13 nucleótidos, se encuentra entre 9 y 13 nucleótidos, se encuentra entre 10
15 y 13 nucleótidos, se encuentra entre 8 y 12 nucleótidos, se encuentra entre 9 y 12 nucleótidos, se encuentra entre 8
y 11 nucleótidos, se encuentra entre 9 y 11 nucleótidos o se encuentra entre 10 y 15 nucleótidos.
15. El procedimiento según una cualquiera de las reivindicaciones 1 a 14, que comprende además una etapa de
determinación del estado de uno o más marcadores del panel de marcadores Bethesda ampliado.
20
16. El procedimiento según una cualquiera de las reivindicaciones 1 a 15, en el que la determinación de la presencia
de un indel se realiza mediante tecnologías de extensión de un único par de bases, tecnologías de hibridación de
ADN o análisis de la curva de fusión.
25 17. El procedimiento según una cualquiera de las reivindicaciones 1 a 16, en el que el tumor se selecciona de entre
cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un tumor del síndrome de
Lynch.
18. Uso de un panel de al menos dos regiones homopoliméricas presentes en las regiones 5' UTR o 3' UTR de los
30 genes enumerados en la tabla 1 o de al menos tres regiones homopoliméricas seleccionadas de las presentes en los
exones de los genes enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes
enumerados en la tabla 1 en un procedimiento para diagnosticar el estado de MSI de un tumor según cualquiera de
las reivindicaciones 1 a 17, en el que dichas regiones homopoliméricas son regiones de microsatélites que son
repeticiones mononucleotídicas de al menos 6 nucleótidos y que no exceden de 20 nucleótidos.
35
19. Uso del panel de regiones homopoliméricas según la reivindicación 18, en el que las, al menos ocho, regiones
homopoliméricas son al menos ocho regiones seleccionadas de los genes enumerados en la tabla 3.
20. Uso del panel de regiones homopoliméricas según la reivindicación 18 o 19, en el que el panel comprende
40 adicionalmente un homopolímero en una región no codificante de al menos un gen seleccionado de ATM, ATR,
BLM, BRCA1, CHEK1, FANCD2, FANCE, FANCM, MRE11, RAD50 y RAD54.
21. Uso de un panel de regiones homopoliméricas de al menos tres regiones homopoliméricas seleccionadas de las
regiones homopoliméricas presentes en los genes MYL1, DIDO1, UBE2Z, RYR3, TMEM65, BTBD7, KDM5A, ABAT,
45 PPM1A, UBA6 y ZNF185 enumerados en la tabla 3 en un procedimiento de determinar la MSI en un tumor según
cualquiera de las reivindicaciones 1 a 17, en el que la presencia de al menos un indel es indicativa de MSI.
22. Uso del panel de regiones homopoliméricas según la reivindicación 21, en el que el panel comprende
adicionalmente una o más regiones homopoliméricas seleccionadas de las regiones homopoliméricas presentes en
50 los genes ARL10, GRIA2 y TMC7 enumerados en la tabla 3.
23. Uso del panel de regiones homopoliméricas según las reivindicaciones 21 o 22, en el que el panel comprende
adicionalmente la región homopolimérica del gen MSH6 enumerado en la tabla 2 o la región homopolimérica del gen
SULF2 enumerado en la tabla 1.
55
24. Uso del panel de regiones homopoliméricas según una cualquiera de las reivindicaciones 18 a 23, en el que los
homopolímeros tienen una longitud de 7 a 12 nucleótidos, de 7 a 11 nucleótidos o de 8 a 11 nucleótidos.
25. Un procedimiento de cribado de la sensibilidad de las células cancerosas al tratamiento con un inhibidor de una
60 enzima de reparación por escisión de bases de ADN, que comprende determinar el estado de MSI en dichas células
según un procedimiento de una cualquiera de las reivindicaciones 1 a 17.
26. El procedimiento según la reivindicación 25, en el que el inhibidor de una enzima de reparación por escisión de
bases de ADN es un inhibidor de PARP.
65
216
ES 2 906 023 T3
27. El procedimiento según la reivindicación 26, en el que el inhibidor de PARP se selecciona de entre olaparib,
veliparib, niraparib, iniparib, rucaparib, CEP9722, MK4827, BMN-673 y 3-aminobenzamida.
28. El procedimiento de una cualquiera de las reivindicaciones 25 a 27, en el que las células cancerosas son de un
5 cáncer seleccionado de entre cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y
un tumor del síndrome de Lynch.
29. Uso de un kit en un procedimiento para diagnosticar el estado de MSI de un tumor según una cualquiera de las
reivindicaciones 1 a 17, en el que el kit comprende oligonucleótidos específicos de alelo que discriminan entre los
10 alelos de las regiones homopoliméricas seleccionadas con y sin indeles.
30. El uso de un kit según la reivindicación 29, en el que las regiones homopoliméricas seleccionadas tienen una
longitud de 7 a 12 nucleótidos, de 7 a 11 nucleótidos o de 8 a 11 nucleótidos.
15 31. El uso de un kit según la reivindicación 29 o 30, en el que las regiones homopoliméricas se seleccionan de las
regiones homopoliméricas de los genes MYL1, DIDO1, UBE2Z, RYR3, TMEM65, BTBD7, KDM5A, ABAT, PPM1A,
UBA6 y ZNF185 enumerados en la tabla 3.
32. El uso de un kit según la reivindicación 31, en el que se selecciona una región homopolimérica adicional de las
20 regiones homopoliméricas de los genes ARL10, GRIA2 y TMC7 enumerados en la tabla 3.
33. El uso de un kit según la reivindicación 31 o 32, en el que se selecciona una región homopolimérica adicional de
las regiones homopoliméricas del gen MSH6 enumerado en la tabla 2 y la región homopolimérica del gen SULF2
enumerado en la tabla 1.
25
34. El uso de un kit según una cualquiera de las reivindicaciones 29 a 33 que comprende además oligonucleótidos
específicos de alelo que discriminan entre un alelo con y sin indeles, en el que el alelo se selecciona de los
marcadores del panel de marcadores Bethesda ampliado.
217
ES 2 906 023 T3
218
ES 2 906 023 T3
219
ES 2 906 023 T3
220
ES 2 906 023 T3
221
ES 2 906 023 T3
222
ES 2 906 023 T3
223
ES 2 906 023 T3
224
ES 2 906 023 T3
225
ES 2 906 023 T3
226
ES 2 906 023 T3
227