Está en la página 1de 11

La preimpresión de bioRxiv se publicó por primera vez en línea el 21 de enero de 2015; doi:http://dx.doi.org/10.1101/014050.

El titular de los derechos de autor de esta


preimpresión (que no fue revisada por pares) es el autor / financiador, que ha otorgado a bioRxiv una licencia para mostrar la preimpresión a perpetuidad.
Está disponible bajo un Licencia internacional CC-BY 4.0.
Artículo de investigación Vol. X, No. X / Enero de 2015 / Artículo 1

Una variante en TAF1 está asociado con un nuevo síndrome


con discapacidad intelectual grave y rasgos
dismórficos característicos
JUN HIJO A. O'RTEMOR1,2, #, YIYANG WU1,2, #, ALAN RAIRE LIBRE3, LAURA T. JIMENEZ BARRÓN1,4,
JEFFREY SWENSEN5, HUN FANG1, DÁVIDO METROITTELMAN6,7, GRAMOARETH HIGHNAM6, REID
ROBISON7,8, miADELANTE YANG9, KAI WANG7,8,10, Y GRAMOHOLSON J. LAQUÉL1,2,8
1Instituto Stanley de Genómica Cognitiva, Laboratorio Cold Spring Harbor, NY, EE. UU.
2Universidad de Stony Brook, Stony Brook, NY, EE. UU.
3Departamento de Genética Médica, Noroeste de Kaiser Permanente, Portland, Oregón, EE. UU.
4Centro de Ciencias Genómicas, Universidad Nacional Autónoma de México, Cuernavaca, Morelos, MX
5Caris Life Sciences, Phoenix, Arizona, EE. UU.
6Gene by Gene, Ltd., Houston, TX, EE. UU.
7Tute Genomics, Ltd., Provo, UT, EE. UU.
8Fundación de Utah para la Investigación Biomédica, Salt Lake City, UT, EE. UU.
9Departamento de Radiología, Boston Children's Hospital, Boston, MA, EE. UU.
10Instituto Neurogenético Zilkha, Departamento de Psiquiatría y Medicina Preventiva, Universidad del Sur de California, Los Ángeles, CA, EE. UU.

#
Co-primeros autores
*
Autor para correspondencia: glyon@cshl.edu

Compilado el 20 de enero de 2015

Describimos el descubrimiento de un nuevo síndrome genético, el síndrome de RykDax, impulsado por un


estudio de secuenciación del genoma completo (WGS) de una familia de Utah con dos hermanos varones
afectados, que presentan discapacidad intelectual (DI) grave, un pliegue interglúteo característico y muy rasgos
faciales distintivos que incluyen una nariz ancha y respingona, mejillas caídas, fisuras palpebrales inclinadas
hacia abajo, crestas periorbitarias prominentes, ojos hundidos, hipertelorismo relativo, labio superior delgado,
paladar arqueado, orejas prominentes con hélices engrosadas y mentón puntiagudo . Esta familia caucásica fue
reclutada en Utah, EE. UU. La WGS basada en Illumina se realizó en 10 miembros de esta familia, y la WGS
adicional basada en Genómica Completa se realizó en la parte nuclear de la familia (madre, padre y los dos
varones afectados). Usando conjuntos de datos de WGS de 10 miembros de esta familia, podemos aumentar la
confiabilidad de las inferencias biológicas con una tubería bioinformática integradora. En combinación con los
conocimientos de las evaluaciones clínicas y los análisis de diagnóstico médico, estos datos de secuenciación de
ADN se utilizaron en el estudio de tres modelos de enfermedades genéticas plausibles que podrían descubrir la
contribución genética al síndrome. Encontramos una diferencia de 2 a 5 veces en el número de variantes
detectadas como relevantes para varios modelos de enfermedades cuando se utilizan diferentes conjuntos de
datos de secuenciación y tuberías de análisis. Obtuvimos una mayor precisión cuando se utilizaron más
canalizaciones junto con datos que abarcan una porción más grande de la familia, con la cantidad de
mutaciones putativas de novo reducidas en un 80%, debido a llamadas falsas negativas en los padres. Los niños
portan una variante de sentido erróneo heredada de la madre en un gen cromosómico XTAF1, que
consideramos relevantes para la enfermedad. TAF1 es la subunidad más grande del complejo de múltiples
proteínas del factor de transcripción general IID (TFIID), y nuestros resultados implican mutaciones enTAF1
como desempeñando un papel fundamental en el desarrollo de este nuevo
síndrome de discapacidad intelectual.

1. INTRODUCCIÓN [4-6] en una variedad de entornos clínicos y de investigación [7]. Las herramientas
de computación para procesar y analizar estos datos de secuencia se han

Reducciones drásticas de costos y rápidos avances en el desarrollo de desarrollado en paralelo, y muchas ahora están disponibles gratuitamente y son

tecnologías de secuenciación eficientes [1-3] han llevado a un uso fáciles de implementar [4]. En este contexto, la secuenciación de exomas

generalizado del exoma y la secuenciación del genoma completo (WGS) biomédicos y WGS ha llevado al descubrimiento
La preimpresión de bioRxiv se publicó por primera vez en línea el 21 de enero de 2015; doi:http://dx.doi.org/10.1101/014050. El titular de los derechos de autor de esta
preimpresión (que no fue revisada por pares) es el autor / financiador, que ha otorgado a bioRxiv una licencia para mostrar la preimpresión a perpetuidad.
Está disponible bajo un Licencia internacional CC-BY 4.0.
Artículo de investigación Vol. X, No. X / Enero de 2015 / Artículo 2

ery de la base genética de muchas afecciones, incluido el síndrome de recolectados del hermano mayor, y se examinaron los metabolitos de
Miller [8] y otros [9]. los neurotransmisores, el perfil de tetrahidrobiopterina (BH4) y
El ímpetu intelectual de este estudio incluyó cómo identificar la neopterina (N).
principal contribución genética a un síndrome particular en sólo un
probando o dos hermanos afectados, en ausencia de otras personas A.3. Array X CGH personalizado y ensayo de sesgo del cromosoma X

afectadas con el mismo síndrome conocido. Esta tarea es mucho más Se marcaron 500 ng del ADN de cada participante de la investigación con
fácil en presencia de múltiples personas afectadas repartidas en dos o nanómeros marcados con 5'-Cy3 (NimbleGen), mientras que un control
más generaciones [10, 11], pero este no suele ser el caso de la mayoría femenino se marcó con nonamers Cy5. Después de la purificación mediante
de las presentaciones biomédicas de trastornos idiopáticos. El precipitación con isopropanol, se combinaron 31 ug de cada uno de los
descubrimiento genético también puede ser más fácil en genealogías participantes de investigación etiquetados y el ADN de referencia. La mezcla
consanguíneas con afecciones autosómicas recesivas [12, 13], pero esa se hibridó con una matriz específica de cromosoma X NimbleGen 720K
consanguinidad no está muy extendida en muchas partes del mundo [ personalizada durante 42 horas a 42ºC en un sistema de hibridación MAUI
14]. En cambio, nos enfocamos en un análisis que inicialmente incluía (BioMicro Systems). Luego, la matriz se lavó de acuerdo con las
una familia con solo dos hermanos que están afectados por un recomendaciones del fabricante (Nimblegen) y se escaneó inmediatamente.
síndrome idiopático, por lo que utilizamos WGS para cubrir tanto del Después de escanear, se extrajeron los datos brutos de intensidad de la fl
genoma como pudimos, particularmente como cualquier número de uorescencia de las imágenes escaneadas de la matriz utilizando el software
nucleótidos mutados en el genoma puede influir en algún fenotipo NimbleScan v2.6. Para cada uno de los puntos en la matriz, se generaron
durante la embriogénesis o la vida posnatal [15-33]. relaciones log2 normalizadas de la muestra del participante de
Esta familia caucásica fue reclutada en Utah, EE. UU. La WGS investigación marcada con Cy3 frente a la muestra de referencia Cy5
basada en Illumina se realizó en 10 miembros de esta familia, y la WGS utilizando el programa SegMNT.
adicional basada en Genómica Completa se realizó en la parte nuclear Los análisis de ensayo de sesgo del cromosoma X se realizaron
de la familia (madre, padre y los dos varones afectados). Los datos de utilizando una adaptación de la técnica descrita por Allen et al.
secuencia se procesaron con una serie de tuberías bioinformáticas. (1992) [34].
Utilizando conjuntos de datos completos generados por una
agregación de resultados derivados de estas tuberías, podemos B. Métodos de análisis y secuenciación del genoma completo
aumentar la confiabilidad de las inferencias biológicas derivadas de
Se emplearon dos estrategias de secuenciación diferentes. Los esfuerzos iniciales
estos datos. En combinación con los conocimientos de las evaluaciones
de secuenciación se centraron en la secuenciación del genoma completo
clínicas y los análisis de diagnóstico médico, estos datos de
utilizando el proceso de secuenciación y análisis de Genómica Completa (CG) v2.0
secuenciación de ADN se utilizaron en el estudio de tres modelos de
para la madre, el padre y dos niños afectados. Se realizó una secuenciación
enfermedades genéticas plausibles que podrían descubrir la
adicional del genoma completo después de este esfuerzo inicial, utilizando la
contribución genética al síndrome.
plataforma de secuenciación Illumina HiSeq 2000. La madre, el padre, dos niños
afectados y otros seis miembros de la familia inmediata se secuenciaron
2. MATERIALES Y MÉTODOS utilizando Illumina HiSeq 2000. Los datos de secuenciación sin procesar derivados
de la secuenciación de Illumina se procesaron mediante una variedad de
Este estudio consta de dos componentes metodológicos,
procesos de análisis y posteriormente se combinaron con variantes detectadas
secuenciación / análisis clínico y genómico. El componente clínico
por el CG secuenciando un análisis. tubería sis. Se utilizaron herramientas de
incluye la inscripción de participantes en la investigación, la evaluación
anotación funcional y descendente para evaluar las variantes detectadas por los
clínica, los análisis de diagnóstico y un informe clínico detallado. El
diversos métodos.
componente de secuenciación genómica incluye la secuenciación del
genoma completo, así como análisis posteriores destinados a anotar y
B.1. Secuenciación completa del genoma completo y detección de variantes de
asignar funciones biológicas a las variantes genómicas detectadas. Genomics

Después del control de calidad para asegurar la ausencia de degradación


A. Métodos clínicos
genómica, enviamos muestras de ADN de 10 µg a Complete Genomics (CG)
A.1. Inscripción de participantes de la investigación en Mountain View, California para su secuenciación. El ADN del genoma
La recolección y el análisis de ADN fueron realizados por la Fundación de completo se secuenció con una tecnología de secuenciación por ligadura de
Utah para la Investigación Biomédica, según lo aprobado por la Junta de lectura corta basada en nanoarrays, incluida una adaptación de la
Revisión Institucional (IRB) (Plantation, Florida). También se obtuvo el estrategia de secuenciación final por pares. Las lecturas se asignaron al
consentimiento informado por escrito de todos los participantes del conjunto GRCh37 del Genome Reference Consortium. Debido a los formatos
estudio, y la investigación se llevó a cabo de conformidad con la Declaración de datos patentados, CG realizó todos los datos de secuenciación, control
de Helsinki. de calidad, alineación y llamadas de variantes como parte de su servicio de
secuenciación, utilizando su tubería de la versión 2.0.
A.2. Evaluación / diagnóstico clínico
Se realizó una amplia gama de pruebas de diagnóstico clínico en B.2. Secuenciación del genoma completo y detección de variantes de Illumina
ambos hermanos varones afectados, incluido el cariotipo, una matriz HiSeq 2000

CGH de cromosoma X de alta resolución (matriz específica de Después de cuanti fi car las muestras utilizando el kit Qubit dsDNA BR Assay
cromosoma X 720K de Roche NimbleGen, Inc. EE. UU.), Estudio FISH Kit (Invitrogen), se envió 1ug de cada muestra para la secuenciación del
subtelomérico, metilación estudio para el síndrome de Angelman, XNP genoma completo utilizando la plataforma Illumina® Hiseq 2000. Se
secuenciación para ATRX y pruebas de XDNA frágil. Además, realizamos generaron bibliotecas de secuenciación a partir de 100 ng de ADN
diagnósticos sobre los niveles de aminoácidos séricos, los niveles de ácidos genómico utilizando el kit Illumina TruSeq Nano LT, de acuerdo con las
orgánicos en la orina, los niveles de cloruro en el sudor, el perfil de carnitina en recomendaciones del fabricante. La calidad de cada biblioteca se evaluó con
plasma y los niveles de inmunoglobulina. También realizamos un cribado de el ensayo de alta sensibilidad del bioanalizador Agilent (menos del 5% de
mucopolisacaridosis en orina (MPS) y examinamos los perfiles de tiroides. Se dímeros de cebadores) y se cuantificó mediante qPCR (Kappa Biosystem,
realizó una ecografía craneal y se obtuvieron imágenes cerebrales mediante CT). La biblioteca combinada se secuenció en tres carriles de una célula de
técnicas de exploración por resonancia magnética (RM) y tomografía flujo de 100 pb de extremo emparejado de HiSeq2000. El número de grupos
computarizada (TC). También se obtuvieron imágenes de la columna mediante que pasaron el filtrado inicial fue superior al 80% y el número de bases en
resonancia magnética. Además, el líquido cefalorraquídeo (LCR) se Q30 o superior fue superior al 85%.
La preimpresión de bioRxiv se publicó por primera vez en línea el 21 de enero de 2015; doi:http://dx.doi.org/10.1101/014050. El titular de los derechos de autor de esta
preimpresión (que no fue revisada por pares) es el autor / financiador, que ha otorgado a bioRxiv una licencia para mostrar la preimpresión a perpetuidad.
Está disponible bajo un Licencia internacional CC-BY 4.0.
Artículo de investigación Vol. X, No. X / Enero de 2015 / Artículo 3

Muestra Alelo 1 Alelo 2 análisis de priorización.


II-2 0,01 0,99
II-5 0,29 0,71
I-2 0,65 0,35 3. RESULTADOS

A. Evaluaciones clínicas y presentación fenotípica


II-2 I-2 II-5 Los probandos iniciales seleccionados para el estudio por el autor

6000
correspondiente (GJL) fueron dos hermanos afectados, de 12 y 14 años de

8000
4000
edad respectivamente, con DI grave, conductas autistas, ansiedad,
8000

trastorno por déficit de atención con hiperactividad y rasgos faciales muy

4000
2000
4000

distintivos. . Entre los rasgos faciales se encuentran una nariz ancha y


respingona, mejillas caídas, fisuras palpebrales inclinadas hacia abajo,
0

0
0 260 270 280 0 260 270 280 0 260 270 28 crestas periorbitarias prominentes, ojos hundidos, hipertelorismo relativo,
labio superior delgado, paladar muy arqueado, orejas prominentes con
hélices engrosadas y una barbilla puntiaguda. Otros síntomas fenotípicos
8000

8000
comunes incluyen estrabismo (exotropía), conductos lagrimales
8000

4000 bloqueados, microcefalia, ventriculomegalia leve, deficiencia del septum


4000

pellucidum, hipoplasia del cuerpo calloso, bajo volumen de sustancia blanca


4000

cerebral, disfunción oculomotora, otitis media frecuente con efusión,


deficiencias auditivas (mixtas conductivas / neurosensoriales), disfagia
0
0

0 260 270 280 0 260 270 280 0 260 270 280


motora oral, cifosis, pliegue glúteo peculiar con remanente caudal sacro (sin
anomalías de la columna vertebral), uñas displásticas de los pies,
Figura 1. Se realizaron ensayos de inactivación del cromosoma X
en la madreII-2), tía (II-5), y abuela maternaI-2) de los dos hermanos afectados. articulaciones hiperextensibles (especialmente dedos y muñecas),
El ensayo revela proporciones normales de inactivación del cromosoma X en la espasticidad, ataxia, alteraciones de la marcha , retraso en el crecimiento y
tía y la abuela materna; sin embargo, la madre de los hermanos afectados retrasos globales del desarrollo, especialmente en las áreas de motricidad
presenta una proporción de inactivación del cromosoma X de 99: 1. gruesa y expresión verbal. El menor de los dos hermanos afectados
también sufre frecuentes episodios de dermatitis de contacto y eccema,
escoliosis, desregulación del sueño y vigilia, así como asma, aunque ya no
Las lecturas de Illumina se asignaron al genoma de referencia de hg19 necesita medicación para este último. El hermano mayor, por otro lado,
utilizando BWA v0.6.2-r126, y la detección de variantes se realizó utilizando tiene diplejía y ha recibido terapia con toxina botulínica (Botox) para la
GATK v. 2.8-1-g932cd3a. Se utilizó una segunda canalización analítica para espasticidad de las extremidades inferiores durante seis años. Un
mapear las lecturas de Illumina y detectar variantes utilizando novoalign cuestionario de revisión de sistemas (ROS) no reveló ningún otro
v3.00.04 y FreeBayes caller v9.9.2-43-ga97dbf8. Los procedimientos de compartidos o no, síntomas o malformaciones. Vertabla 1 para obtener un
descubrimiento de variantes adicionales incluyeron Scalpel v0.1.1 para la resumen de las características clínicas de los hermanos varones afectados.
detección de inserción o eliminación (INDEL), RepeatSeq v0.8.2 para la
detección de variantes en regiones de repetición en tándem cortas y el Los padres de los dos hermanos afectados no son consanguíneos y
método ERDS (estimación por profundidad de lectura) v1.06.04 y PennCNV ambos están sanos. La madre fue evaluada por PKU y tenía niveles de
(versión 2011Jun16) para detectar variantes de números de copia más aminoácidos plasmáticos normales. Los antecedentes familiares no
grandes (CNV). revelan ningún miembro, vivo o fallecido, con características
Utilizamos varios métodos para priorizar e identificar posibles variantes fenotípicas o sindrómicas que se asemejen al síndrome descrito, y hay
de la línea germinal que contribuyen a la enfermedad, incluido VAAST [10, 35 un primo varón que no está afectado. Un ensayo de sesgo del
], Golden Helix SVS v8.1.4 [36], ANNOVAR (versión del 23 de agosto de 2013) cromosoma X reveló que la madre de los dos niños afectados tiene
[37] y GEMINI v0.9.1 [38]. VAAST emplea un marco estadístico basado en la una inactivación del cromosoma X sesgada, 99: 1. La abuela, así como
probabilidad para identificar las variantes más probables que contribuyen a la tía de los niños afectados, no muestran ninguna desviación
la enfermedad, dada la composición genómica y la información genómica apreciable del cromosoma X (Figura 1), que sugirió la posibilidad de
específica de la población. SVS, ANNOVAR y GEMINI emplean técnicas más una nueva variante deletérea del cromosoma X, aunque está bien
tradicionales basadas en anotación y filtrado que aprovechan los datos establecido que esto también podría ser inespecífico [39].
almacenados en bases de datos genómicas públicas (es decir, dbSNP 137,
datos de fase 1 de 1000 genomas, exomas NHLBI 6500, etc.).
Ambos embarazos con estos fetos masculinos se complicaron por
Usamos dos esquemas distintos de priorización de variantes. El primer el deterioro de la placenta, y ambos hermanos afectados fueron
esquema, al que nos referiremos como esquema de "codificación", requiere diagnosticados con retraso del crecimiento intrauterino (RCIU) y
que todas las variantes estén dentro de una región codificante del genoma. finalmente nacieron por cesárea (cesárea). La madre negó haber
También se incluyen variantes del sitio de empalme. El segundo esquema, consumido alcohol o drogas, ni haber estado expuesto a toxinas
al que nos referiremos como el esquema 'CADD', requiere que todas las ambientales durante el transcurso de ambos embarazos. El niño
variantes tengan una puntuación CADD de> 20. Las puntuaciones CADD no mayor nació en la semana 40 de gestación con un peso al nacer de
excluyen las variantes genéticas no codificantes de la lista resultante de 2,21 kg y un defecto de nacimiento notable de aplasia cutis congénita,
variantes potencialmente perjudiciales. Ambos esquemas requerían que que fue corregido quirúrgicamente a los 4 días de edad. El niño más
cada variante tuviera una frecuencia de población baja (MAF <1%). Las joven nació en la semana 37 de gestación con un peso al nacer de 1,76
variantes priorizadas se verificaron manualmente inspeccionando las kg. Se notó un soplo cardíaco al nacer, pero la ecocardiografía
alineaciones de secuencias utilizando Golden Helix GenomeBrowse v2.0.3 confirmó la ausencia de anomalías cardiovasculares adicionales o más
[http://www.goldenhelix.com/ GenomeBrowse / index.html]. Se consideró graves. Fue tratado con luz por ictericia neonatal, y requirió una sonda
plausible una señal si 4 o más lecturas apoyaban el alelo alternativo en más de alimentación durante los primeros días de su vida debido a
de un miembro de la familia. La información de frecuencia de la población dificultades para tragar y digerir los alimentos. Durante los exámenes
se corroboró mediante el visor de variaciones NCBI [http:// más recientes, el niño más joven (de 10 a 11/12 años) tenía una altura
www.ncbi.nlm.nih.gov/variation/view/]. Consulte la Información de 129,7 cm (2% baldosa), un peso de 30,8 kg (19% baldosa, IMC 18,3
complementaria para obtener detalles sobre la variante de llamada y kg / m2) y su occipital
La preimpresión de bioRxiv se publicó por primera vez en línea el 21 de enero de 2015; doi:http://dx.doi.org/10.1101/014050. El titular de los derechos de autor de esta
preimpresión (que no fue revisada por pares) es el autor / financiador, que ha otorgado a bioRxiv una licencia para mostrar la preimpresión a perpetuidad.
Está disponible bajo un Licencia internacional CC-BY 4.0.
Artículo de investigación Vol. X, No. X / Enero de 2015 / Artículo 4

Tabla 1. Resumen de las características clínicas del síndrome de RykDax

Utahfamilia

Sistemas Características
III-1 III-2
(mayor) (mas joven)

Cariotipo 46, X, inv (Y) (p11.2q 11.2)


Estudios genéticos
Mutación TAF1 chrX: 70621541 T> C, p. I1337T
Complicaciones deterioro de la placenta
Gestación
Término (semanas) 40 37
Cesárea + +
Peso (centil) 2,21 kilogramos 1,76 kilogramos

Nacimiento
Longitud (centil) NK NK
Circunferencia de la cabeza (centil) NK NK
Puntuaciones de Apgar NK NK
ictericia neonatal,
Curso perinatal Complicaciones NK
mala alimentación

Retraso del crecimiento de inicio prenatal +


Crecimiento
Retraso del crecimiento posnatal +
Retraso motor grueso +
Neuroconductual / Desarrollo Retraso de la expresión verbal +
Disfagia motora oral +
Crestas periorbitarias prominentes +
Fisuras palpebrales inclinadas hacia abajo +
Ojos hundidos +
Frente prominente +
Mejillas caídas +
Philtrum largo +
Orejas prominentes de implantación baja +
Craneofacial
Helices engrosadas +
Cara larga +
Paladar alto arqueado +
Labio superior delgado +
Mentón puntiagudo +
Nariz ancha hacia arriba +
Hipertelorismo +
Aplasia cutis congénita + (en el cuero cabelludo) -
Hoyuelo sacro +
Piel Hirsutismo -
Dermatitis y eczema frecuentes - +
Uñas de los pies displásicas +
problemas de audición +
Oído, nariz, boca y garganta (ENMT)
Otitis Media Crómica con E usión +
Estrabismo (exotropía) +
Ojos Conductos lagrimales bloqueados +
Disfunción oculomotora +
Estreñimiento - +
Gastrointestinal
Re ux gastroesofágico - +
Microcefalia +
Ventriculomegalia +
Bajo volumen de materia blanca cerebral +
Convulsiones -
Hipotonía +
Hipoplasia deficiente del tabique +
Neurológico
pellucidum del cuerpo calloso +
Anormalidades de la marcha +
Problema de equilibrio -
Diplejia + -
Ataxia +
Desregulación sueño-vigilia - +
Osteopenia + NK
Pliegue glúteo inusual
con remanente caudal sacro
+
+ (metacarpofalángico
Articulaciones hiperextensibles + (dedos y muñecas)
articulaciones y muñecas)
Musculoesquelético
Espasticidad + (extremidad inferior)

Cifosis + + (torácico)

Escoliosis - +
Cuello corto +
Respitatorio - + (Asma H / O)
- (H / Omurmur sin
Cardiovascular Defectos estructurales al nacer - cardiovascular
anormalidades)
Genital -
Hematológico / Linfático / Inmunológico -
Comportamientos autistas +
Psiquiátrico
Trastorno de hiperactividad de cit de atención +
Ansiedad +
Discapacidad intelectual +
Edad de muerte (años) N/A
Otro
Otras características -
"+": característica presente; "-": característica ausente; N / A: no aplica; NK: no se conoce.

Tabla 1. Esta tabla ilustra las características clínicas conocidas de los individuos afectados, así como otras características clínicas notadas en estos individuos.
La preimpresión de bioRxiv se publicó por primera vez en línea el 21 de enero de 2015; doi:http://dx.doi.org/10.1101/014050. El titular de los derechos de autor de esta
preimpresión (que no fue revisada por pares) es el autor / financiador, que ha otorgado a bioRxiv una licencia para mostrar la preimpresión a perpetuidad.
Está disponible bajo un Licencia internacional CC-BY 4.0.
Artículo de investigación Vol. X, No. X / Enero de 2015 / Artículo 5

Tabla 2. Una tabla de variaciones genéticas priorizadas en el síndrome de RykDax

Modelo Localización Árbitro Alt Llamador de variante Función Esquema

Recesivo chr1: 210851705 TT T CG, GATK, FreeBayes, RepeatSeq KCNH1: UTR3 CADD, puntuación: 27,5

Recesivo chr1: 224772440 AATAATTTG ejército de reserva CG, GATK, FreeBayes intergeneico CADD, puntuación: 22,1

Recesivo chr2: 60537356 TTTTATTT ATTATTA CG, FreeBayes, GATK, RepeatSeq intergeneico CADD, puntuación: 22,3

Recesivo chr8: 109098066 A A CG, FreeBayes, GATK, RepeatSeq A intergeneico CADD, puntuación: 24,6

Recesivo chr15: 66786022 FreeBayes, GATK SNAPC5: intrónico CADD, puntuación: 23,6

Recesivo chr16: 49061346 ejército de reserva T CG, FreeBayes, GATK intergénico CADD, puntuación: 25,3

Recesivo chr16: 49612367 G CG, FreeBayes, GATK ZNF423: intrónico CADD, puntuación: 20,5

Recesivo chr10: 135438929 T G CG, FreeBayes, GATK I171L Codificación, gen: FRG2B

Recesivo chr10: 135438951 AGCCT FreeBayes, Bisturí sub Codificación, gen: FRG2B

Recesivo chr10: 135438967 C T GATK, FreeBayes R158Q Codificación, gen: FRG2B

Recesivo chr15: 85438314 C CTTG CG, FreeBayes, GATK, bisturí K141delinsIE Codificación, gen: SLC28A1

De-novo chr1: 53925373 GRAMO GCCGCCC FreeBayes, CG, Scalpel C A83delinsAAP Codificación, gen: DMRTB1

Ligado al cromosoma X chrX: 34961492 T CG, FreeBayes, GATK Y182H Codificación, gen: FAM47B

Ligado al cromosoma X chrX: 70621541 T C CG, FreeBayes, GATK I1337T Codificación, gen: TAF1; CADD, puntuación: 22,9

Tabla 2. Se identificaron las variantes que se ajustaban a los tres modelos de enfermedad, de novo, autosómica recesiva y ligada al cromosoma X. Mostramos una lista resultante del
esquema de priorización CADD así como del esquema de priorización de codificación. Ambos esquemas requerían que cada variante tuviera una frecuencia poblacional baja (MAF <1%).
El esquema de codificación requería que todas las variantes también estuvieran dentro de una región codificante del genoma y que fueran un cambio no sinónimo. El esquema CADD
requiere que todas las variantes tengan una puntuación CADD de> 20, junto con la frecuencia poblacional mencionada anteriormente. Una variación enTAF1 fue el único
variación para ser detectada de manera confiable utilizando ambos esquemas de priorización.

la circunferencia frontal (OFC) fue de 51 cm (percentil 4.5); mientras B. Secuenciación del genoma completo y análisis bioinformático
que su hermano mayor (de 1111/12 años) tenía una altura de 136,8 B.1. Secuenciación del genoma completo
cm (5% baldosa), un peso de 26,3 kg (0% baldosa, IMC 14,1 kg / m2) y
Con nuestro esfuerzo por ir más allá de la secuenciación del exoma y entrar
su OFC era de 49,5 cm (percentil 0,2 ) en el momento.
en análisis de genoma completo, en los últimos años hemos desarrollado y
publicado líneas de análisis de genoma completo integrales, incluso para
Las resonancias magnéticas cerebrales de los dos hermanos encontrar inserciones y deleciones (IN-DEL) [7, 41-46]. Nosotros y otros
demostraron una constelación de anomalías notablemente similar. En hemos demostrado que las dos plataformas WGS dominantes (Illumina y
ambos sujetos, hubo hipoplasia del istmo y esplenio del cuerpo calloso Complete Genomics) son complementarias, ya que ambas faltan variantes [
con un espesor que cayó por debajo del tercer percentil informado 42, 47], por lo que se utilizaron ambas plataformas en este estudio. Los
para individuos de la misma edad [40]. Como suele ser el caso de la esfuerzos iniciales de secuenciación se centraron en la secuenciación del
hipoplasia callosa, hubo una configuración dismórfica asociada de los genoma completo utilizando el proceso de secuenciación y análisis de
ventrículos laterales y una ventriculomegalia lateral leve sin hallazgos Genómica Completa (CG) v2.0 para la madre, el padre y dos niños afectados.
positivos de dinámica anormal del LCR (es decir, sin evidencia de Se realizó una secuenciación adicional del genoma completo después de
imagen de hidrocefalia). También había deficiencia del septum este esfuerzo inicial, utilizando la plataforma de secuenciación Illumina
pellucidum en ambos hermanos, el hermano mayor tenía ausencia de HiSeq 2000 en la madre, el padre, dos niños afectados y otros seis
los dos tercios posteriores del septum pellucidum y el hermano menor miembros de la familia inmediata. Los datos de secuenciación sin procesar
tenía ausencia completa de las aletas septales. Los hallazgos asociados derivados de la secuenciación de Illumina se procesaron mediante una
con la displasia septoóptica incluyeron glándulas pituitarias variedad de procesos de análisis y posteriormente se combinaron con
subdesarrolladas para la edad, deficiencia de la hoz anterior con variantes detectadas por el proceso de secuenciación y análisis de CG
interdigitación hemisférica leve y cuestión de pequeños bulbos (consulte la sección Métodos de análisis y secuenciación del genoma
olfatorios a pesar de los surcos olfatorios completamente formados. completo). Se utilizaron herramientas de anotación funcional y descendente
Sin embargo, los nervios ópticos parecían de tamaño muy normal. Por para evaluar las variantes detectadas por los diversos métodos. Complete
fin, había hipoplasia vermiana subjetiva con el vermis inferior Genomics WGS se optimizó para cubrir el 90% del exoma con 20 o más
descansando al nivel de la unión pontomedular en lugar de una mitad lecturas y el 85% del genoma con 20 o más lecturas. Illumina WGS dio como
inferior más típica de la médula. Los negativos pertinentes incluyeron resultado una cobertura de profundidad de lectura mapeada promedio de
la ausencia de una malformación del desarrollo cortical, evidencia de 37.8X (SD = 1.3X). > 90% del genoma estaba cubierto por 30 lecturas o más
lesión previa o evidencia de imagen convencional de un proceso y> 80% de las bases tenían una puntuación de calidad de> 30. Consulte la
metabólico / neurodegenerativo. Tabla complementaria 1 para obtener más detalles sobre los datos de
secuenciación.
Otras pruebas de diagnóstico clínico realizadas en ambos
B.2. Análisis de bioinformática y llamadas de variantes.
hermanos afectados (consulte la sección Métodos clínicos) no
revelaron ningún trastorno conocido. Aunque el análisis cromosómico El número medio de variantes por individuo que se detectaron utilizando
reveló que ambos niños tienen el cariotipo de 46, X, inv (Y) los datos de secuenciación de Illumina en todos los métodos de detección
(p11.2q11.2), se sabe que es una variante de población normal. fue 3,583,905.1 (SD = 192,317.5) SNP, 650,708.2 (SD =
La preimpresión de bioRxiv se publicó por primera vez en línea el 21 de enero de 2015; doi:http://dx.doi.org/10.1101/014050. El titular de los derechos de autor de esta
preimpresión (que no fue revisada por pares) es el autor / financiador, que ha otorgado a bioRxiv una licencia para mostrar la preimpresión a perpetuidad.
Está disponible bajo un Licencia internacional CC-BY 4.0.
Artículo de investigación Vol. X, No. X / Enero de 2015 / Artículo 6

A B C p. I1337T

I H. sapiens 1183 GRCLKIYRTFRDEE 1196


1 2 M.mulatta 1137 -------------- 1137 1183
C. lupus GRCLKIYRTFRDEE 1196 1167
B.taurus GRCLKIYRTFRDEE 1180
M.musculus 1194 GRCLKIYRTFRDEE 1207 Bromo1
Bromo2
II R. norvegicus 1183 GRCLKIYRTFRDEE 1196
180 °

G.gallus 1208 GRRLKIYRTFRDED 1221


1 2 3 4 5
p. I1337T
X.tropicalis 1228 GRRLKIYRTFCDED 1241
D.rerio 1211 GRILRITRTFRGND 1224
D.melanogaster 1211 AKILKITRTFKNAE 1224
1114 NQQLKIYRTCKGPD 1127
III A.gambiae
1145 GRRLKIYRTFRDED 1158
C.elegans
1 2 3 Bromo1
Bromo2

D
TAF1 Quinasa DUF395 / SOMBRERO Rápido Bromo Bromo Quinasa
1 chrX: 70621541 T> C, p. I1337T 1893

Figura 2. (A) Dibujos de pedigrí de la familia de Utah,B) Una alineación de secuencia de proteínas de TAF1 entre H. sapiens, M.mulatta, C.lupus, B.taurus,
M.musculus, R.norvegicus, G.gallus, X.tropicalis, D.rerio, D.melanogaster, A.gambiae y C.elegans, enumerados de arriba a abajo. Esta alineación se generó utilizando el
MUSCLE [48] en el sitio web HomoloGene [http://www.ncbi.nlm.nih.gov/ homologene]. La ubicación de TAF1 I1337T está resaltada en rojo, lo que muestra un alto grado de
conservación de la secuencia de proteínas, (C) Modelado computacional de la estructura de la proteína TAF1 de los residuos 1080 a 1579 usando I-TASSER y (D) conocido
TAF1 dominios, con el TAF1 variante indicada.

84,125.7) INDEL (6,310.2 promedio de INDEL de Scalpel con una DE de 74.3, B.4. Puntuaciones variantes

ya que solo detecta señales en las regiones del exón), 1,338,503 (DE = El TAF1 La variante encontrada en esta familia fue clasificada como la más alta
7,622.2) variantes observadas en las regiones STR y 327.4 CNV con una DE entre las variantes que se están probando con VAAST usando un modelo ligado al
de 8.2 (y una media de 49,1 y una SD de 15,8 para CNV de PennCNV, que X (con un valor p de 0.00184 y un rango de 14.59) y está clasificada altamente en
detecta señales en un espacio de búsqueda más pequeño que ERDS). Para términos de su potencial importancia funcional. Esta variante está clasificada por
los datos de la secuencia de CG, el número medio de variantes por CADD dentro del 1% superior de variantes más deleitosas en el genoma humano,
individuo detectado es de 3.457.584 (SD = 51.665,8), es calificada por PolyPhen-2 [50] como "Probablemente perjudicial" con una
565,691.5 (SD = 16,247.7) y 175.3 (SD = 12.8) para SNPs INDELs y CNVs puntuación de 0,996, según SIFT [51] como "Dañino" con una puntuación de
respectivamente. Se descubrieron 14 INDELS y SNV únicos utilizando 0,003, y también por PROVEAN [52] como "Deletéreo" con una puntuación de
dos esquemas de priorización diferentes, y ambos esquemas -3,51. Esta variante enTAF1 es novedoso, ya que no se encuentra en bases de
identificaron de manera confiable un único SNV de codificación. No se datos públicas (es decir, dbSNP 137, datos de fase 1 de 1000 genomas, exomas de
descubrieron NVC conocidas que contribuyan a la enfermedad, pero NHLBI 6500 o versión ExAC
archivamos en nuestro estudio 8 NVC de novo que actualmente no 0,2).
están asociadas con ningún fenotipo biológico (consulte la Tabla
complementaria 2 para ver la lista de NVC). B.5. Modelado de proteínas

Para investigar cómo TAF1 variante puede influir en la estructura y el


empaquetado de las proteínas, construimos un modelo de estructura para
B.3. Priorización de variantes
la región de los residuos 1080 a 1569 usando I-TASSER (Figura 2C). Los
Utilizando los dos esquemas de priorización de variantes descritos en la sección residuos que abarcan de 1120 a 1270 contienen el dominio principal de
Materiales y métodos, descubrimos un conjunto de variantes putativas de entre interacción RAP74 (RAPiD), que se ha demostrado que es importante para
los tres modelos de enfermedades probados aquí. Encontramos 7 variantes las interacciones entre TAF1 y RAP74 (GTF2F1) y TAF1-TAF7 [53]. Los
potencialmente importantes en regiones no codificantes del genoma y 7 en residuos que abarcan 1373 a 1590 contienen dos dominios Bromo (Bromo1:
regiones codificantes en los dos esquemas de priorización (Tabla 2). Estas 1397-1467 y Bromo2: 1520-1590,Figura 2C y 2D).
variantes se encuentran dentro de las regiones codificantes y no codificantes de Estos bromo do-mains consisten en un haz de cuatro hélices alfa que
un total de 8 genes conocidos, TAF1, FAM47B, SLC28A1, FRG2B, DMRTB1, ZNF423, forman un bolsillo hidrofóbico para reconocer una acetil lisina, como las de
SNAPC5 y KCHN1. Encontramos una serie de NVC que no se sabía que estuvieran las colas N-terminales de las histonas. La variante encontrada en esta
asociadas con ningún fenotipo deletéreo que pudiéramos encontrar (Tabla familia, I337T, está ubicada entre los dominios RAPiD y Bromo (mostrados
complementaria 2). Como se indicó anteriormente, solo se compartió una como esferas rojas). Aunque esta variante no se encuentra dentro de
variante entre los dos esquemas diferentes empleados aquí, a saber, un cambio ningún dominio proteico conocido, especulamos que puede afectar el
no sinónimo enTAF1 que resultó en un cambio de isoleucina (hidrófobo) a empaquetamiento del dominio de TAF1, lo que puede interferir con la
treonina (polar) en el residuo 1337º. El cambio de proteína ocurre dentro de una superficie de interacción TAF1-TAF7 [49, 53] o marcar la proteína para la
región enlazadora antes de dos dominios bromodominios y después de un degradación proteolítica.
dominio de interacción de cofactor (TAF7). Esta región enlazadora está altamente
conservada en eucariotas multicelulares (Figura 2B), pero no está presente en S.
4. DISCUSIÓN
cerevisiae TAF1. Por lo tanto, esta región enlazadora no se encuentra en una
estructura cristalina informada recientemente para el complejo TAF1-TAF7 de S. En general, encontramos beneficios en el uso de múltiples canales de
cerevisiae [49]. informática con WGS en un pedigrí multigeneracional para la
identificación y priorización de la variación genética humana.
La preimpresión de bioRxiv se publicó por primera vez en línea el 21 de enero de 2015; doi:http://dx.doi.org/10.1101/014050. El titular de los derechos de autor de esta
preimpresión (que no fue revisada por pares) es el autor / financiador, que ha otorgado a bioRxiv una licencia para mostrar la preimpresión a perpetuidad.
Está disponible bajo un Licencia internacional CC-BY 4.0.
Artículo de investigación Vol. X, No. X / Enero de 2015 / Artículo 7

potencialmente importante en el fenotipo de la enfermedad discutido. FRG2B y FAM47B no se sabe que estén involucrados en la patogenia de
Destacamos aquí una variante encontrada en el cromosoma X de los la enfermedad humana, aunque la función molecular detallada de estos
dos varones afectados de Utah, EE. UU., Que les fue transmitida por su genes ha sido en gran parte inexplorada. FRG2B es homólogo a FRG2
madre, que adquirió esta variante espontáneamente (de novo) y que localizado en el cromosoma 4, que ha sido implicado en jugar un papel en la
se ve afectada por una desviación extrema del cromosoma X. Pudimos patogénesis de la distrofia muscular facioescapulohumeral (FSHD) en
priorizar variantes que no se observaron en otros miembros de la pacientes con reducciones sustanciales en una repetición de microsatélites
familia secuenciada, incluida la ausencia de un primo varón no 4q35 de 11-150 unidades [67-69]. Sin embargo, las reducciones en la
afectado. La única variante encontrada en nuestros dos esquemas de repetición de microsatélites 10qt26 homóloga, proximal aFRG2B, tener no
priorización de variantes está en una región altamente conservada de se ha asociado con FSHD.
TAF1, que es la subunidad más grande del complejo de múltiples ZNF423 actúa como un regulador transcripcional y mutaciones en
proteínas TFIID involucrado en el inicio de la transcripción [49, 54-57]. ZNF423 regiones codificantes han sido implicadas en la patogénesis
del síndrome de Joubert [70, 71]. La mutación que hemos identificado
enZNF423 se encuentra dentro de un intrón y se desconoce su función
UN. TAF1 variante implicada en el fenotipo de la enfermedad molecular. Se cree que SLC28A1 media los fl ujos de uridina, adenosina
y azidodesoxitimidina dependientes del sodio [72] mientras que
TAF1 (factor 1 asociado a la proteína de unión a caja TATA) es parte del
SNAPC5, también conocido como SNAP19, desempeña un papel de
complejo de múltiples proteínas TFIID, que consta de la proteína de
andamiaje en la formación del complejo completo de proteína
unión a TATA (TBP) y 12 factores asociados a TBP (TAF) adicionales. Se
activadora de snRNA (SNAP), que se requiere para la transcripción de
ha implicado a TFIID en la promoción del inicio de la transcripción
genes de snRNA [73]. Las funciones moleculares de KCHN1 y DMRTB1
reconociendo el ADN promotor y facilitando la nucleación de otros
no se comprenden ni estudian bien.
factores para ayudar en el ensamblaje del complejo de preiniciación [55
El TAF1 La variante encontrada en esta familia de Utah fue la única
]. TFIID también interactúa con activadores transcripcionales como
variante identificada como importante por los dos esquemas de priorización
coactivador [55]. TAF1 es el TAF asociado a TFIID más grande conocido
que usamos. La variante surgió en esta familia como una variante de novo
y se une directamente al TBP a través de un dominio N-terminal
en el cromosoma X de la madre (II-2) de los dos niños afectados (ya que no
conservado. A través de su unión a TBP, se cree que TAF1 influye en
se encuentra en ninguno de los otros miembros de la familia) y luego se
cierto control sobre la activación de genes promovidos por TATA u
transmitió a ambos. La madre también presenta una distorsión extrema del
otros motivos de ADN al inhibir que la subunidad de TBP se una a
cromosoma X, mientras que su madre y su hermana no. El cambio de
estas regiones [54]. Un trabajo más reciente ha informado de
proteína ocurre dentro de una región enlazadora N-terminal a dos dominios
expresiones aberrantes que afectan a cientos deD. melanogaster
bromo y C-terminal de un dominio de interacción de cofactor (TAF7). Esta
genes como resultado de TAF1 agotamiento de la transcripción, con
región enlazadora está altamente conservada en eucariotas multicelulares,
muchos más de estos genes que se expresan con más vigor mientras que
pero no está presente enS. cerevisiae TAF1. Esta región enlazadora no se
un número menor se expresa con menos vigor que en condiciones de tipo
encuentra en una estructura cristalina reportada recientemente para el S.
salvaje [58]. Además, y de acuerdo con la noción de que TAF1 es importante
cerevisiae Complejo TAF1-TAF7 [49]. También se informó la estructura
para controlar los patrones de unión de TFIID a regiones promotoras
cristalina de un complejo TAF1-TAF7 humano [53], aunque la región
específicas, este estudio mostró que el conjunto de genes que confieren
caracterizada, nuevamente, no incluye la región enlazadora donde se
una mayor expresión se enriqueció con genes que contienen promotores
encuentra nuestra variante. Esta variante representó la única variación que
de motivos TATA, lo que sugiere una asociación entre el agotamiento de
pudimos identificar con WGS integral que tiene una función molecular clara
TAF1 y el aumento de la expresión de genes con promotores basados en
en el tejido neuronal y funciona como parte de TFIID, un complejo de
TATA. El trabajo estructural reciente en levadura apunta a un papel
múltiples proteínas más grande involucrado en la regulación general de la
epigenético del complejo TAF1-TAF7 en la función general de TFIID y / o el
transcripción que se ha sugerido que juega un posible papel en las
ensamblaje del complejo de preiniciación (PIC), y que TAF1 es
enfermedades neurodegenerativas y el retraso del desarrollo cuando se
probablemente inestable en ausencia de un socio de unión, como TAF7 [49].
alteran sus componentes [13, 59-62, 64, sesenta y cinco].

Existe evidencia que relaciona varios TAF y el TBP con papeles


En conjunto, esta evidencia sugiere que la variante en
funcionales importantes en el tejido neuronal humano. De hecho, las
TAF1 puede estar jugando un papel importante en este síndrome recientemente
mutaciones observadas enTAF1-2 y el TBP ha sido implicado en jugar
identificado, mientras que otras variantes encontradas en esta familia (Tabla 2)
un papel importante en los trastornos neurodegenerativos humanos
no están tan fuertemente implicados por trabajos previos que exploran sus
como la distonía-parkinsonismo ligado al cromosoma X (XDP) [59, 60]
funciones putativas.
así como en discapacidad intelectual y retraso en el desarrollo [61-63],
respectivamente. Ambos estudios XDP demostraron aberrantes
5. CONCLUSIONES
neuronas específicasTAF1 Niveles de expresión de isoformas en tejido
neuronal que contiene TAF1 mutaciones. Herzfeld et. al (2013) Nuestro trabajo demuestra el valor de realizar análisis genómicos más
corroboró informes anteriores que sugerían que una reducción enTAF1 completos cuando se enfrenta a un síndrome o aflicción por
La expresión está asociada con diferencias de expresión a gran escala en enfermedad no descrito y no diagnosticado, particularmente con sólo
cientos de genes. Los estudios en el cerebro de ratas y ratones también uno o dos probandos afectados en una familia. WGS condujo a la
corroboran la importancia y relevancia deTAF1 patrones de expresión identificación de aberraciones genómicas que no fueron probadas por
específicos de los tejidos neuronales [64, sesenta y cinco]. En corroboración ensayos clínicos más tradicionales. Entre las múltiples variantes raras y
con estudios bioquímicos y funcionales, un estudio reciente a escala potencialmente contribuyentes a la enfermedad descubrió esta
poblacional informóTAF1 en el puesto 53 entre los mejores familia, la variante enTAF1 Es probable que contribuya al fenotipo,
1.003 genes humanos restringidos [66]. Utilizando las frecuencias alélicas junto con el medio ambiente y otras aberraciones genéticas, para
informadas por el Proyecto de secuenciación del exoma (ESP) del Instituto contribuir a la suma total del fenotipo de esta enfermedad en los dos
de la Sangre (NHLBI), los autores de este estudio razonaron que el número hermanos de Utah. Por supuesto, las diferencias en los antecedentes
de variantes de sentido erróneo observadas es menor de lo que cabría genéticos y el medio ambiente ciertamente pueden explicar las
esperar por casualidad (una puntuación Z con signo de 5.1779 rangosTAF1 diferencias fenotípicas entre los dos hermanos. Este fenómeno es bien
el 53o más restringido entre los 1003 genes humanos más restringidos) en conocido desde hace muchos años en genética [74, 75], pero parece
comparación con la probabilidad esperada de que ocurran variantes sin ser apreciado más recientemente y se ha convertido en un tema de
sentido en este gen (5.61E-05). investigación activo actual [76-80]. Otro trabajo
La preimpresión de bioRxiv se publicó por primera vez en línea el 21 de enero de 2015; doi:http://dx.doi.org/10.1101/014050. El titular de los derechos de autor de esta
preimpresión (que no fue revisada por pares) es el autor / financiador, que ha otorgado a bioRxiv una licencia para mostrar la preimpresión a perpetuidad.
Está disponible bajo un Licencia internacional CC-BY 4.0.
Artículo de investigación Vol. X, No. X / Enero de 2015 / Artículo 8

también sugiere un vínculo fisiológico entre el retraso en el desarrollo GJ Worsley, J. Yan, L. Yau, M. Zuerlein, J. Rogers, JC Mul-
y el complejo TFIIDmulti-protein [13, 61, 62], aunque la variabilidad likin, ME Hurles, NJ McCooke, JS West, FL Oaks, PL Lundberg, D.
fenotípica y la expresión de otras variantes en TAF1 Klenerman, R. Durbin y AJ Smith, "Secuenciación precisa del
queda por determinar. genoma humano completo mediante la química del terminador
reversible", Nature 456, 53 a 59 (2008).
4. GJ Lyon y K. Wang, "Identificación de mutaciones de
EXPRESIONES DE GRATITUD enfermedades en entornos de medicina genómica: desafíos
GJL cuenta con el apoyo de fondos del Instituto Stanley de Genómica actuales y cómo acelerar el progreso", Genome Med 4, 58 (2012).
Cognitiva del Laboratorio Cold Spring Harbor. KW cuenta con el apoyo de la 5. SH Katsanis y N. Katsanis, “Pruebas genéticas moleculares y el
subvención del NIH número HG006465. La secuenciación de Complete futuro de la genómica clínica”, revisa Nature. Genética14, 415–
Genomics fue proporcionada por una subvención de análisis de datos CG a 426 (2013).
KW. Nos gustaría agradecer a Max Doerfel por sus útiles discusiones. Los 6. GJ Lyon, “Relato personal del descubrimiento de una nueva
autores desean agradecer al Consorcio de agregación del exoma y a los enfermedad usando secuenciación de próxima generación. entrevista
grupos que proporcionaron datos de variantes del exoma para la de natalie harrison, "Farmacogenómica12, 1519-1523 (2011).
comparación. Se puede encontrar una lista completa de los grupos 7. CA Brownstein, AH Beggs, N. Homer, B. Merriman,
contribuyentes en http://exac.broadinstitute.org/about. TW Yu, KC Flannery, ET DeChene, MC Towne, SK Savage, EN Price,
IA Holm, LJ Luquette, E. Lyon,
J. Majzoub, P. Neupert, D. McCallie Jr., P. Szolovits, HF Willard, NJ
REFERENCIAS Mendelsohn, R. Temme, RS Finkel, SW Yum, L. Medne, SR
Sunyaev, I. Adzhubey, CA Cassa,
1. GF Schneider y C. Dekker, "Secuenciación de ADN con nanoporos",
PI de Bakker, H. Duzkale, P. Dworzynski, W. Fairbrother,
Biotecnología de la naturaleza 30, 326–328 (2012).
L. Francioli, BH Funke, MA Giovanni, RE Handsaker,
2. J. Shendure y E. Lieberman Aiden, "El alcance en expansión de la
K. Lage, MS Lebo, M. Lek, I. Leshchiner, DG MacArthur,
secuenciación de adn", Nature biotechnology 30, 1084–1094
HM McLaughlin, MF Murray, TH Pers, PP Polak,
(2012).
S. Raychaudhuri, HL Rehm, R. Soemedi, NO Stitziel,
3. DR Bentley, S. Balasubramanian, HP Swerdlow, GP Smith, J. Milton,
S. Vestecka, J. Supper, C. Gugenmus, B. Klocke, A. Hahn,
CG Brown, KP Hall, DJ Evers, CL Barnes, HR Bignell, JM Boutell, J.
M. Schubach, M. Menzel, S. Biskup, P. Freisinger, M. Deng,
Bryant, RJ Carter,
M. Braun, S. Perner, RJ Smith, JL Andorf, J. Huang,
R. Keira Cheetham, AJ Cox, DJ Ellis, MR Flatbush,
K. Ryckman, VC Sheffield, EM Stone, T. Bair, EA Black-Ziegelbein,
NA Gormley, SJ Humphray, LJ Irving, MS Karbelashvili, SM Kirk, H.
TA Braun, B. Darbro, AP DeLuca, DL Kolbe,
Li, X. Liu, KS Maisinger, LJ Murray, B. Obradovic, T.Ost, ML
TE Scheetz, AE Shearer, R. Sompallae, K. Wang, AG Bassuk, E.
Parkinson, MR Pratt,
Edens, K. Mathews, SA Moore, OA Shchelochkov, P. Trapane, A.
MI Rasolonjatovo, MT Reed, R. Rigatti, C. Rodighiero,
Bossler, CA Campbell, JW Heusel,
MT Ross, A. Sabot, SV Sankar, A. Scally, GP Schroth,
A. Kwitek, T. Maga, K. Panzer, T. Wassink, D. Van Daele,
ME Smith, VP Smith, A. Spiridou, PE Torrance, SS Tzonev, EH
H. Azaiez, K. Booth, N. Meyer, MM Segal, MS Williams,
Vermaas, K. Walter, X. Wu, L. Zhang, MD Alam, C. Anastasi, IC
G. Tromp, P. White, D. Corsmeier, S. Fitzgerald-Butt, G. Herman,
Aniebo, DM Bailey, IR Bancarz,
D. Lamb-Thrush, KL McBride, D. Newsom, CR Pierson, AT
S. Banerjee, SG Barbour, PA Baybayan, VA Benoit, KF Benson, C.
Rakowsky, A. Maver, L. Lovrecic , A. Pa- landacic, B. Peterlin, A.
Bevis, PJ Black, A. Boodhun, JS Brennan,
Torkamani, A. Wedell, M. Huss,
JA Bridgham, RC Brown, AA Brown, DH Buermann, AA Bundu, JC
A. Alexeyenko, JM Lindvall, M. Magnusson, D. Nilsson, H.
Burrows, NP Carter, N. Castillo,
Stranneheim, F. Taylan, C. Gilissen, A. Hoischen,
ECM Chiara, S. Chang, R. Neil Cooley, NR Crake,
B. van Bon, H. Yntema, M. Nelen, W. Zhang, J. Sager,
OO Dada, KD Diakoumakos, B. Dominguez-Fernandez,
L. Zhang, K. Blair, D. Kural, M. Cariaso, GG Lennon,
DJ Earnshaw, UC Egbujor, DW Elmore, SS Etchin,
A. Javed, S. Agrawal, PC Ng, KS Sandhu, S. Krishna,
MR Ewan, M. Fedurco, LJ Fraser, KV Fuentes Fajardo,
V. Veeramachaneni, O. Isakov, E. Halperin, E. Friedman,
W. Scott Furey, D. George, KJ Gietzen, CP Goddard, GS Golda, PA
N. Shomron, G. Glusman, JC Roach, J. Caballero, HC Cox, D.
Granieri, DE Green, DL Gustafson, NF Hansen, K. Harnish, CD
Mauldin, SA Ament, L. Rowen, DR Richards,
Haudenschild, NI Heyer, MM Hims, JT Ho, AM Horgan, K .
FA San Lucas, ML González-Garay, CT Caskey, Y. Bai,
Hoschler, S. Hurwitz, DV Ivanov, MQ Johnson, T. James, TA Huw
Y. Huang, F. Fang, Y. Zhang, Z. Wang, J. Barrera, JM García-Lobo,
Jones, GD Kang, TH Kerelska, AD Kersey, I. Khrebtukova, AP
D. González-Lamuno, J. Llorca, MC Rodríguez, I. Varela, MG Reese,
Kindwall, Z. Kingsbury, PI Kokko-Gonzales, A. Kumar,
FM De La Vega, E. Kiruta, M. Cargill, RK Hart, JM Sorenson, GJ
Lyon, DA Stevenson, BE Bray, BM Moore, K. Eilbeck, M. Yandell,
MA Laurent, CT Lawley, SE Lee, X. Lee, AK Liao, JA Loch, M. Lok, S.
Luo, RM Mammen, JW Martin, PG McCauley, P. McNitt, P. Mehta,
H. Zhao, L. Hou, X. Chen, X. Yan, M. Chen, C. Li, C. Yang,
KW Moon, JW Mullens,
M. Gunel, P. Li, Y. Kong, AC Alexander, ZI Albertyn,
T. Newington, Z. Ning, B. LingNg, SM Novo, MJ O'Neill,
KM Boycott, DE Bulman, PM Gordon, AM Innes,
MA Osborne, A. Osnowski, O. Ostadan, LL Paraschos,
BM Knoppers, J. Majewski, CR Marshall, JS Parboos- inggh, SL
L. Pickering, AC Pike, AC Pike, D. Chris Pinkard, DP Pliskin, J.
Sawyer, ME Samuels, J. Schwartzentruber, IS Kohane y DM
Podhasky, VJ Quijano, C. Raczy, VH Rae, SR Rawlings, A. Chiva
Margulies, “Un esfuerzo internacional hacia el desarrollo de
Rodríguez, PM Roe, J. Rogers, MC Rogert Bacigalupo , N.
estándares para las mejores prácticas en análisis, interpretación e
Romanov, A. Romieu, RK Roth,
informes de la secuenciación clínica del genoma resulta en el
NJ Rourke, ST Ruediger, E. Rusman, RM Sanches- Kuiper, MR
desafío de la claridad ”, Genome Biol 15, R53 (2014).
Schenker, JM Seoane, RJ Shaw, MK Shiver, SW Short, NL Sizto, JP
8. JC Roach, G. Glusman, AF Smit, CD Huff, R. Hubley, PT Shannon, L.
Sluis, MA Smith,
Rowen, KP Pant, N. Goodman,
J. Ernest Sohna Sohna, EJ Spence, K. Stevens, N. Sutton,
M. Bamshad, J. Shendure, R. Drmanac, LB Jorde, L. Hood y DJ
L. Szajkowski, CL Tregidgo, G. Turcatti, S. Vandevondele,
Galas, "Análisis de la herencia genética en una familia
Y. Verhovsky, SM Virk, S. Wakelin, GC Walcott, J. Wang,
La preimpresión de bioRxiv se publicó por primera vez en línea el 21 de enero de 2015; doi:http://dx.doi.org/10.1101/014050. El titular de los derechos de autor de esta
preimpresión (que no fue revisada por pares) es el autor / financiador, que ha otorgado a bioRxiv una licencia para mostrar la preimpresión a perpetuidad.
Está disponible bajo un Licencia internacional CC-BY 4.0.
Artículo de investigación Vol. X, No. X / Enero de 2015 / Artículo 9

cuarteto por secuenciación del genoma completo ”, Science 328, 636– El retrotransposón conservado revela un ARN no codificante. como un

639 (2010). mediador de la encefalopatía infantil ”, Actas de la Academia


9. MJ Bamshad, JA Shendure, D. Valle, A. Hamosh, JR Lupski, RA Nacional de Ciencias de los Estados Unidos de América. 109,
Gibbs, E. Boerwinkle, RP Lifton, M. Gerstein, 4980–4985 (2012).
M. Gunel, S. Mane, DA Nickerson y G. Centers for Mendelian, "Los 19. J. Salzman, C. Gawad, PL Wang, N. Lacayo y PO Brown, "Los rnas
centros de genómica mendeliana: una nueva iniciativa a gran escala circulares son la isoforma de transcripción predominante de
para identificar los genes que subyacen a las enfermedades cientos de genes humanos en diversos tipos de células", PloS one
mendelianas raras", Am J Med Genet A 158A, 1523-1525 7, e30733 (2012).
(2012). 20. PJ Batista y HY Chang, "Rnas no codificantes largos: códigos de
10. AF Rope, K. Wang, R. Evjenth, J. Xing, JJ Johnston, JJ Swensen, WE direcciones celulares en el desarrollo y la enfermedad", Cell 152, 1298–
Johnson, B. Moore, CD Huff, LM Bird, 1307 (2013).
JC Carey, JM Opitz, CA Stevens, T. Jiang, C. Schank, 21. TB Hansen, TI Jensen, BH Clausen, JB Bramsen,
HD Fain, R. Robison, B. Dalley, S. Chin, ST South, TJ Pysher, LB B. Finsen, CK Damgaard y J. Kjems, “Los círculos naturales de ARN
Jorde, H. Hakonarson, JR Lillehaug, LG Biesecker, M. Yandell, T. funcionan como esponjas microrna eficientes”, Nature 495,
Arnesen y GJ Lyon, “Using vaast to identificar un trastorno ligado 384–388 (2013).
al cromosoma X que resulta en letalidad en bebés varones debido 22. A. Kapusta, Z. Kronenberg, VJ Lynch, X. Zhuo, L. Ramsay,
a una deficiencia de acetiltransferasa n-terminal ”, Am J Hum G. Bourque, M. Yandell y C. Feschotte, "Los elementos transponibles
Genet 89, 28 a 43 (2011). son los principales contribuyentes al origen, la diversificación y la
11. H. Hirata, I. Nanda, A. van Riesen, G. McMichael, H. Hu, regulación de los rnas no codificantes largos de vertebrados", PLoS
M. Hambrock, MA Papon, U. Fischer, S. Marouillat, Genet 9, e1003470 (2013).
C. Ding, S. Alirol, M. Bienek, S. Preisler-Adams, A. Grimme, 23. V. Khoddami y BR Cairns, “Identificación de objetivos directos y
D. Seelow, R. Webster, E. Haan, A. MacLennan, W. Stenzel, bases modificadas de arn citosina metiltransferasas”, Nature
TY Yap, A. Gardner, LS Nguyen, M. Shaw, N. Lebrun, biotechnology (2013).
SA Haas, W. Kress, T. Haaf, E. Schellenberger, J. Chelly, 24. H. Ledford, “Rnas circulares arrojan la genética por un bucle”,
G. Viot, LG Shaffer, JA Rosenfeld, N. Kramer, R. Falk, Naturaleza 494, 415 (2013).
D. El-Khechen, LF Escobar, R. Hennekam, P. Wieacker, 25. A. Maxmen, "Rna: The genome's rising stars", Nature 496,
C. Hubner, HH Ropers, J. Gecz, M. Schuelke, F. Laumon- nier y VM 127-129 (2013).
Kalscheuer, “Las mutaciones de Zc4h2 están asociadas con 26. S. Memczak, M. Jens, A. Elefsinioti, F. Torti, J. Krueger,
artrogriposis múltiple congénita y discapacidad intelectual a A. Rybak, L. Maier, SD Mackowiak, LH Gregersen,
través del deterioro de la plasticidad sináptica central y M. Munschauer, A. Loewer, U. Ziebold, M. Landthaler,
periférica”, American Journal of genética humana C. Kocks, F. le Noble y N. Rajewsky, “Los rnas circulares son una
92, 681–695 (2013). gran clase de rnas animales con potencia reguladora”, Nature
12. AB Alsalem, AS Halees, S. Anazi, S. Alshamekh y FS Alkuraya, "La 495, 333–338 (2013).
secuenciación de Autozygome expande el horizonte de la investigación del 27. TR Mercer y JS Mattick, “Estructura y función de rnas no
knockout humano y proporciona nuevos conocimientos sobre la variación codificantes largos en la regulación epigenética”, Biología
fenotípica humana", PLoS Genet 9, e1004030 estructural y molecular de la naturaleza. 20, 300–307 (2013).
(2013). 28. P. Miura, S. Shenker, C. Andreu-Agullo, JO Westholm y
13. H. Najmabadi, H. Hu, M. Garshasbi, T. Zemojtel, SS Abedini, W. EC Lai, "Alargamiento extenso y generalizado de 3 'utrs en el
Chen, M. Hosseini, F. Behjati, S. Haas, P. Jamali, A. Zecha, M. cerebro de los mamíferos", Genome Res 23, 812–825 (2013).
Mohseni , L. Puttmann, LN Vahid, 29. MP Moreau, SE Bruse, R. Jornsten, Y. Liu y LM Brzustowicz,
C. Jensen, LA Moheb, M. Bienek, F. Larti, I. Mueller, "Cambios cronológicos en la expresión de microrna en el cerebro
R. Weissmann, H. Darvish, K. Wrogemann, V. Hadavi, humano en desarrollo", PloS one 8, e60480
B. Lipkowitz, S. Esmaeeli-Nieh, D. Wieczorek, R. Kariminejad, SG (2013).
Firouzabadi, M. Cohen, Z. Fattahi, I. Rost, F. Moja- hedi, C. 30. S. Ning, P. Wang, J. Ye, X. Li, R. Li, Z. Zhao, X. Huo, L. Wang y F. Li,
Hertzberg, A. Dehghan, A . Rajab, MJ Banavandi, “Un mapa global para diseccionar variantes fenotípicas en
J. Hoffer, M. Falah, L. Musante, V. Kalscheuer, R. Ullmann, lincrnas humanas , ”Revista europea de genética humana: EJHG
AW Kuss, A. Tzschach, K. Kahrizi y HH Ropers, "La secuenciación (2013).
profunda revela 50 genes nuevos para los trastornos cognitivos 31. PN Perrat, S. DasGupta, J. Wang, W. Theurkauf, Z. Weng,
recesivos", Nature 478, 57–63 (2011). M. Rosbash y S. Waddell, "Heterogeneidad genética impulsada
14. G. Romeo y AH Bittles, "Consanguinity in the contem- porary por la transposición en el cerebro de Drosophila", Science 340,
world", HumHered 77, 6-9 (2014). 91–95 (2013).
15. EF Keller, El espejismo de un espacio entre la naturaleza y la crianza 32. LR Sabin, MJ Delas y GJ Hannon, "Dogma descarrilado: las muchas
(2010). influencias del arn en el genoma", Molecular cell
16. LA Pennacchio, W. Bickmore, A. Dean, MA Nobrega y G. Bejerano, 49, 783–794 (2013).
“Enhancers: five essential questions”, reseña Nature. Genética14, 33. JE Wilusz y PA Sharp, “Biología molecular. una ruta tortuosa hacia
288–295 (2013). el ARN no codificante ”, Science340, 440–441 (2013).
17. DE Dickel, A. Visel y LA Pennacchio, “Anatomía funcional de 34. RC Allen, HY Zoghbi, AB Moseley, HM Rosenblatt y JW Belmont, "La
potenciadores de mamíferos de acción a distancia”, metilación de los sitios hpaii y hhai cerca de la repetición
Transacciones filosóficas de la Royal Society of London. Serie polimórfica cag en el gen del receptor de andrógenos humanos
B, ciencias biológicas 368, 20120359 (2013). se correlaciona con la inactivación del cromosoma x", American
18. F. Cartault, P. Munier, E. Benko, I. Desguerre, S. Hanein, journal of human genetics 51, 1229 (1992).
N. Boddaert, S. Bandiera, J. Vellayoudom, P. Krejbich-Trotot, 35. M. Yandell, C. Huff, H. Hu, M. Singleton, B. Moore, J. Xing,
M. Bintner, JJ Hoarau, M. Girard, E. Genin, P. de Lonlay, LB Jorde y MG Reese, "Un buscador probabilístico de genes de
A. Fourmaintraux, M. Naville, D. Rodríguez, J. Feingold, enfermedades para genomas personales", investigación del genoma 21,
M. Renouil, A. Munnich, E. Westhof, M. Fahling, S. Ly- onnet y A. 1529-1542 (2011).
Henrion-Caude, “Mutation in a primate- 36. GB Christensen y CG Lambert, "Búsqueda de compuestos
La preimpresión de bioRxiv se publicó por primera vez en línea el 21 de enero de 2015; doi:http://dx.doi.org/10.1101/014050. El titular de los derechos de autor de esta
preimpresión (que no fue revisada por pares) es el autor / financiador, que ha otorgado a bioRxiv una licencia para mostrar la preimpresión a perpetuidad.
Está disponible bajo un Licencia internacional CC-BY 4.0.
Artículo de investigación Vol. X, No. X / Enero de 2015 / Artículo 10

efectos heterocigotos en la secuencia del exoma de sujetos no "Predecir el efecto funcional de las sustituciones de aminoácidos
relacionados ”, procedimientos de BMC 5 Suppl 9, S95 (2011). y los indeles", PLoS ONE 7, e46688 (2012).
37. K. Wang, M. Li y H. Hakonarson, "Annovar: anotación funcional de 53. H. Wang, EC Curran, TR Hinds, EH Wang y
variantes genéticas de datos de secuenciación de alto N. Zheng, "La estructura cristalina de un complejo taf1-taf7 en el
rendimiento", Nucleic Acids Res 38, e164 (2010). factor de transcripción humano iid revela un módulo de unión del
38. U. Paila, BA Chapman, R. Kirchner y AR Quinlan, “Gemini: promotor", Cell Res 24, 1433–1444 (2014).
exploración integradora de la variación genética y las anotaciones 54. T. Kotani, T. Miyake, Y. Tsukihashi, AG Hinnebusch,
del genoma”, PLoS Comput Biol 9, e1003153 (2013). Y. Nakatani, M. Kawaichi y T. Kokubo, “Identificación de segmentos
39. JM Amos-Landgraf, A. Cottle, RM Plenge, M. Friez, CE Schwartz, J. amino-terminales altamente conservados de dta fi i230 e yta fi i145
Longshore y HF Willard, "Patrones de inactivación del cromosoma que son funcionalmente intercambiables para inhibir las interacciones
X de 1.005 mujeres fenotípicamente no afectadas", revista tbp-adn in vitro y para promover el crecimiento de células de levadura
estadounidense de genética humana 79, 493–499 in vivo”, Revista de química biológica 273,
(2006). 32254–32264 (1998).
40. C. Garel, I. Cont, C. Alberti, E. Josserand, ML Moutard y H. Ducou le 55. G. Papai, PA Weil y P. Schultz, "Nuevos conocimientos sobre la
Pointe, “Biometría del cuerpo calloso en niños: datos de función del factor de transcripción tfid de estudios estructurales
referencia de imágenes del Sr.”, AJNR Am J Neu- roradiol 32, recientes", Curr Opin Genet Dev 21, 219–224 (2011).
1436-1443 (2011). 56. M. Cianfrocco, G. Kassavetis, P. Grob, J. Fang, T. Juven-Gershon, J.
41. G. Narzisi, JAO Rawe, I. Iossifov, Y.-h. Lee, Z. Wang, Kadonaga y E. Nogales, "Human tfid se une al promotor central
Y. Wu, GJ Lyon, M. Wigler y MC Schatz, “Detección precisa de adn en un estado estructural reorganizado", Cell
indeles de novo y transmitidos dentro de datos de captura de 152, 120-131.
exomas mediante microensamblaje”, bioRxiv (2013). 57. C. Bieniossek, G. Papai, C. Schaf fi tzel, F. Garzoni, M. Chail- let, E.
42. J. O'Rawe, T. Jiang, G. Sun, Y. Wu, W. Wang, J. Hu, P. Bodily, Scheer, P. Papadopoulos, L. Tora, P. Schultz y
L. Tian, H. Hakonarson, WE Johnson, Z. Wei, K. Wang y I. Berger, "La arquitectura del factor de transcripción general
GJ Lyon, "Baja concordancia de múltiples conductos de llamadas de humano tfid core complex", Nature 493, 699–702 (2013).
variantes: implicaciones prácticas para la secuenciación del exoma y 58. KL Pennington, SK Marr, GW Chirn y MT Marr 2nd, “Holo-t fi id
del genoma", Genome Med 5, 28 (2013). controla la magnitud de una ráfaga de transcripción y un ajuste
43. JA O'Rawe, H. Fang, S. Rynearson, R. Robison, ES Kir- uluta, G. fino de la transcripción”, Proc Natl Acad Sci USA 110, 7678–7683
Higgins, K. Eilbeck, MG Reese y GJ Lyon, “Integrando la medicina (2013).
de precisión en el estudio y el tratamiento clínico de una persona 59. T. Herzfeld, D. Nolte, M. Grznarova, A. Hofmann, JL Schultze y U. Muller,
con una enfermedad mental grave ”, PeerJ 1, e177 “Síndrome de distonía parkinsonista ligada al cromosoma X (xdp,
(2013). lubag): cambio de secuencia específico de la enfermedad dsc3 en
44. L. Shi, X. Zhang, R. Golhar, FG Otieno, M. He, C. Hou, taf1 / dyt3 afecta genes en el transporte vesicular y el metabolismo de
C. Kim, B. Keating, GJ Lyon, K. Wang y H. Hakonarson, la dopamina ”, HumMol Genet 22, 941–951 (2013).
"Secuenciación del genoma completo en una familia 60. S. Makino, R. Kaji, S. Ando, M. Tomizawa, K. Yasuno,
autismmultiplex", Mol Autism 4, 8 (2013). S. Goto, S. Matsumoto, MD Tabuena, E. Marañón,
45. K. Wang, C. Kim, J. Bradfield, Y. Guo, E. Toskala, FG Otieno, C. Hou, M. Dantes, LV Lee, K. Ogasawara, I. Tooyama, H. Akatsu,
K. Thomas, C. Cardinale, GJ Lyon, R. Golhar y H. Hakonarson , “La M. Nishimura y G. Tamiya, “La expresión reducida específica de
secuenciación de adn / rna de genoma completo identifica neuronas del gen taf1 se asocia con distonía-parkinsonismo
mutaciones truncadas en rbck1 en una nueva enfermedad ligado al cromosoma X”, revista estadounidense de genética
mendeliana con compromiso neuromuscular y cardíaco”, humana 80, 393–406 (2007).
Genome medicine 5, 67 (2013). 61. L. Rooms, E. Reyniers, S. Scheers, R. van Luijk, J. Wauters,
46. H. Fang, Y. Wu, G. Narzisi, JA O'Rawe, LT Jiménez Barrón, J. Rosenbaum, L. Van Aerschot, Z. Callaerts-Vegh, R. D'Hooge, G. Mengus, I.
M. Ronemus, I. Iossifov, MC Schatz y GJ Lyon, Reducir los errores de Davidson, W. Courtens y RF Kooy, “La Tbp como gen candidato
llamada de INDEL en los datos de secuenciación del exoma y del para el retraso mental en pacientes con sub- Deleciones 6q ”, Eur J
genoma completo (2014). Hum Genet 14, 1090–1096
47. HY Lam, MJ Clark, R. Chen, R. Chen, G. Natsoulis, (2006).
M. O'Huallachain, FE Dewey, L. Habegger, EA Ashley, 62. S. Hellman-Aharony, P. Smirin-Yosef, A. Halevy,
MB Gerstein, AJ Butte, HP Ji y M. Snyder, "Comparación de M. Pasmanik-Chor, A. Yeheskel, A. Har-Zahav, I. Maya,
rendimiento de plataformas de secuenciación del genoma R. Straussberg, D. Dahary, A. Haviv, M. Shohat y
completo", Nature biotechnology 30, 78–82 (2012). L. Basel-Vanagaite, “Síndrome de discapacidad intelectual del
48. RC Edgar, “Músculo: alineación de secuencia múltiple con alta cuerpo calloso delgado de microcefalia causado por taf2
precisión y alto rendimiento”, Investigación de ácidos nucleicos mutado”, Pediatr Neurol 49, 411–416 e1 (2013).
32, 1792-1797 (2004). 63. KK Abu-Amero, A. Hellani, MA Salih, A. Al Hussain,
49. S. Bhattacharya, X. Lou, P. Hwang, KR Rajashankar, M. al Obailan, G. Zidan, IA Alorainy y TM Bosley, "Anomalías
X. Wang, JA Gustafsson, RJ Fletterick, RH Jacobson y P. Webb, oftalmológicas en una deleción 6q terminal de novo", Ophthalmic
"Perspectiva estructural y funcional de taf1-taf7, un subcomplejo Genet 31, 1-11 (2010).
del factor de transcripción ii d", Proc Natl Acad Sci USA 111, 9103– 64. J. Jambaldorj, S. Makino, B. Munkhbat y G. Tamiya, "Expresión
9108 (2014). sostenida de una isoforma neuronal específica del gen taf1 en
50. IA Adzhubei, S. Schmidt, L. Peshkin, VE Ramensky, etapas de desarrollo y envejecimiento en ratones", Biochem
A. Gerasimova, P. Bork, AS Kondrashov y SR Sunyaev, "Un método Biophys Res Commun 425, 273–277 (2012).
y un servidor para predecir mutaciones sin sentido dañinas", Nat 65. W. Sako, R. Morigaki, R. Kaji, I. Tooyama, S. Okita, K. Kitazato, S.
Methods 7, 248–249 (2010). Nagahiro, AM Graybiel y S. Goto, “Identificación y localización de
51. P. Kumar, S. Henikoff y PC Ng, "Predicción de los efectos de la una neurona- isoforma específica de taf1 en cerebro de rata:
codificación de variantes no sinónimas en la función de las proteínas implicaciones para la neuropatología de la distonía dyt3,
mediante el algoritmo de tamizado", Nat Protoc 4, 1073–1081 (2009). ”Neurociencia 189, 100-107 (2011).
52. Y. Choi, GE Sims, S. Murphy, JR Miller y AP Chan, 66. KE Samocha, EB Robinson, SJ Sanders, C. Stevens,
La preimpresión de bioRxiv se publicó por primera vez en línea el 21 de enero de 2015; doi:http://dx.doi.org/10.1101/014050. El titular de los derechos de autor de esta
preimpresión (que no fue revisada por pares) es el autor / financiador, que ha otorgado a bioRxiv una licencia para mostrar la preimpresión a perpetuidad.
Está disponible bajo un Licencia internacional CC-BY 4.0.
Artículo de investigación Vol. X, No. X / Enero de 2015 / Artículo 11

A. Sabo, LM McGrath, JA Kosmicki, K. Rehnstrom, Conroe, YA Roby, H. Kulaga, RR Reed y BM Spiegelman, “Control
S. Mallick, A. Kirby, DP Wall, DG MacArthur, SB Gabriel, M. transcripcional de la determinación de preadipocitos por zfp423”,
DePristo, SM Purcell, A. Palotie, E. Boerwinkle, Nature 464, 619–623 (2010).
JD Buxbaum, EH Cook Jr, RA Gibbs, GD Schellenberg, JS Sutcliffe, 72. MW Ritzel, SY Yao, MY Huang, JF Elliott, CE Cass y JD Young,
B. Devlin, K. Roeder, BM Neale y "Clonación molecular y expresión funcional de cdnas que
MJ Daly, "Un marco para la interpretación de la mutación de novo codifican un cotransportador de nucleósido na + humano
en la enfermedad humana", Nat Genet 46, 944–950 (2014). (hcnt1)", Am J Physiol 272, C707-14 (1997).
67. M. Richards, F. Coppee, N. Thomas, A. Belayew y 73. RW Henry, V. Mittal, B. Ma, R. Kobayashi y N. Hernandez, “Snap19
M. Upadhyaya, "Distrofia muscular facioescapulohumeral (fshd): media el ensamblaje de un complejo promotor central funcional
¿un enigma desenredado?" Hum Genet131, 325–340 (snapc) compartido por las polimerasas ii de ARN y
(2012). iii, ”Genes & Development 12, 2664-2672 (1998).
68. T. Rijkers, G. Deidda, S. van Koningsbruggen, M. van Geel, 74. LT Hogben, Naturaleza y educación (1933).
RJ Lemmers, JC van Deutekom, D. Figlewicz, JE Hewitt, GW 75. WFR Weldon, "Leyes de Mendel de la herencia alternativa en los
Padberg, RR Frants y SM van der Maarel, “Frg2, un gen candidato guisantes", Biometrika 1, 228-254 (1902).
a fshd, está transcripcionalmente incrementado en la 76. J. Carayol, GD Schellenberg, B. Dombroski, C. Amiet,
diferenciación de cultivos de mioblastos primarios de pacientes B. Genin, K. Fontaine, F. Rousseau, C. Vazart, D. Cohen,
con fshd, ”J Med Genet 41, 826–836 (2004). TW Frazier, AY Hardan, G. Dawson y T. Rio Frio, “Una estrategia de
69. D. Gabellini, MR Green y R. Tupler, "Activación génica inapropiada puntuación que combina estadística y genética funcional respalda
en fshd: un complejo represor se une a una repetición un posible papel de la variación poligénica común en el autismo”,
cromosómica eliminada en el músculo distrófico", Cell 110, Front Genet 5, 33 (2014).
339–348 (2002). 77. GJ Lyon, J. O'Rawe y Wiley, "Genética humana y aspectos clínicos
70. M. Chaki, R. Airik, AK Ghosh, RH Giles, R. Chen, GG Slaats, H. Wang, de los trastornos del desarrollo neurológico", en "La genética de
TW Hurd, W. Zhou, A. Cluckey, HY Gee, los trastornos del desarrollo neurológico", K. Mitchell, ed. (2015).
G. Ramaswami, CJ Hong, BA Hamilton, I. Cervenka,
RS Ganji, V. Bryja, HH Arts, J. van Reeuwijk, MM Oud, 78. W. Huang, S. Richards, MA Carbone, D. Zhu, RR Anholt, JF Ayroles,
SJ Letteboer, R. Roepman, H. Husson, O. Ibraghimov- L. Duncan, KW Jordan, F. Lawrence,
Beskrovnaya, T. Yasunaga, G. Walz, L. Eley, JA Sayer, MM Magwire, CB Warner, K. Blankenburg, Y. Han,
B. Schermer, MC Liebau, T. Benzing, S. Le Corre, I. Drummond, S. M. Javaid, J. Jayaseelan, SN Jhangiani, D. Muzny, F. Ongeri, L.
Janssen, SJ Allen, S. Natarajan, JF O'Toole, Perales, YQ Wu, Y. Zhang, X. Zou, EA Stone, RA Gibbs y TF Mackay,
M. Attanasio, S. Saunier, C. Antignac, RK Koenekoop, “La epistasis domina el arquitectura genética de los rasgos
H. Ren, I. Lopez, A. Nayir, C. Stoetzel, H. Dollfus, R. Mas- soudi, JG cuantitativos de Drosophila ”, actas de la Academia Nacional de
Gleeson, SP Andreoli, DG Doherty, A. Lind- strad, C. Golzio, N. Ciencias de los Estados Unidos de América 109, 15553-15559
Katsanis, L Pape, EB Abboud, AA Al-Rajhi, RA Lewis, H. Omran, EY (2012).
Lee, S. Wang, 79. TF Mackay y JH Moore, "Por qué la epistasis es importante para abordar
JM Sekiguchi, R. Saunders, CA Johnson, E. Garner, la genética compleja de las enfermedades humanas", Medicina del
K. Vanselow, JS Andersen, J. Shlomai, G. Nurnberg, genoma 6, 42 (2014).
P. Nurnberg, S. Levy, A. Smogorzewska, EA Otto y 80. JS Bloom, MI Ehrenreich, WT Loo, TL Lite y
F. Hildebrandt, "La captura del exoma revela mutaciones znf423 y L. Kruglyak, "Encontrar las fuentes de heredabilidad faltante en un
cep164, que vinculan las ciliopatías renales con la señalización de la cruce de levadura", Nature 494, 234–237 (2013).
respuesta al daño del ADN", Cell 150, 533–548 (2012).
71. RK Gupta, Z. Arany, P. Seale, RJ Mepani, L. Ye, HM

También podría gustarte