Está en la página 1de 172

Gentica Molecular Humana (F.

Ciencias)-

Gentica Molecular Humana (F.Ciencias)- (2012-2013)


Presentation Goals Competencias del Ttulo Methodology Seminars Practicals Course materials Evaluation Schedule Course Contents Tema 1. Geografa del Genoma Humano 1.1 Historia y desarrollo del Proyecto Genoma Humano 1.2 Estructura del genoma humano y la variacin inter-individual 1.3 El ADN Repetitivo 1.4 El Proyecto ENCODE 1.5 El genoma mitocondrial Tema 2. El Genoma Humano en accin 2.1. La cromatina durante el ciclo celular 2.2. La secuencia influye en el estado funcional de la cromatina 2.3. Modificaciones epigenticas en la regulacin de la cromatina 2.4. Relacin entre secuencia, estructura y funcin de la cromatina: territorios Tema 3: Origen de la variacin gentica en humanos 3.1 Variacin en el ADN: polimorfismos y mutaciones 3.2. Recombinacin a nivel molecular 3.3. Mecanismos de reparacin del ADN en humanos. 3.4. Organizacin y expresin de los genes de las inmunoglobulinas Tema 4. Bsqueda de genes responsables de enfermedades 4.1. El concepto de ligamiento 4.2. Informatividad de los marcadores utilizados en estudios de ligamiento 4.3. El clculo del LOD score 4.4. Identificacin de factores genticos en enfermedades complejas. 4.5. Deteccin de variantes raras de alto riesgo Tema 5. Bases moleculares de las alteraciones citogenticas 5.1. El estudio de los cromosomas humanos 5.2. El fenmeno de no disyuncin meitica y sus implicaciones -http://www.unav.es/asignatura/genmolhumbq/ 1 de 172

Gentica Molecular Humana (F.Ciencias)-

5.3. Mutaciones debidas a repeticiones dispersas 5.4. Desrdenes genmicos Tema 6. La mutacin como causa de enfermedad 6.1. Caractersticas generales de las mutaciones 6.2. Potencial patognico de las mutaciones en el ADN codificante 6.3. El proceso de ayuste y su regulacin 6.4. Potencial patognico de mutaciones que afectan a las secuencias consenso de Tema 7. Potencial patognico de repeticiones cortas 7.1. Mutaciones en secuencias que estn repetidas en tndem 7.2. Enfermades causadas por expansin de trinucletidos 7.2.1 Neuropatas por expansiones CAG 7.2.2. Enfermedades por expansin de otros trinucletidos 7.3. Otras enfermedades por expansin de secuencias repetidas cortas Tema 8. Efectos fenotpicos de las mutaciones 8.1. Ganancia y Prdida de funcin de un gen 8.2. Fenotipos recesivos y prdida de funcin 8.3. Fenotipos dominantes por ganancia de funcin 8.4. Haploinsuficiencia y efecto dominante-negativo 8.5. Alteraciones de la impronta genmica Tema 9. Bases genticas del desarrollo embrionario 9.1. Temas centrales de la Gentica del desarrollo 9.2. El desarrollo embrionario inicial en mamferos 9.3. Mutaciones que afectan a la morfognesis en humanos Tema 10. Diagnstico de enfermedades genticas 10.1. Estrategias generales de diagnstico de enfermedades genticas 10.2. Mtodos de deteccin de mutaciones 10.3. El proceso de diagnstico indirecto de enfermedades genticas 10.4. Gentica forense Tema 11. Gentica Clnica 11.1. Gentica clnica y consejo gentico 11.2. Enfermedades de herencia autosmica 11.3. Estructura de los cromosomas sexuales humanos 11.4. Inactivacin del cromosoma X 11.5. Enfermedades de herencia ligada al X 11.6. Enfermedades por alteracin del ADN mitocondrial 11.7. Aplicacin del teorema de Bayes al clculo de riesgos genticos 11.8. Diagnstico prenatal.

-http://www.unav.es/asignatura/genmolhumbq/

2 de 172

Gentica Molecular Humana (F.Ciencias)-

Tema 12. Terapia Gnica 12.1. Componentes de un sistema de terapia gnica y vas de administracin 12.2. Naturaleza del cido nucleico teraputico 12.3. Tipos de vectores 12.3.1. Vectores virales 12.3.2. Vectores no-virales 12.4. Aplicaciones clnicas de la terapia gnica

-http://www.unav.es/asignatura/genmolhumbq/

3 de 172

Gentica Molecular Humana (F.Ciencias)-

Presentation
Human Molecular Genetics Lecturer : Prof. Francisco Javier Novo Villaverde. This course carries 6 ECTS (150 hours of personal work by the student). It is taught in the 3rd Year of the Degree in Biochemistry and as Optional couse in the Degree in Biology. Academic advising: Please make an appointment by e-mail. Room 3340 Departament of Genetics Edificio de Investigacin, 3rd Floor

-http://www.unav.es/asignatura/genmolhumbq/

4 de 172

Gentica Molecular Humana (F.Ciencias)-

Goals
Knowledge Deep understanding of the structure of the human genome and the main types of inter-individual variabillity. To interpret correctly the various combinations of epigenetic modifications of the human genome, and their relationship with its function and its structural organization within the nuclear space To be able to describe the different methodologies available for the identification of genes responsible for genetic diseases. To know the main mechanisms responsible for maintaining the integrity of the genome, and how they are altered in human pathology. To be able to explain the molecular basis of genetic desorders, and to cite illustrative examples To describe current methodologies for the detection of mutations and genetic alterations responsible for human disease. To be able to explain the process of genetic counselling and to apply Bayes theorem to predict recurrence risk. To describe the main components of a gene therapy system, as well as the limitations and applications of various delivery vectors. Skills The ability to use clear-cut criteria to identify a gene as causative of a genetic disease. The ability to predict the pathogenic potential of different genetic alterations, at the cellular, organismal and familial level. The ability to choose the most apropriate methodology to detect the various types of genetic alterations resonsible for human disease. The ability to analyze a family tree and to define the mode of inheritance of a trait or disease. The ability to calculate the risk of recurrence of a genetic disease, using Bayes' theorem.

-http://www.unav.es/asignatura/genmolhumbq/

5 de 172

Gentica Molecular Humana (F.Ciencias)-

Competencias del Ttulo


Objetivos generales del ttulo de graduado en Bioqumica por la Universidad de Navarra. Formar profesionales: Que dispongan de las herramientas conceptuales, manuales y tcnicas para poder entender y manejar desde el punto de vista molecular los procesos de transformacin que los seres vivos llevan a cabo para realizar sus funciones propias tanto energticas como funcionales. Con un slido conocimiento de la Bioqumica y la Biologa Molecular que los capacite para el desarrollo de su actividad profesional futura en investigacin biomdica bsica, clnica y de tecnologa molecular, docencia, divulgacin cientfica, gestin y otras labores relacionadas con esta ciencia. Con inquietud cientfica y capacidad de desenvolverse en mbitos nacionales e internacionales, que les permita participar en una investigacin traslacional en los diversos mbitos de la Bioqumica y de la Biomedicina. Dotados de una formacin humana y cultural slida, que les ayude en el desarrollo de su personalidad y en el logro de actitudes y capacidades para realizar un servicio eficaz a la sociedad con honradez, responsabilidad, capacidad de trabajo en equipo, espritu solidario y de servicio. Objetivos generales De acuerdo con el RD 1393/2007 (anexo I, artculo 3.2), y en armona con los descriptores de Dubln, se garantizarn como mnimo las siguientes competencias bsicas y aquellas otras que figuren en el futuro Marco Espaol de Cualificaciones para la Educacin Superior, MECES: I. Que los estudiantes hayan demostrado poseer y comprender conocimientos en un rea de estudio que parte de la base de la educacin secundaria general, y se suele encontrar a un nivel, que si bien se apoya en libros de texto avanzados, incluye tambin algunos aspectos que implican conocimientos procedentes de la vanguardia de su campo de estudio II. Que los estudiantes sepan aplicar los conocimientos a su trabajo o vocacin de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboracin y defensa de argumentos y la resolucin de problemas dentro de su rea de estudio III. Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su rea de estudio) para emitir juicios que incluyan una reflexin sobre temas relevantes de ndole social, cientfica o tica IV. Que los estudiantes puedan trasmitir informacin, ideas y soluciones a un pblico tanto especializado como no especializado V. Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonoma. Competencias Competencias especficas (habilidades)

-http://www.unav.es/asignatura/genmolhumbq/

6 de 172

Gentica Molecular Humana (F.Ciencias)-

En consonancia con las competencias generales definidas en el artculo 3.2 del RD, se enumeran a continuacin las competencias que deber adquirir el alumno para obtener el ttulo de Graduado en Bioqumica, relacionndolas con los respectivos objetivos generales de dicho RD enumerados en el apartado anterior. CEH1 Plantear y resolver problemas cualitativos y cuantitativos en Bioqumica a travs de hiptesis cientficas que puedan examinarse empricamente y que se basen en los conocimientos y teoras disponibles (competencias I, II, III del RD). CEH2 Planificar, desarrollar y evaluar experimentos y utilizar en el laboratorio las tcnicas e instrumentos propios de la experimentacin en Bioqumica, Biologa y Biologa Molecular con seguridad (competencias I, II del RD). CEH3 Utilizar las matemticas, la estadstica y la informtica para obtener, analizar e interpretar datos y para elaborar modelos de los sistemas y procesos bioqumicos (competencias I, II, III del RD). CEH4 Aplicar los conocimientos, conceptos y teoras de las Biociencias moleculares y de la Biomedicina a la prctica (competencia II del RD). CEH5 Actualizar autnoma y permanentemente los conocimientos e integrar los nuevos descubrimientos en su contexto adecuado (competencia V del RD). CEH6 Comprender, analizar crticamente, discutir, escribir y presentar argumentos cientficos, tanto en castellano como en ingls, como lengua de referencia en el mbito cientfico (competencia IV del RD). CEH7 Interpretar la Bioqumica en el contexto histrico y social de los descubrimientos cientficos (competencia II del RD). CEH8 Aplicar en la profesin y en la vida cotidiana la tica desde una perspectiva cientfica (competencia III del RD). Competencias especficas (Conocimientos) A continuacin se describen las competencias especficas que debe adquirir el alumno, en relacin con los diferentes bloques temticos o mdulos descritos en el apartado 5 de la presente Memoria: CEC1 Conocer bien los fundamentos de la Qumica relevantes para entender los procesos bioqumicos y adquirir destreza en las operaciones experimentales bsicas para trabajar de forma segura y eficaz en un laboratorio (mdulo I del punto 5 de la memoria). CEC2 Comprender bien las diferencias entre los tipos mayoritarios de organismos vivos, desde microorganismos a organismos superiores. Conocer bien la estructura y funcin de la clula procariota y eucariota y de los tejidos, rganos y sistemas animales y humanos, as como la estructura, variacin, funcin y transmisin del material hereditario (mdulo II del punto 5 de la memoria). CEC3 Comprender las bases de la Fsica, Matemticas e Informtica, relevantes para entender los procesos biolgicos y bioqumicos, as como para poder aplicar con criterio las tcnicas de observacin, medida y experimentacin propias de las Biociencias moleculares (mdulo III del punto 5 de la memoria). CEC4 Conocer bien las diferentes metodologas instrumentales cuantitativas utilizadas en Bioqumica y Biologa Molecular, as como las nuevas disciplinas que constituyen la Biologa Molecular de Sistemas y que requieren el manejo de datos masivos (mdulo IV del punto 5 de la memoria).

-http://www.unav.es/asignatura/genmolhumbq/

7 de 172

Gentica Molecular Humana (F.Ciencias)-

CEC5 Comprender la estructura y funcin de las bio/macromolculas, los principales procesos de su transformacin y los mecanismos moleculares por los que se regulan, as como los principios que rigen los intercambios de materia y energa con el medio. Conocer las alteraciones moleculares de estos procesos en situaciones patolgicas. Conocer las bases y la utilidad de la tecnologa del DNA recombinante (mdulo V del punto 5 de la memoria). CEC6 Comprender bien la importancia y complejidad de la regulacin e integracin de las diversas funciones del organismo para su aplicacin en Biomedicina. Adquirir destreza en la interpretacin de las alteraciones moleculares causantes de patologa humana y de los resultados de anlisis clnicos en sus diferentes modalidades (mdulo VI ). CEC7 Conocer los fundamentos de la Deontologa profesional y desarrollar una tica profesional desde la perspectiva del cientfico, as como una visin integrada de las relaciones humanas. Conocer los principales temas de debate y retos futuros de la Bioqumica y de la Biologa Molecular, su dimensin social y econmica as como sus aplicaciones prcticas (mdulo VII del punto 5 de la memoria). CEC8 Integrar las competencias, asociadas al ttulo, (especficas de mdulo y transversales), a travs del desarrollo, presentacin y defensa de un Proyecto relacionado con su perfil profesional (mdulo VIII del punto 5 de la memoria). CEC9 Profundizar en aspectos relacionados con las Ciencias Biomdicas que complementen la formacin (mdulo IX del punto 5 de la memoria). Competencias transversales: CT1 Seguridad en el trabajo: Aprender a trabajar de forma adecuada en un laboratorio con material qumico y/o biolgico, incluyendo seguridad, manipulacin y eliminacin de residuos, registro anotado de actividades e interpretacin de los resultados. CT2 Transmisin del conocimiento Desarrollar habilidades de comunicacin escrita y oral, fundamentalmente sobre temas de Biomedicina molecular. Saber expresarse con claridad en la redaccin de escritos o informes y en conversaciones o debates, con un estilo y lenguaje adecuado al interlocutor, as como hablar en pblico acompaando el mensaje oral de los oportunos recurso no verbales (gesticulacin, postura, etc) en distintas situaciones laborales (clases, tutoras, reuniones, exposiciones de resultados de investigacin,...). Tener capacidad de escucha. CT3 Anlisis y sntesis Desarrollar capacidad de anlisis y sntesis. Ser capaz de planificar y organizar el tiempo, de ordenar actividades o tareas a realizar segn la importancia otorgada, as como priorizar demandas, establecer plazos, organizar agenda y horarios para realizar tareas sin malgastar tiempo. Ser capaz de gestionar la propia formacin continua, actualizar el conocimiento de las innovaciones del mbito cientfico y saber analizar las tendencias de futuro. CT4 Visin integrada y razonamiento crtico Pensar de una forma integrada y abordar los problemas desde diferentes perspectivas, razonamiento crtico. Conseguir la capacidad de aportar soluciones a problemas en el mbito cientfico: conocer las situaciones ms comunes, saber clarificar el problema, analizar las causas e identificar alternativas de solucin. CT5 Trabajo en un equipo de carcter interdisciplinar: Capacidad de trabajar en equipo, saber qu es trabajar en equipo y diferenciarlo de trabajar en grupo. Saber seleccionar y elegir la metodologa de trabajo y distribucin de funciones, as como ser capaz de participar como miembro de un equipo en reuniones de trabajo multidisciplinar: saber escuchar y saber hacer uso de la palabra oportunamente con intervenciones positivas y constructivas.

-http://www.unav.es/asignatura/genmolhumbq/

8 de 172

Gentica Molecular Humana (F.Ciencias)-

CT6 Iniciativa y aprendizaje autnomo: Fomentar el sentido de la responsabilidad hacia la propia vida y los estudios, aportando conocimiento sobre el propio estilo atribucional, estilo motivacional y estrategias de aprendizaje. Aprender a buscar informacin, evaluar informacin, as como analizar, sintetizar, resumir, comunicar, citar y presentar trabajos. CT7 Afn de superacin: Desarrollar un afn constante de superacin personal y profesional, de resolucin de problemas, de toma de decisiones, de gestin y liderazgo. Las competencias transversales se trabajarn desde el principio de los estudios, con el fin de que crezcan progresivamente a lo largo de los cuatro aos, debido a las sinergias que se irn estableciendo entre las diferentes actividades de aprendizaje Las competencias descritas, especficas y transversales, sobre las que se ha construido el Grado en Bioqumica, consideran la concepcin integral del perfil acadmico del bioqumico, as como sus perfiles profesionales (RD 1163/2002, de 8 de noviembre; ORDEN 274/2004, de 5 de febrero y ORDEN 3252/2006, de 2 de octubre), y se relacionan con los principales mbitos del ejercicio profesional. La elaboracin de dichas competencias se ha llevado a cabo de acuerdo con lo indicado en el RD 1393/2007, de 30 de octubre, y se han seguido las orientaciones del Libro Blanco de las Titulaciones de Grado y Posgrado en Bioqumica y Biotecnologa, de la Conferencia de Coordinadores de Bioqumica de las Universidades Espaolas, as como de diferentes redes y grupos de trabajo nacionales y europeos. Los objetivos generales se han definido teniendo en cuenta los derechos fundamentales y de oportunidad entre hombres y mujeres, los principios de igualdad de oportunidades y accesibilidad universal de las personas con discapacidad y los valores propios de una cultura de paz y valores democrticos. La Universidad de Navarra ha asumido activamente lo dispuesto por la LEY 51/2003, de 2 de diciembre, sobre dichos aspectos, y para ello se llevan a cabo actuaciones en las siguientes reas: accesibilidad, asesoramiento y ayudas tcnicas, sensibilizacin y formacin y voluntariado universitario.

-http://www.unav.es/asignatura/genmolhumbq/

9 de 172

Gentica Molecular Humana (F.Ciencias)-

Methodology
The student will achieve the proposed goals by: the study of the materials included in the textbook active participation in lectures and seminars laboratory practicals the preparation of evaluation tests Distribution of time:

ECTS

hours

Presential

Lectures

1.20

30

Seminars

0.40

10

Laboratory practicals

0.60

15

Exams

0.20

Subtotal

2.40

60

Non-presential

Writing up practicals report

0.40

10

Preparation of seminars

0.40

10

Personal or group study

2.80

70

-http://www.unav.es/asignatura/genmolhumbq/

10 de 172

Gentica Molecular Humana (F.Ciencias)-

Subtotal

3.60

90

TOTAL

150

-http://www.unav.es/asignatura/genmolhumbq/

11 de 172

Gentica Molecular Humana (F.Ciencias)-

Seminars
During the course, SIX scientific papers relevant to the content of the lectures will be discussed in the classroom. Additionally, FOUR seminars will be presented by students, individually or in pairs. These will touch upon methodological issues, focusing on technologies that are relevant to the content of the course: 1. 2. 3. 4. Chromatin Immunoprecipitation: Arantxa Carrasco and Oihana Iturbide Next-generation DNA sequencing: Jon Erdozain Ibero and Ane Miren Sagardia DNA methylation assays: June Garca and Daniel Schulz Microarrays for analysis of gene expression: Helena Rodrguez & Laura Rpodas

Students who wish to give a seminar must request it by sending an email to Prof. Novo. They will be assigned on a first-come-first-served basis, and will be evaluated adding up to one point to the final mark of the course.

-http://www.unav.es/asignatura/genmolhumbq/

12 de 172

Gentica Molecular Humana (F.Ciencias)-

Practicals
Students will perform some diagnostic tests for genetic diseases, in order to see how molecular biology techniques are applied in the clinical setting. First, students will detect the mutation responsible for hereditary hemochromatosis, by PCR followed by digestion with a restriction enzyme. This will illustrate how direct detection of mutations is applied to family studies. In parallel to the above, students will use the same methodology to genotype a polymorphic marker in linkage with the gene responsible for cystic fibrosis, in a large CF pedigree. This will illustrate the application of gene tracking to ascertain the status of every member of the pedigree, without the need to directly analyze mutations in the causative gene.

-http://www.unav.es/asignatura/genmolhumbq/

13 de 172

Gentica Molecular Humana (F.Ciencias)-

Course materials
All materials (text, images and videos) are available in this web. You can also find most of the videos in our YouTube channel. Some on-line seminars are available in The Biomedical & Life Sciences Collection. In Prof. Novo's blog (a100ciacierta) you will find entries about recent scientific papers touching upon some aspects of this Course. It is also IMPORTANT to check this Course's twitter account to keep updated on news and comments, or check our Facebook. Suggested reading: (Find these books in the Library catalog) T.Strachan, A.P. Read: Human Molecular Genetics, 4th edition. Garland Science, 2011. Peter Sudbery: Gentica Molecular Humana. Ed. Pearson, 2004. It will also be useful to look up the Glosario of genetic terms prepared by Prof. Novo.

-http://www.unav.es/asignatura/genmolhumbq/

14 de 172

Gentica Molecular Humana (F.Ciencias)-

Evaluation
The final mark of this course will be the result of: The mark obtained in the practicals: laboratory practicals will be evaluated according to the results obtained and the final report, up to 2 points. The marks obtained in continous evaluation: short tests will be given throughout the duration of the course, up to 3 points. The mark obtained in the final test, up to 5 points. Students who have failed the course in the previous year, are not required to repeat the practicals. In this case, the final test carries up to 7 points of the final mark, the other 3 points corresponding to the continous evaluation. For those students who do not pass this course in May, the final mark in June will come entirely from the written test. A model multiple-choice test is available here for self-evaluation.

-http://www.unav.es/asignatura/genmolhumbq/

15 de 172

Gentica Molecular Humana (F.Ciencias)-

Schedule
Timetable in 2012-2013: Monday, Thursday and Friday, in the afternoon. PREDICTED plan of lectures (subject to change): Class 1 Introduction. Chapter 1 Class 2 Chapter 1 Class 3 Chapter 1 Class 4 Chapter 2 Class 5 Chapter 2 Class 6 (17 Sept) EVALUATION 1 Class 7 (20 Sept) Chapter 3 Class 8 (21 Sept) SEMINAR 1 Class 9 (24 Sept) Chapter 3 Class 10 (27 Sept) Chapter 4 Class 11 (28 Sept) Student's Seminar 1 Class 12 (1 Oct) Chapter 4 Class 13 (4 Oct) Student's Seminar 2 Class 14 (5 Oct) Chapter 5 Class 15 (8 Oct) Chapter 5 Class 16 (11 Oct) EVALUATION 2 Class 17 (11 Oct) Chapter 6 Class 18 (15 Oct) Student's Seminar 3 Class 19 (18 Oct) SEMINAR 2 Class 20 (18 Oct) Chapter 6 Class 21 (19 Oct) Chapter 7 Class 22 (22 Oct) Chapter 7 Class 23 (25 Oct) Student's Seminar 4 Class 24 (25 Oct) Chapter 8 Class 25 (26 Oct) SEMINAR 3 Class 26 (29 Oct) Chapter 8 Class 27 (2 Nov) SEMINAR 4 Class 28 (5 Nov) EVALUATION 3 Class 29 (8 Nov) Chapter 9 Class 30 (8 Nov) SEMINAR 5 Class 31 (9 Nov) Chapter 9 Class 32 (12 Nov) Chapter 10 Class 33 (16 Nov) Chapter 10 Class 34 (19 Nov) EVALUATION 4 Class 35 (22 Nov) Chapter 11 Class 36 (22 Nov) Chapter 11 Class 37 (23 Nov) Chapter 12 Class 38 (26 Nov) Chapter 12 Class 39 (30 Nov) EVALUATION 5 TOTAL presential 39 hours

-http://www.unav.es/asignatura/genmolhumbq/

16 de 172

Gentica Molecular Humana (F.Ciencias)-

Course Contents
(Contents are in Spanish) Chapter 1. The landscape of the human genome. Descargar en pdf Chapter 2. The human genome in action. Descargar en pdf Chapter 3. Origin of genetic variation in humans. Descargar en pdf Chapter 4. How to identify genes responsible for human disease. Descargar en pdf Chapter 5. The molecular basis of cytogenetic aberrations. Descargar en pdf Chapter 6. Mutation as the cause of disease. Descargar en pdf Chapter 7. Pathogenic potential of short repeats. Descargar en pdf Chapter 8. Phenotypic effects of mutations. Descargar en pdf Chapter 9. Genetic basis of human development. Descargar en pdf Chapter 10. Diagnosis of genetic disease. Descargar en pdf Chapter 11. Clinical Genetics. Descargar en pdf Chapter 12. Gene therapy. Descargar en pdf

Tema 1. Geografa del Genoma Humano


1.1 Historia y desarrollo del Proyecto Genoma Humano 1.2 Estructura del Genoma Humano 1.3 El ADN repetitivo 1.4 El Proyecto ENCODE 1.5 El genoma mitocondrial

1.1 Historia y desarrollo del Proyecto Genoma Humano


En 1986, el Departamento de Energa de los Estados Unidos lider la Iniciativa del Genoma Humano, tras varios aos de contactos y reuniones, y puso en marcha el mayor proyecto biomdico de la historia con el objetivo final de conseguir la secuencia completa del genoma humano en el ao 2005. El Proyecto Genoma Humano comenz oficialmente en Estados Unidos en octubre de 1990, siguiendo un plan a cinco aos para desarrollar las herramientas que permitiesen conseguir esa meta. Estas herramientas eran principalmente la construccin de mapas genticos (de ligamiento) y de mapas fsicos (de clones) de todo el genoma

-http://www.unav.es/asignatura/genmolhumbq/

17 de 172

Gentica Molecular Humana (F.Ciencias)-

humano, al tiempo que se desarrollaba la tecnologa necesaria para realizar secuenciacin a gran escala. La estrategia general consisti en construir mapas genticos y fsicos e integrarlos, para aumentar cada vez ms en resolucin desde el cromosoma hasta la secuencia de ADN. El concepto de ligamiento gentico y la forma en que se cuantifica son objeto del Tema 4. Si el lector no est familiarizado con la construccin de mapas de ligamiento, se aconseja estudiar ese Tema antes de seguir leyendo. Los mapas genticos describen la organizacin cromosmica de caracteres (un rasgo fenotpico, una enfermedad) o de marcadores genticos, mediante estudios de ligamiento gentico. Los primeros xitos de mapeo gentico en humanos fueron los que consiguieron asociar un carcter a un cromosoma, como por ejemplo el ligamiento del daltonismo al cromosoma X, o ligamiento del grupo sanguneo Duffy al cromosoma 1. Este ltimo fue el primer rasgo hereditario mapeado a un autosoma (en 1968) gracias a que, en una familia concreta, se observ que este rasgo se heredaba junto con un heteromorfismo del cromosoma 1. Esto puso de manifiesto la utilidad de contar con marcadores de ADN que estuviesen distribuidos por todo el genoma, fuesen fciles de estudiar en un nmero alto de individuos y tuviesen una posicin cromosmica conocida, ya que as se podran realizar estudios de ligamiento gentico en familias que padecen una determinada enfermedad gentica para determinar si esa enfermedad est en ligamiento con alguno de estos marcadores, lo que facilitara la identificacin del gen responsable. Figura 1.1: Como se explica en este video, la estrategia seguida por el Consorcio Internacional para la secuenciacin del genoma humano parti de la construccin de mapas genticos (de ligamiento) de todo el genoma; con esta informacin se crearon mapas fsicos que permitieron identificar los clones que cubren regiones especficas del genoma, para ordenarlos y secuenciarlos. Los tipos de marcadores ms utilizados en estudios de ligamiento en Gentica Humana son: Polimorfismos de Longitud de Fragmentos de Restriccin (en ingls, las siglas son RFLP). Un RFLP es un polimorfismo originado por un cambio de un nucletido que crea o destruye una diana de restriccin, de manera que encontraremos alelos con esa diana y alelos sin ella. Por tanto, un RFLP es por definicin un marcador biallico (slo hay dos alelos posibles). La presencia o ausencia de esa diana hace que los fragmentos originados por la digestin del ADN con esa enzima de restriccin sean de distinto tamao. En general, un polimorfismo tipo RFLP puede detectarse de dos modos: a) digerir directamente el ADN genmico, separar los fragmentos en un gel, hacer un Southern blot e hibridarlo con una sonda especfica para detectar cada uno de los fragmentos polimrficos; b) amplificar la regin del polimorfismo mediante PCR y digerir directamente el producto de PCR para separar los fragmentos en un gel. Los marcadores tipo VNTR (acrnimo ingls de Nmero Variable de Repeticiones en Tndem") son polimorfismos originados por pequeas secuencias de ADN que estn repetidos en tndem. El nmero de repeticiones es diferente en los distintos individuos de la poblacin, por lo que en principio pueden existir ms de dos alelos distintos para cada marcador (aunque cada individuo slo lleve dos alelos, en la poblacin general pueden existir ms). Los marcadores en los que la secuencia repetida es corta (2 a 4 nucletidos) se denominan tambin microsatlites STR (Short Tandem Repeats", Repeticiones Cortas en Tandem), y estn homogneamente distribuidos por todo el genoma. Los marcadores en los que la secuencia repetida es ms larga (decenas a cientos de nucletidos) se denominan minisatlites, y han sido muy importantes en los estudios de gentica forense ya que permiten establecer una huella gentica nica para cada individuo. Los minisatlites son ms abundantes hacia las regiones telomricas de los cromosomas, y -debido a su tamao- en principio deben detectarse mediante Southern blot e hibridacin. En cambio, los marcadores de tipo microsatlite pueden detectarse mediante PCR y estn distribuidos uniformemente por el genoma, por lo que su anlisis es ms rpido y sencillo y proporcionan mayor informacin. -http://www.unav.es/asignatura/genmolhumbq/ 18 de 172

Gentica Molecular Humana (F.Ciencias)-

Los SNP (pronunciado snip) son polimorfismos de un solo nucletido (Single Nucleotide P olymorphisms) en los que el simple cambio de un nucletido en una secuencia genmica da lugar a distintos alelos. Lgicamente, para cada posicin slo puede haber cuatro alelos como mximo (A, C, G T), aunque lo habitual es que un SNP tenga dos alelos en la poblacin general. Se estima que, como promedio, hay al menos un SNP cada 500-1.000 pares de bases, de los cuales un porcentaje importante son polimorfismos codificantes (es decir, cambian un aminocido en la protena codificada por el gen) y constituyen la principal fuente de variabilidad gentica inter-individual, puesto que dos individuos cualesquiera tienen alrededor de un 0,1% de sus nucletidos distintos. La gran ventaja de los SNP sobre los dems tipos de marcadores, adems de ser tan abundantes y estar muy uniformemente distribuidos por todo el genoma humano, es la posibilidad de analizarlos mediante mtodos automatizables a gran escala, como los microarrays, de manera que se pueden determinar cientos miles de SNPs a la vez en un mismo experimento. Figura 1.2: En este video se explican marcadores de tipo RFLP y Microsatlite, utilizados en la construccin de mapas de ligamiento durante el Proyecto Genoma Humano. Este otro video muestra los marcadores de tipo SNP. La siguiente tabla resume las principales caractersticas de estostipos de marcadores:

MARCADOR

ABUNDANCIA EN EL GENOMA HUMANO

CARACTERSTICAS

RFLP

>105

Dos alelos Deteccin por Southern PCR Permite localizacin fsica

Minisatlites

>104

Multiallicos Deteccin por Southern Se acumulan en subtelmeros

Microsatlites >105

Multiallicos Deteccin por PCR Distribucin homognea

SNP

>106

Mximo 4 alelos (habitualmente 2) Automatizables

-http://www.unav.es/asignatura/genmolhumbq/

19 de 172

Gentica Molecular Humana (F.Ciencias)-

El objetivo inicial del PROYECTO GENOMA era crear un mapa gentico (de ligamiento) con marcadores distribuidos por todo el genoma con una distancia media de 1 cM entre marcadores. Los mapas genticos se basaron en un primer mapa publicado en 1987, hecho con 393 marcadores tipo RFLP agrupados en 23 grupos de ligamiento, con una distancia media entre marcadores superior a 10 cM. El primer mapa gentico de todo el genoma fue el realizado por un centro de investigacin francs llamado Gnthon en 1992, e inclua 803 marcadores tipo microsatlite. Los mapas fsicos, en cambio, reconstruyen la estructura de un segmento de ADN, determinando los tipos y orden relativo de las distintas secuencias que lo componen, sus tamaos, y las distancias entre ellas. Para la construccin de mapas fsicos se utiliza un tipo de marcador distinto, que veremos ms adelante. Lgicamente, el mapa fsico de mayor resolucin posible es la secuencia completa de ese segmento (resolucin de 1 nucletido), pero tambin es posible realizar mapas de menor resolucin (un ejemplo, mapas de restriccin). El tipo de marcador utilizado en la creacin de mapas fsicos se denomin STS (Sequence-Tagged Site = Sitio Etiquetado por su Secuencia). Un STS es un pequeo fragmento de ADN (unos pocos cientos de pares de bases) de secuencia y localizacin genmica conocidas, fcilmente amplificable mediante PCR. Durante aos se haban identificado un buen nmero de marcadores STS, mediante la secuenciacin parcial de clones previamente mapeados por otros mtodos. Adems, los microsatlites utilizados en la creacin de mapas de ligamiento tambin pueden convertirse fcilmente en STS, leyendo la secuencia que flanquea las repeticiones del microsatlite. Gracias a esto, hoy contamos con una lista ordenada de STS que estn distribuidos por todo el genoma humano, cuya secuencia y condiciones de amplificacin mediante PCR son fcilmente accesibles a todo investigador. El PROYECTO GENOMA se propuso inicialmente conseguir mapas de marcadores tipo STS distribuidos por todo el genoma y con una distancia media entre marcadores en torno a 0.1 Mb (es decir, 100kb). Utilizando estos marcadores STS, se pudieron construir mapas fsicos, es decir mapas compuestos por clones de bibliotecas genmicas, capaces de albergar insertos de gran tamao. Existen distintos vectores de este tipo, entre los que destacan los vectores tipo YAC (Yeast Artificial Chromosome), PAC (P1-phage Artificial chromosome) y BAC (Bacterial Artificial Chromosome). Cada uno de estos vectores de clonacin tiene caractersticas especficas, ventajas e inconvenientes. En concreto, los YAC son los vectores que permiten albergar un mayor tamao de inserto (hasta 2 Megabases), pero son bastante inestables (tienden a perder fragmentos del inserto cuando se replican) y tienen un porcentaje relativamente alto de clones quimricos (es decir, clones en los que el inserto est en realidad formado por dos fragmentos procedentes de cromosomas distintos). Los PACs y BACs, en cambio, slo permiten clonar insertos de unas 100 a 150 kilobases de tamao (por lo que son necesarios muchos ms clones para cubrir completamente un segmento genmico determinado), pero en cambio son muy estables y el porcentaje de quimerismo es muy pequeo. Aunque los YACs han sido el vector principalmente utilizado al principio de los aos 90, hoy en da han sido desplazados por PACs y BACs. La Figura 1.3 explica, en este video, la utilizacin de marcadores STS para crear un contig de clones que cubran una regin del genoma. Los primeros mapas fsicos del genoma humano estaban compuestos por contigs de YACs que cubran parcialmente el genoma humano, siendo el mejor ejemplo el mapa creado tambin por Gnthon en 1993. Este mapa supuso un avance enorme porque —aunque no cubra muchas regiones genmicas— sirvi como punto de partida para elaborar mapas ms completos con vectores ms fiables y manejables, como BACs y PACs. El PROYECTO GENOMA hizo una revisin de sus objetivos en 1993, teniendo en cuenta los progresos realizados en los 3 aos anteriores, y estableci nuevas metas para los siguientes 5 aos (1993-1998). En resumen, estos nuevos objetivos fueron: conseguir un mapa gentico con resolucin de 2 a 5 cM entre marcadores. conseguir un mapa fsico con STS espaciados regularmente cada 0.1 Mb (lo que significaba identificar y localizar la posicin de —como mnimo— unos 30.000 STS). -http://www.unav.es/asignatura/genmolhumbq/ 20 de 172

Gentica Molecular Humana (F.Ciencias)-

desarrollar nuevas tecnologas para la identificacin de genes a partir de ADN genmico. desarrollar nuevas tecnologas de secuenciacin y completar 80 Mb de secuencia confirmada para todos los organismos que estaban siendo secuenciados por los distintos proyectos. Potenciar la genmica comparada: completar las secuencias de E. coli, S. cerevisiae y C. elegans, y comenzar los proyectos de secuenciacin de los genomas de Drosophila y de ratn. Cuando en 1998 se revisaron los avances realizados en esos cinco aos, con el fin de disear un nuevo plan quinquenal, los resultados haban sido realmente prometedores: en Septiembre de 1994 se public un mapa gentico de todo el genoma humano integrado por 4.000 marcadores tipo microsatlite y 1.800 marcadores tipo RFLP, con una distancia media entre marcadores de 0.7 cM. Esto superaba en ms de 3 aos el objetivo propuesto inicialmente. Por su parte, Gnthon public en 1995 otro mapa fsico de YACs que estaba formado por 255 contigs (con un tamao medio de 10 Mb cada contig) y cubra el 75% del genoma humano. Durante esos aos se continuaron desarrollando nuevos marcadores tipo STS, hasta llegar en 1998 a un mapa que contena 52.000 STS (casi el doble de los inicialmente propuestos). Por lo que respecta a la secuenciacin, en octubre de 1998 se haba obtenido un total de 180 Mb de secuencia del genoma humano (6% del total), adems de 111 Mb de secuencia de otros organismos, muy por encima de lo previsto en el plan 1993-1998. Adems, se haba completado la secuencia de E. coli y de S. cerevisiae, ste ltimo el primer organismo eucariota en ser secuenciado totalmente. Esto fue posible gracias a importantes avances en la tecnologa de secuenciacin, que se hizo progresivamente ms rpida, fiable y barata. Posteriormente, en diciembre de 1998, se complet la secuencia de C. elegans, el primer organismo multicelular secuenciado en su totalidad con un genoma de unas 97 Mb. Por tanto, en 1998 el PROYECTO GENOMA se fij un nuevo plan de objetivos hasta el ao 2003, en el que se incluan 6 metas concretas: Completar la secuencia del genoma humano para 2003 (ao que coincida con el 50 aniversario del descubrimiento de la doble hlice por Watson y Crick), creando un primer borrador de trabajo en el 2001. Este objetivo se aceler enormemente por la competencia de la empresa privada Celera Genomics (tambin iniciativa de Craig Venter), que se propuso secuenciar todo el genoma humano, utilizando una estrategia distinta al consorcio internacional del PROYECTO GENOMA, con el fin de obtener la propiedad intelectual y poder explotar esa informacin con fines comerciales. A pesar de los problemas suscitados inicialmente por la fuerte competencia entre ambos proyectos, el 26 de junio de 2000 se produjo el anuncio oficial de que se haba alcanzado un primer borrador del 87% de la secuencia del genoma humano. Este primer borrador fue publicado el 15 de Febrero de 2001 en las revistas Nature (el mapa del Consorcio Internacional) y Science (el mapa de Celera Genomics). Figura 1.4: el video muestra el proceso general de utilizado por el Consorcio Internacional para la secuenciacin del Genoma Humano. Continuar el desarrollo y la innovacin de las tecnologas de secuenciacin. Como ya se ha comentado, ste ha sido un factor determinante en el avance del PROYECTO GENOMA. Estudiar la variacin en el genoma humano. Como hemos visto, los SNP se encuentran en el genoma humano a razn de 1 por cada kilobase, como promedio, y representan las diferencias genticas entre individuos de una misma especie. Como se ver en el Captulo 11, la creacin de mapas densos de SNP permitir llevar a cabo estudios de asociacin para detectar los genes que estn implicados en enfermedades complejas, debidas a alteraciones en muchos genes —siendo la contribucin de cada gen a la enfermedad pequea― y, por tanto, difciles de detectar por otros mtodos de ligamiento paramtrico. Desarrollar tecnologa para la genmica funcional, es decir, identificar todos los genes y determinar cul es la funcin de cada gen. La gran revolucin en las estrategias de identificacin de regiones -http://www.unav.es/asignatura/genmolhumbq/ 21 de 172

Gentica Molecular Humana (F.Ciencias)-

codificantes (es decir, genes) comenz con la idea de Craig Venter de secuenciar al azar y a gran escala fragmentos de ADNc de bibliotecas obtenidas a partir de diversos tejidos. Estos fragmentos de secuencia se denominaron "Etiquetas de Secuencia Expresada" (EST, Expressed Sequence Tags), ya que —en el fondo— cada una representa un fragmento de un ARNm (una secuencia expresada en un tejido concreto). En pocos aos, la base de datos de EST creci de manera exponencial, con cientos de miles de secuencias expresadas procedentes de distintas bibliotecas de ADNc. Como algunos de estos EST proceden de un mismo ARNm, se cre una coleccin no redundante llamada UNIGENE que agrupa los EST por familias, siemdo cada familia representativa de un nico ARNm. Poco despus comenzaron tambin proyectos internacionales para mapear secuencias de UNIGENE, de manera que en 1994 se public un primer mapa con la localizacin de 16.000 EST correspondientes a genes distintos, y en 1998 se public un segundo mapa de 41.664 EST, que representaban 30.181 genes distintos. Cuando se conozca el catlogo completo de genes de nuestro genoma, ser necesario estudiar la expresin de cada gen en distintos tejidos y en distintas situaciones fisiolgicas y patolgicas, en respuesta a distintos factores ambientales, etc. Lgicamente, esto ser el objeto de la investigacin biomdica de buena parte del siglo XXI. Genmica Comparada. El anlisis comparado de los genomas de varias especies es de gran utilidad para identificar mecanismos biolgicos conservados durante la evolucin (por lo que son especialmente importantes), estructura y funcin de genes ortlogos, etc. Aunque el plan para 1998-2003 se propuso conseguir la secuencia completa del genoma de Drosophila para el ao 2002, esta meta se cumpli en abril del ao 2000 gracias a la colaboracin de laboratorios y Universidades con Celera Genomics, descifrando unas 120 Mb de secuencia que comprenden la prctica totalidad de la eucromatina de este insecto. El nuevo gran reto ahora es conseguir la secuencia completa del genoma de otras especies de mamferos: el primer borrador completo del genoma de ratn se obtuvo en 2002 y el del genoma de chimpanc en 2005. Implicaciones ticas, legales y sociales del PROYECTO GENOMA. Es importante tener consciencia de la influencia que va a tener el Proyecto Genoma y sus aplicaciones sobre los individuos y las sociedades. Cuestiones como el diagnstico de enfermedades que no tienen tratamiento, la extensin de una mentalidad eugensica que lleve a la discriminacin por razn de deficiencias genticas, el diagnstico prenatal de alteraciones genticas que confieren predisposicin a sufrir enfermedades que se manifestarn en la edad adulta, la deteccin de rasgos psicolgicos con base gentica, la confidencialidad de la informacin gentica de los individuos (y la posible discriminacin laboral) sern una constante en los debates sociales de este siglo, y es importante llevar a cabo una labor de divulgacin seria para que la sociedad pueda discutir de modo sosegado y bien fundamentado las bases ticas sobre las que sostener las aplicaciones biomdicas de la biotecnologa en los aos que se avecinan. Desarrollo de herramientas bioinformticas (bases de datos y herramientas de anlisis de datos) que puedan ser compartidas por la comunidad cientfica. Ser especialmente importante el desarrollo de herramientas informticas que permitan identificar exones y predecir la estructura de genes en grandes secuencias genmicas, as como plataformas de genmica funcional para el anlisis de la expresin de miles de genes a la vez. Formacin en genmica: favorecer que cientficos y acadmicos se dediquen a la investigacin genmica y a divulgar y aumentar el conocimiento pblico de los distintos aspectos del PROYECTO GENOMA. Finalmente, la primera versin esencialmente completa del genoma humano fue anunciada oficialmente el 14 de abril de 2003, cubriendo un total de 3.069 Mb (92.3% del total estimado del genoma humano) con un 99.99% de fiabilidad en cada posicin secuenciada. El anlisis de la secuencia publicada permite hacerse una idea bastante aproximada de la estructura de nuestro genoma, su composicin y algunas de sus caractersticas funcionales, como se explica a continuacin.

-http://www.unav.es/asignatura/genmolhumbq/

22 de 172

Gentica Molecular Humana (F.Ciencias)-

1.2 Estructura del genoma humano y la variacin inter-individual


El genoma humano nuclear tiene un tamao aproximado de 3.200 Mb (megabases), es decir tres mil doscientos millones de pares de bases. Esta cifra total incluye unas 2.950 Mb de eucromatina y unas 250 Mb de heterocromatina (formada, como veremos, por ADN satlite). Esta cifra se refiere al genoma haploide, de manera que las clulas somticas (diploides) contienen el doble. Figura 1.5: este cuadro exlicativo muestra una visin general de los distintos tipos de secuencias que constituyen el genoma humano. Una primera clasificacin del genoma humano distingue, por un lado, los genes y secuencias relacionadas con genes (exones, intrones, regiones no traducidas que contienen elementos reguladores, etc), y por otro todo el ADN que est entre los genes, llamado ADN extragnico o de relleno y que no codifica ninguna protena ni contiene ningn elemento funcional. Curiosamente, la mayor parte del genoma humano (un 70%) est formada por este ltimo, de forma que slo un 30% del genoma humano incluye secuencias relacionadas con genes. Lo ms sorprendente es que de este 30% slo un 5% est constitudo por ADN codificante (exones), siendo el resto ADN no-codificante asociado a genes. Por tanto, resulta que slo un 1,5-2% del total del genoma humano es ADN codificante. El ADN extragnico est formado, sobre todo, por los componentes repetitivos del genoma humano que se explicarn ms adelante, aunque tambin hay secuencias nicas o en bajo nmero de copia. Desde la publicacin del primer borrador del Genoma Humano en febrero de 2001, podemos dar unos valores promedio estimados a partir de los datos publicados: Se estima que el genoma humano contiene en torno a los 20.000 - 25.000 genes. Alrededor de un 50% del genoma humano est constituido por ADN repetitivo. Se puede estimar la densidad media de genes es de 1 gen cada 100 kb, aunque existen regiones ricas en genes (algunas zonas del cromosoma 19, por ejemplo) y otras regiones que son muy pobres en genes (como el cromosoma Y). Por tanto, se puede deducir una frecuencia media de 10 genes por cada Mb de secuencia. El tamao promedio de un gen humano es de 20-30 kb, aunque hay grandes diferencias de unos genes a otros. El nmero de exones que forman un gen es muy variable (desde genes que tienen un solo exn hasta algunos genes con 100 exones ms), pero podemos establecer un valor promedio de 7-8 exones por gen. El tamao medio de un exn es de 150 nucletidos. Por lo que respecta a los intrones, en cambio, existe una enorme variabilidad de tamaos, y no es infrecuente encontrar en casi todos los genes algn intrn de gran tamao. El tamao medio de un ARNm es de 1,8-2,2 kb incluyendo las regiones no-traducidas flanqueantes. La longitud media de una regin codificante es de 1,4 kb. Una de las caractersticas ms evidentes del borrador de nuestro genoma es su heterogeneidad. En efecto, la secuencia no es uniforme, sino que muchas de sus caractersticas (riqueza en C+G frente a A+T, riqueza en genes, etc) se distribuyen heterogneamente, con regiones de gran abundancia flanqueadas por regiones en que esos parmetros son ms escasos. As por ejemplo, el contenido medio de G+C del genoma humano es del 41%, menor de lo tericamente esperado. Adems, si el genoma se divide en "ventanas" de 20 kb se observan regiones con valores muy alejados del promedio, con una dispersin 15 veces mayor de lo que sera esperable si la distribucin fuese uniforme. La distribucin de %G+C de estas ventanas no se ajusta a una distribucin normal, sino que est desviada hacia valores bajos. Adems, se ha comprobado que los genes tienden a concentrarse en las ventanas ms ricas en G+C. Esto se conoca ya de antiguo, y de hecho se haba acuado el trmino isocoro para designar las regiones genmicas que son homogneas en cuanto al contenido en G+C y que pueden separarse mediante gradientes de densidad. Se distinguen isocoros L e isocoros H, segn su contenido en G+C sea bajo (Low) alto (High -http://www.unav.es/asignatura/genmolhumbq/ 23 de 172

Gentica Molecular Humana (F.Ciencias)-

), y dentro de cada isocoro hay varios subgrupos. La tabla que se presenta a continuacin resume algunas caractersticas importantes de los distintos isocoros:

Isocoro

% GC % del genoma

Contenido Genes %

Mb ADN Densidad de genes

L1

38

30

48

1,860

1 cada 130 kb

L2

41

32

H1

44

19

27

870

1 cada 100 kb

H2

49

10

H3

53

25

270

1 cada 35 kb

Como puede apreciarse, existe una relacin directa entre el contenido de una regin genmica en nucletidos G+C y su riqueza en genes. Es decir, hay en el genoma humano unas regiones con mayor riqueza de genes, regiones que a su vez son las que tienen un mayor porcentaje de nucletidos G+C. Otro hallazgo inesperado en nuestro genoma ha sido la presencia de mayor nmero de duplicaciones del que se haba estimado hasta entonces. De hecho, el anlisis muestra alrededor de un 5% de duplicaciones segmentarias, definidas como dos ms segmentos cromosmicos >1 kb con >90% de identidad de secuencia; dicho nivel de homologa corresponde a una antigedad de unos 40 millones de aos. Las duplicaciones intracromosmicas (las copias estn en el mismo cromosoma) tienen un tamao medio de unas 100 kb, mientras que las duplicaciones intercromosmicas (entre cromosomas distintos) son ms pequeas (10-50 kb). Las duplicaciones segmentarias son ms frecuentes en regiones centromricas y cerca de los telmeros (donde pueden llegar a constituir un 25% de la secuencia). Los centrmeros, en concreto, estn flanqueados por regiones ricas en duplicaciones intercromosmicas procedentes de regiones eucromticas de otros cromosomas, que se han ido transponiendo a zonas pericentromricas a una velocidad de 6-7 eventos por milln de aos durante la evolucin de primates. Las duplicaciones intracromosmicas pueden dar lugar a alteraciones genmicas, como veremos en un Tema posterior. Figura 1.6: el video ilustra la estructura de los distintos tipos de duplicaciones segmentarias que aparecen en el genoma humano, con un ejemplo de la regin pericentromrica del cromosoma 7. Adems de las duplicaciones segmentarias, se ha visto que hay muchas otras regiones relativamente grandes del genoma que estn en distinto nmero de copia en personas diferentes. Por tanto, constituyen un tipo de polimorfismo, de ah que se denominen LCV (Large-scale Copy number Variations), CNP (Copy Number Polymorphisms) o CNV (Copy Number Variants), que es el nombre ms utilizado en la actualidad. Una caracterstica de todas estas regiones es que estn flanqueadas por duplicaciones segmentarias, y esto hace pensar que la variacin en el nmero de copias es el resultado de reordenaciones entre esos elementos flanqueantes. En los ltimos aos, las nuevas tecnologas han permitido elaborar un catlogo bastante exhaustivo de estas variantes, con ms de ocho mil regiones tipo CNV que comprenden en total casi un 4% de la secuencia del genoma humano. Dos personas tomadas al azar tendrn diferencias en ms de mil CNV, -http://www.unav.es/asignatura/genmolhumbq/ 24 de 172

Gentica Molecular Humana (F.Ciencias)-

lo que supone una gran fuente de variabilidad gentica inter-individual ya que cada una de esas regiones incluye uno o ms genes. Estudios recientes han asociado alguna de estas variantes con la susceptibilidad a desarrollar enfermedades, especialmente de tipo neurolgico. Por ejemplo, en 2011 se vio que las personas con una duplicacin de una regin del cromosoma 7 tienen un riesgo 15 veces superior de desarrollar esquizofrenia que las personas sin esa variante. Otro estudio, realizado sobre ms de 15.000 nios con discapacidades congnitas, demostr que hasta un 15% de estas patologas es atribuible a un nmero anormal de copias de una regin genmica. Es previsible que en los prximos aos se sigan descubriendo CNV que confieren un alto riesgo de padecer una enfermedad comn. El anlisis de la secuencia tambin ha mostrado la alta cantidad de pseudogenes que hay en el genoma humano. Como su nombre indica, los pseudogenes son versiones incorrectas de genes, que contienen diversos tipos de mutaciones y habitualmente no se transcriben. Se dividen en pseudogenes no procesados y pseudogenes procesados. Los primeros son copias de un gen, habitualmente originadas por duplicacin del gen original y posteriores mutaciones que hacen que la copia pierda su capacidad codificante. Contienen exones e intrones, pero que carecen de promotor y habitualmente tienen codones de parada prematuros. En cambio, los pseudogenes procesados son copias del ARN mensajero de un gen, que se ha retrotranscrito e insertado en otra posicin del genoma (de ah que se denominen tambin retropseudogenes). No tienen intrones, y tampoco tienen capacidad codificante por la ausencia de promotor y por la presencia de codones de parada. Se han identificado unos 11.000 pseudogenes en el genoma humano, de los que la mayor parte (unos 8.000) son pseudogenes procesados. En total, se estima que el nmero de pseudogenes en nuestro genoma puede llegar a unos 20.000. De todas formas, todos los pseudogenes detectados se originan a partir de tan slo unos 2.500 genes funcionales, de modo que la mayor parte de los genes no tienen ningn pseudogen en el genoma. Figura 1.7: el video muestra esquemticamente la estructura de los distintos tipos de pseudogenes que aparecen en el genoma humano. Recientemente se han encontrado 481 segmentos >200 pares de bases totalmente conservados (100% de identidad sin gaps) en rergiones ortlogas de humano, rata y ratn, y la gran mayora estn tambin conservados en pollo y perro (95 and 99% de identidad, respectivamente). Muchas tambin estn conservadas en pez. Estos "elementos ultraconservados" se solapan con exones de genes implicados en el procesamiento de ARN, y tambin son abundantes en intrones de genes relacionados con el desarrollo o con la regulacin de la transcripcin. Junto con las ms de 5000 secuencias >100 nucletidos que estn totalmente conservadas en los 3 mamferos secuenciados, estos fragmentos constituyen una nueva clase de elementos genticos cuya funcin est por determinar, pero el hecho de que estn ms conservados que las protenas indica que deben jugar algn papel importante. Tambin es importante dedicar unas lneas a describir la presencia de genes que dan lugar a microARN. Como es sabido, el estudio del mecanismo de interferencia de ARN ha llevado a la identificacin de ARN interferentes endgenos en los genomas de eucariotas, incluido el genoma humano. Estos ARN se denominan microARN (miARN) y se transcriben a partir de genes con un promotor de ARN-polimerasa II. Estos genes tienen un segmento palindrmico, de modo que el ARNm primario forma un pri-miARN que contiene una horquilla de ARN bicatenario; este pri-miARNm es procesado dentro del ncleo de la clula por una ARNasa tipo III llamada DROSHA y esto da lugar a un pre-miARN, una ARN bicatenario con forma de horquilla de unos 70 nucletidos de tamao. El pre-miARN sale del ncleo y es procesado en el citoplasma por Dicer, originando un miARN de unos 22 nucletidos. ste entra a formar parte del complejo RISC (denominado miRISC para los miARN) y regula la expresin de genes diana mediante degradacin de sus mensajeros o por represin de la traduccin. Actualmente se han identificado ms de 300 genes de miARN en el genoma humano, y se calcula que puede haber en torno a 500. La mayora de estos genes se localizan en intrones de genes codificantes, y adems estn bastante conservados en primates. Dado que cada uno de estos miARN puede regular la expresin de varios genes diana, se estima que hasta un 20-30% de todos los genes del genoma humano pueden estar regulados por miARN, lo que les confiere una extraordinaria importancia. -http://www.unav.es/asignatura/genmolhumbq/ 25 de 172

Gentica Molecular Humana (F.Ciencias)-

La secuenciacin del genoma humano ha permitido tambin estudiar la variacin gentica inter-individual , es decir, las diferencias genticas que estn en la base de las diferencias fenotpicas entre individuos. Esto tiene gran relevancia mdica, porque muchas de estas variantes pueden ser tambin causa de la distinta susceptibilidad a desarrollar enfermedades o la diferente respuesta a frmacos que tienen personas distintas. Uno de los tipos ms importantes de variabilidad gentica es el constituido por los cambios en un nucletido de la secuencia, conocidos ―como hemos visto― con el nombre de SNP. Uno de los objetivos del PROYECTO GENOMA HUMANO era el estudio de la diversidad gentica, y esto ha cristalizado en otro proyecto internacional denominado Proyecto HapMap que se propone precisamente identificar los SNP ms frecuentes en el genoma humano en individuos de diferentes grupos tnicos. En octubre de 2005, el Proyecto Hapmap public un primer mapa que contiene 1.007.329 SNP con una distancia media entre ellos de 5 kb, con una frecuencia del alelo ms frecuente igual superior al 5% (es decir, presentes en al menos el 5% de la poblacin). Todos estos SNP fueron genotipados en 269 individuos de cuatro grupos raciales: 90 de raza yoruba, de Nigeria; 90 caucasianos de Utah; 45 de raza han, de China; y 44 japoneses. La segunda fase de este Proyecto, publicada en 2007, genotipo casi tres millones de SNPs en esta misma muestra. En la fase III, concluida en 2009, se genotiparon 1,6 millones de SNPs en 1184 individuos de 11 poblaciones distintas de todo el planeta. La inspeccin de estos mapas permite hacerse una idea de la variacin existente en el genoma, tanto entre individuos como entre distintos grupos geogrficos. Adems, estos datos han permitido comprobar que esta variacin se agrupa en bloques, de modo que todos los SNP de un mismo bloque se heredan juntos. En un captulo posterior veremos la importancia de estos bloques para estudiar la asociacin de SNP concretos con la susceptibilidad a padecer enfermedades. Figura 1.8: Como se muestra en este video, los alelos de SNP cercanos estn a menudo en desequilibrio de ligamiento y forman haplotipos que se heredan en bloque.Estos bloques haplotpicos tienen gran importancia para entender la estructura del genoma humano en distintas poblaciones, identificar genes relacionados con enfermedades complejas y detectar regiones genmicas de asociadas con distintos rasgos fenotpicos. Finalmente, se ha catalogado tambin otro tipo de variacin consistente en polimorfismos de insercin/delecin pequeos (de tamaos entre 1 nucletido a 10 kb). Se han detectado varios cientos de miles, y se estima que en total hay alrededor de 1,5 millones de estos polimorfimos en el genoma humano. Aunque se distribuyen por todo el genoma, se ha visto que en algunas regiones son especialmente frecuentes. Muchos de ellos estn dentro de genes, y pueden causar alteraciones cuando afectan al promotor o a la regin codificante (exones). Los ltimos aos han presenciado una revolucin en las tecnologas de secuenciacin, lo que ha permitido comenzar proyectos para leer la secuencia de genomas completos de muchas personas. El proyecto internacional ms importante, en este sentido, se llama 1000 Genomes, y ya est dando sus primeros frutos. En 2010 se publicaron los primeros resultados de este proyecto, en el que se secuenciaron 179 genomas de 4 poblaciones distintas. Segn estos datos, cada persona es portadora de unos 3 millos de variantes genticas, de las cuales diez mil son potencialmente patognicas, afectando en promedio a 250 genes. Adems, 60 de esas variantes han sido previamente asociadas con alguna enfermedad.

1.3 El ADN Repetitivo


Como hemos visto al principio de este Captulo, hasta un 50% del Genoma Humano est constituido por ADN repetitivo, antiguamente conocido como "ADN basura". Por su importancia, a continuacin estudiamos con mayor detalle su composicin y los distintos tipos de secuencias que lo forman. Ya se ha mencionado que podemos encontrar ADN repetitivo tanto en el ADN codificante (en los genes y secuencias relacionadas) como en el ADN no-codificante, pero la mayor parte se encuentra en el ADN no-codificante. Quizs el nico ejemplo de ADN repetitivo codificante que merece la pena resear es el correspondiente al ADN ribosomal, que se concentra en los brazos cortos de los cromosomas acrocntricos (13, 14, 15, 21 y 22) y est formado por tres genes que dan lugar a los tres ARN ribosomales de 5,8S, de 18S y de 28S. Los -http://www.unav.es/asignatura/genmolhumbq/ 26 de 172

Gentica Molecular Humana (F.Ciencias)-

tres genes estn juntos formando un bloque que mide unas 13 kilobases. Estos bloques se encuentran repetidos unas 50 veces, separados entre s por un espaciador intergnico que mide unas 30 kilobases. En conjunto, el ADN ribosomal ocupa un tamao de unas 2 Megabases. En el ADN no-codificante, tanto intragnico (es decir, intrones y otras regiones no-codificantes relacionadas con genes) como extragnico, podemos encontrar diversos tipos de elementos repetidos. En general, se trata de una secuencia de ADN que se repite en el genoma cientos o miles de veces. Estas repeticiones pueden encontrarse en tndem (es decir, seguidas una detrs de otra) o dispersas. El ADN repetido en tandem se divide en varios grupos segn el tamao total que origina la repeticin: El genoma humano contiene en total unas 250 Mb de ADN satlite (llamado as porque al separar el ADN genmico en gradientes de densidad aparece como 3 bandas "satlites" de la banda principal). El ADN satlite est formado por la repeticin de una secuencia de ADN miles de veces en tandem, es decir unas copias pegadas a otras. Esto da lugar a regiones repetidas con tamaos que van desde 100 kb hasta varias megabases. Por ejemplo, el ADN Satlite 1 es una secuencia de 42 nucletidos, mientras que en el Satlite 2 la secuencia repetida es (ATTCCATTCG) y en el Satlite 3 se repite el pentmero (ATTCC). Un tipo de ADN satlite muy importante es el ADN alfoide Satlite alfa, en el que la secuencia repetida tiene un tamao de 171 nucletidos, y que forma parte del ADN de los centrmeros de los cromosomas humanos. Otros tipos de ADN satlite son el Satlite beta (repeticin de 68 nucletidos) y el Satlite gamma (repeticin de 220 nucletidos), que tambin se encuentran en la cromatina centromrica de varios cromosomas. El ADN de tipo Minisatlite est formado por secuencias de 6 - 25 nucletidos que se repiten en tndem hasta dar un tamao total entre 100 nucletidos y 20 kb. Un ejemplo de ADN Minisatlite es la repeticin que forma los telmeros de los cromosomas humanos, en los que el hexanucletido (TTAGGG) se repite miles de veces en tndem dando lugar a bloques de 5 - 20 kb de tamao. Algunas repeticiones de este tipo son polimrficas, y dan lugar a los marcadores de tipo VNTR que hemos mencionado en un apartado anterior. El ADN de tipo Microsatlite est formado por secuencias de 2, 3 4 nucletidos que se repiten hasta dar bloques con un tamao total habitualmente no superior a 150 nucletidos. Hay repeticiones de este tipo por todo el genoma humano, y muchas de ellas son muy tiles como marcadores genticos porque el nmero de repeticiones vara entre individuos. Ejemplos de ADN microsatlite son los dinucletidos (CA), las repeticiones de trinucletidos (CAG). El ADN repetido disperso est formado por secuencias que se repiten miles de veces en el genoma humano, pero no en tndem sino de manera dispersa. Este tipo de repeticiones constituyen un 45% de todo el genoma humano, y se clasifican en funcin del tamao de la unidad repetida: Los SINE (Short Interspersed Nuclear Elements, elementos nucleares dispersos cortos) suponen un 13% del genoma humano. Son secuencias cortas repetidas miles de veces en el genoma humano de forma dispersa. El principal SINE es la familia de elementos Alu, que es especfica de primates y constituye un 10% de nuestro genoma. Un elemento Alu est formado por una secuencia de 250 - 280 nucletidos, con unas 1.500.000 copias por genoma y una repeticin cada 4 kb como promedio. Es un elemento relativamente rico en guaninas+citosinas (56% de contenido en CG, mientras que el contenido promedio del genoma humano es del 41%). Se localiza predominantemente en la bandas R de los cromosomas humanos. Est flanqueado por pequeas repeticiones directas (en la misma orientacin). Su estructura es la de un dmero no idntico, ya que el segundo monmero es 30 nucletidos mayor que el primero. Contiene colas poli-A al final de cada monmero, y se transcribe por la ARN polimerasa III a partir de un promotor interno, pero no codifica ninguna protena. Acta como un retrotransposn, ya que puede copiarse e insertarse en otras regiones del genoma.

-http://www.unav.es/asignatura/genmolhumbq/

27 de 172

Gentica Molecular Humana (F.Ciencias)-

Los LINE (Long Interspersed Nuclear Elements, o elementos nucleares dispersos largos) constituyen un 20% del genoma humano. Son secuencias con un tamao de varias kilobases, agrupados en distintas familias. El principal LINE es el llamado LINE-1 L1, formado por una secuencia de unas 6 kb repetida unas 800,000 veces en el genoma (aunque muchos de estos elementos no estn completos, sino truncados y les falta la parte 5), llegando a constituir alrededor de un 15% del genoma. Estos elementos, al contrario que los SINE, no son ricos en guaninas+citosinas (tienen un 42% de citosinas+guaninas, que es cercano al contenido promedio del genoma humano) y se localizan predominantemente en las bandas G de los cromosomas. Un elemento L1 codifica dos protenas: una ARN-binding protein en el marco de lectura ORF1 y una protena con actividad endonucleasa y retrotranscriptasa en el marco de lectura ORF2. Est flanqueado por unas pequeas repeticiones directas (en la misma orientacin) y termina en una cola poli-A. Los elementos LINE son retrotransposones, puesto que pueden copiarse a s mismos a travs de un intermediario ARN y transponerse a otras localizaciones genmicas. Segn el modelo ms aceptado, el elemento se transcribe por la ARN polimerasa II a partir de un promotor interno, sus productos proteicos se unen a la cola poli-A de su propio ARN mensajero y el complejo se inserta en el ADN genmico por la accin combinada de la endonucleasa (que corta dentro de regiones ricas en AT que llevan la secuencia TTTT↓A) y de la retrotranscriptasa. Las protenas codificadas por los LINE son utilizadas tambin para la retrotransposicin de elementos SINE y de pseudogenes procesados, por lo que pueden jugar un importante papel como elemento modificador del genoma. De hecho se ha visto que la secuencia propia de los L1 tiene la propiedad de inhibir la transcripcin, de ah que los niveles de ARNm y protenas codificadas por los L1 en las clulas sea muy bajo. Lo ms interesante es que tambin pueden modificar la transcripcin de los genes en cuyos intrones hay abundancia de estos elementos: un 80% de los genes humanos tienen L1 en sus intrones, y la densidad en L1 correlaciona negativamente con los niveles de expresin de estos genes. Por tanto, su papel tanto en la evolucin de genomas como en la regulacin gnica le confieren una gran importancia. Se acab el mito del "ADN basura". Figura 1.9: el video ilustra el mecanismo de retrotransposicin de los LINE. Los HERV (retrovirus endgenos humanos), representan copias de los retrovirus humanos que se han ido integrando en el genoma humano en el curso de la evolucin y con frecuencia son el origen de proto-oncogenes celulares. Habitualmente representan copias truncadas del genoma de estos virus, y constituyen alrededor de un 8% del genoma (hay unas 450.000 copias). Como habitualmente conservan alguna de las repeticiones terminales largas de estos genomas, se denominan tambin repeticiones tipo LTR (Long Terminal Repeat). Nuestro genoma tambin contiene unas 300.000 copias de elementos repetidos originados por transposones ADN, lo que supone un 3% del total del genoma. Estos elementos contienen el gen (habitualmente truncado) de la transposasa, flanqueado por repeticiones invertidas. De entre las distintas familias que existen cabe destacar el tipo MER1 MER2 y los elementos mariner (Hsmar2), responsables de algunas reordenaciones cromosmicas importantes en patologa humana. Figura 1.10: el video muestra esquemticamente la estructura y la abundancia de los principales tipos de repeticiones dispersas que contiene el genoma humano: elementos tipo LINE, elementos tipo SINE, elementos retrovirales y transposones de ADN. Es importante hacer algn comentario sobre la movilidad de los retroelementos dispersos. Tanto los LINE como los Alu que estn completos pueden, en teora, copiarse e insertarse en otra posicin del genoma a travs de un intermediario ARNm. De hecho, esto sucede habitualmente, aunque por fortuna con muy baja frecuencia. Se calcula que 1 de cada 100-200 nuevos nacimientos lleva una insercin nueva de un Alu o de un L1. Por lo que respecta a los L1, se calcula que existen actualmente unos 5000 elementos completos en el genoma humano, de los cuales unos 90 son activos (capaces de retrotransposicin). Un trabajo reciente ha estudiado la presencia de 68 elementos L1 completos en poblaciones humanas, encontrando que ms de la mitad son muy activos. Esta actividad hace que distintas personas tengan presencia o ausencia de un -http://www.unav.es/asignatura/genmolhumbq/ 28 de 172

Gentica Molecular Humana (F.Ciencias)-

elemento L1 concreto en una posicin del genoma, lo que se conoce como polimorfismos de insercin. Se ha visto experimentalmente que dos personas tomadas al azar difieren, en promedio, en casi 300 polimorfismos de insercin de elementos L1. El potencial patognico de estos elementos se debe a la propia capacidad de insertarse aleatoriamente en el genoma (e interrumpir genes), pero tambin a la desregulacin de la expresin de genes cercanos (por los elementos promotores de los LINE y SINE), y sobre todo a las alteraciones cromosmicas (deleciones, duplicaciones) causadas por recombinacin ilegtima entre copias de estos elementos que estn en localizaciones cromosmicas distintas (esto se ver en profundidad en el Captulo 5). Curiosamente, los elementos Alu causan este tipo de recombinacin con ms frecuencia que los L1, especialmente en algunos genes concretos que tienen tendencia a sufrir duplicaciones o deleciones por recombinacin entre secuencias Alu.

1.4 El Proyecto ENCODE


ENCODE es el acrnimo de ENcyclopedia Of DNA Elements, y se trata de un proyecto de anlisis exhaustivo del genoma humano, que comenz con un proyecto piloto en el que se estudi slo el 1% del total. Al final se ha obtenido una imagen muy detallada que muestra todos los transcritos primarios y maduros, as como la localizacin de las principales modificaciones de histonas, los sitios de unin de factores de transcripcin, sitios de inicio de la transcripcin, sitios hipersensibles a DNAsa, etc; todo ello unido a datos de expresin gnica, de replicacin y del nmero de copia de esas mismas regiones. Al principio, lo ms llamativo de este anlisis fue la gran cantidad de transcripcin que se detecta a lo largo del genoma humano: un 15% de los nucletidos estn incluidos en transcritos maduros, y una gran parte del resto de las bases (hasta el 90%) forman parte de transcritos primarios en algn tejido. Adems, se observan muchos sitios de inicio de la transcripcin distintos a los anotados previamente, a menudo alejados de lo que se consideraba el inicio del gen. Igualmente, se identificaron unos 200 pseudogenes (60% procesados y 40% no-procesados), de los cuales una quinta parte se transcriben. Esto, extrapolado al resto del genoma significa unos 20.000 pseudogenes en total. Aunque posteriormente se ha visto que la intensidad de la transcripcin basal no es tan alta, los datos aportados por ENCODE indican que los genes son ms complejos de lo que se pensaba hasta ahora: en vez de la visin tradicional, segn la cual un gen da lugar a uno o varios transcritos alternativos que codifican una protena en sus varias isoformas, parece claro que una regin genmica puede codificar distintos productos proteicos y adems dar lugar a otros transcritos (no necesariamente codificantes de protenas) en ambas cadenas. Todo esto ha llevado a replantear el concepto de gen, que en la era post-ENCODE se definira como la unin de las secuencias genmicas que codifican un conjunto coherente de productos funcionales, potencialmente solapantes. Esta definicin hace hincapi enel producto funcional que se codifica (de ah el uso de coherente para indicar que se trata de codificar una protena o un ARN). Lo ms novedoso de esta definicin es que las regiones no traducidas (UTR) no formaran parte del gen, quedando incluidas -junto con los elementos reguladores- en la categora de regiones asociadas con genes. La definicin alternativa, ms acorde con el pensamiento actual, de que un gen es la regin genmica que codifica un conjunto de transcritos alternativos solapantes, aunque codifiquen distintos productos proteicos, es problemtica a la luz de los datos aportados por el proyecto ENCODE. Si existe mucho solapamiento de transcritos, la aplicacin de esta definicin dara lugar a un nmero pequeo de genes muy extensos, los cuales adems tendran escaso significado biolgico al codificar productos funcionales diversos (un mismo gen podra dar lugar a protenas distintas y/o ARN no codificantes). La nueva definicin probablemente aumentar el nmero total de genes del genoma, pero al estar centrada en el producto final es ms informativa de la funcin de cada gen concreto. Figura 1.11: El video explica la nueva definicin de "gen", a la luz de los resultados de ENCODE.

-http://www.unav.es/asignatura/genmolhumbq/

29 de 172

Gentica Molecular Humana (F.Ciencias)-

Otra sorpresa del proyecto ENCODE ha sido comprobar que un alto porcentaje de los transcritos detectados no codifican protenas, por lo que la categora de "ARN no codificantes" seguir aumentando en el futuro. En concreto, los ltimos aos han sido testigos de la explosin de un nuevo tipo de ARN no codificantes largos (en ingls lncRNAs), con funciones reguladoras importantes que se estn empezando a conocer poco a poco. Se trata de ARNs con un tamao superior a 200 nucletidos que maduran mediante ayuste, pero que no codifican protenas. Su nmero va en aumento, llegando a estimarse que cubren unas 10 a 20 veces ms de secuencia genmica que los ARNs codificantes de protenas. Entre las funciones que desempean los lncRNAs, se ha visto que son capaces de inhibir mltiples genes en trans (es decir, genes que estn en cromosomas distintos), como en el caso del lincRNA-p21. Particularmente interesantes son otras funciones novedosas de algunos lncRNAs. Por ejemplo, se ha demostrado que actan como andamios sobre los que se reclutan distintos factores reguladores de la expresin gnica (modificadores de la cromatina, que se vern en el captulo siguiente). ste es el caso de un lncRNA llamado HOTAIR, que es capaz de llevar un complejo represor a varios genes del genoma. Otros lncRNAs estimulan la expresin de genes vecinos, bien porque ellos mismos tienen actividad potenciadora o bien porque se asocian con co-activadores de la transcripcin. Finalmente, los lncRNAs tambin parecen estar implicados con la formacin de asas de cromatina, sirviendo como puntos de anclaje sobre los que se forman compartimentos nucleares (paraspeckles, por ejemplo). La siguiente tabla resume los principales tipos de ncRNAs de mamferos y sus funciones.

El 5 de septiembre de 2012 la revista Nature public varios artculos con los resultados de la segunda fase de este proyecto (el anlisis de todo el genoma humano completo), en la que participaron ms de 400 personas y se analizaron 1.640 conjuntos de datos obtenidos de 147 lneas celulares diferentes. Esa -http://www.unav.es/asignatura/genmolhumbq/ 30 de 172

Gentica Molecular Humana (F.Ciencias)-

informacin, junto con la aparecida en otros 30 artculos cientficos publicados simultneamente en otras revistas, se puede consultar en esta web, donde aparece ordenada en forma de threads (hilos, o temas): cada thread recopila la informacin de todos los artculos sobre un tema concreto. Para una visin general del Proyecto, es til este video en el que Ewan Birney explica los hallazgos principales, y este comentario publicado en Nature. En conjunto, los resultados del proyecto ENCODE son apasionantes y enriquecen enormemente nuestra visin del genoma humano, su regulacin y funcionamiento. Los principales puntos a resaltar son: Un 80% de los nucletidos tienen alguna funcin, entendida de modo amplio: son transcritos en al menos un tipo celular. La porcin de nucletidos realmente funcionales, es decir, que codifican protenas o ncRNAS, o regulan la expresin, es mucho menor (en torno a un 20%). Hay ms de 8 millones de sitios a los que se une algn factor regulador (factores de transcripcin), que permiten entender mucho mejor la especificidad de tejido de la expresin gnica. Al integrar distintos tipos de datos, se observa la relacin entre la accesibilidad de la cromatina, el potencial proliferativo y los patrones de variacin en el genoma. Es especialmente interesante la asociacin de regiones funcionales con variantes que haban sido asociadas con el desarrollo de enfermedades. Hay un alto grado de interaccin fsica entre regiones del genoma que estn alejadas, lo que dibuja un cuadro tridimensional muy complejo.

1.5 El genoma mitocondrial


La mitocondria es un orgnulo de probable origen endosimbintico que se ha adaptado a su nicho intracelular: para aumentar su tasa de replicacin y asegurar la transmisin a las clulas hijas despus de cada divisin mittica, el genoma de las mitocondrias de mamferos se ha ido reduciendo de tamao hasta alcanzar las 16.569 kb en el caso del genoma mitocondrial humano. Las mitocondrias son las verdaderas centrales trmicas de nuestro organismo ya que en ellas tiene lugar la fosforilacin oxidativa (OXPHOS), es decir, la respiracin celular acoplada a la produccin de energa en forma de ATP. El funcionamiento del sistema OXPHOS tiene, adems, importancia mdica por la generacin de especies reactivas de O2 (R eactive Oxygen Species, ROS) y por la regulacin de la muerte celular programada o apoptosis. Las protenas incluidas en el OXPHOS se localizan dentro de la membrana mitocondrial interna, e incluyen: (1) Componentes de la cadena transportadora de electrones (Cadena respiratoria mitocondrial, CRM); (2) ATPasa de membrana; (3) Translocador de nucletidos de Adenina (ANT). El ADNmt humano es una molcula circular de 16.569 pares de bases. El nmero de molculas de ADNmt por clula vara entre unos pocos cientos en los espermatozoides a unas 200.000 copias en el oocito, pero en la mayor parte de los tejidos el rango est comprendido entre unas 1.000 y 10.000 copias por clula, con 2 - 10 molculas de ADN por mitocondria. Este genoma contiene informacin para 37 genes: Genes que codifican las 2 subunidades 12S y 16S del ARNr (ARN ribosomal) de la matriz mitocondrial. Los genes para los 22 ARNt (ARN transferente), requeridos para la sntesis de protenas mitocondriales en la misma matriz mitocondrial. Genes que codifican 13 polipptidos que forman parte de los complejos multienzimticos del sistema OXPHOS. En concreto, en el genoma mitocondrial se codifican 7 subunidades del Complejo I, 1 subunidad del Complejo III, 3 subunidades del Complejo IV, y 2 subunidades de la ATPasa (Complejo V).

-http://www.unav.es/asignatura/genmolhumbq/

31 de 172

Gentica Molecular Humana (F.Ciencias)-

Es importante no perder de vista que el resto de las subunidades polipeptdicas de estos complejos, as como el Complejo II completo, estn codificados en el genoma nuclear, de manera que no todas las enfermedades mitocondriales estn necesariamente causadas por alteraciones en el ADN mitocondrial. Figura 1.12: se muestra esquemticamente la membrana mitocondrial interna, incluyendo loscomplejos proteicos del sistema OXPHOS con algunos de sus componentes. En cada complejo, se muestran en color naranja las subunidades que estn codificadas por genes mitocondriales (las restantes subunidades estn codificadas por genes nucleares). La caracterstica estructural ms sorprendente del ADNmt es que los genes se encuentran situados uno a continuacin del otro, sin apenas intrones ni regiones no codificantes entre los genes. Al contrario que el genoma nuclear, en el que las regiones no codificantes son mayoritarias, el ADN mitocondrial slo posee un 3% de secuencias no codificantes. Veintiocho de los genes mitocondriales (2 ARNr, 14 ARNt y 12 polipptidos) se encuentran en una de las cadenas (cadena H pesada), mientras que los 9 genes restantes (1 polipptido y 8 ARNt) estn en la cadena complementaria (cadena L ligera). La nica zona del ADNmt que no codifica ningn gen es la regin del bucle de desplazamiento (bucle-D), localizada alrededor del origen de replicacin de la cadena H. Esta regin contiene tambin los promotores de la transcripcin y los elementos reguladores de la expresin gnica. Otra de las peculiaridades de la organizacin gentica del ADNmt es que los genes de los ARNt se distribuyen entre los genes de los ARNr y los codificantes de protenas; esta disposicin tiene consecuencias muy importantes para el procesamiento del ARN. Para la replicacin del ADNmt hacen falta dos orgenes diferentes, uno para cada cadena (OH y OL). Ambos orgenes de replicacin estn muy separados, haciendo que el proceso sea unidireccional y asimtrico. La sntesis del ADN se inicia en OH y es realizada por una polimerasa especfica de la mitocondria, la DNApol γ, que alarga un ARN iniciador fruto del procesamiento de un transcrito primario que se sintetiza a partir del promotor L. La replicacin contina de modo unidireccional hasta alcanzar OL, momento en el cual comienza la sntesis de la segunda cadena del ADN, alargando tambin un pequeo iniciador de ARN. Figura 1.13: este video se ilustra de modo esquemtico la estructura del genoma mitocondrial. Se muestran ambas cadenas con sus orgenes de replicacin, todos los genes que codifican los ARNt, los ARNr y las protenas mitocondriales, con la posicin de los promotores. Tambin se muestran algunas deleciones que son causa de enfermedades. En la transcripcin del ADNmt intervienen una polimerasa de ARN, al menos un factor de transcripcin implicado en la iniciacin (mtTFA), y uno de terminacin (mTERF). Las dos cadenas del ADNmt se transcriben completamente a partir de tres puntos de iniciacin diferentes, dos para la cadena pesada (H1 y H2) y uno para la cadena ligera (L), originando tres molculas policistrnicas que se procesan posteriormente por cortes endonucleolticos precisos en los extremos 5 y 3 de las secuencias de los ARNt, para dar lugar a los ARNr, ARNt y ARNm maduros. De esta forma los ARNt, situados entre los genes de los ARNr y ARNm, actan como seales de reconocimiento para los enzimas de procesamiento. En particular, la cadena H se transcribe mediante dos unidades de transcripcin solapadas en la regin de los ARNr: la primera de estas unidades comienza delante del gen para el ARNt Phe (lugar de iniciacin H1), termina en el extremo 3 del gen para el ARNr 16S y es responsable de la sntesis de los ARNr 12S y 16S, del ARNtPhe y del ARNtVal. El factor de terminacin (mTERF) se une a una secuencia situada en el gen del ARNtLeu y provoca la terminacin de esta unidad. La segunda unidad de transcripcin comienza cerca del extremo 5 del gen del ARNr 12S (lugar de iniciacin H2) y transcribe la casi totalidad de la cadena pesada; el procesamiento de este ARN policistrnico origina los ARNm de 12 pptidos y los otros 12 ARNt codificados en esta cadena. La transcripcin de la cadena ligera comienza cerca del extremo 5 del ARN 7S (en el bucle-D) y da lugar al iniciador de la replicacin de la cadena pesada, 8 ARNt y 1 pptido (ND6).

-http://www.unav.es/asignatura/genmolhumbq/

32 de 172

Gentica Molecular Humana (F.Ciencias)-

La sntesis de las protenas mitocondriales tiene lugar en ribosomas especficos de la mitocondria, cuyos componentes estn codificados en el ADNmt (ARNr 12S y 16S) y en el genoma nuclear (84 protenas ribosomales). En este sistema de traduccin se sintetizan las trece protenas codificadas en el ADNmt utilizando un cdigo gentico que difiere ligeramente del cdigo gentico universal. As, UGA codifica el aminocido triptfano (Trp) en vez de ser un codn de terminacin, y los codones AUA y AUU se utilizan tambin como codones de iniciacin. La biognesis de la mitocondria depende de la expresin coordinada de los genomas mitocondrial y nuclear, pero hasta ahora se conoce muy poco acerca de los mecanismos que regulan la interaccin de ambos sistemas genticos. La expresin del ADNmt parece estar regulada por el factor de iniciacin de la transcripcin mtTFA, codificado en el genoma nuclear. Este factor podra ser el responsable tanto de los niveles de ARN como del nmero de copias de ADNmt, ya que la replicacin depende de la sntesis de un iniciador de ARN a partir del promotor de la cadena ligera. La regulacin de la relacin entre los ARNr y los ARNm mitocondriales se realiza fundamentalmente mediante la seleccin del lugar de iniciacin de la transcripcin de la cadena pesada, que a su vez est relacionada con el factor mtTERF (que causa terminacin de la transcripcin despus de la sntesis de los ARNr) y con el procesamiento de los ARN primarios. Asimismo, la actividad transcripcional puede estar regulada por estmulos hormonales, especialmente por hormonas tiroideas que actan tanto de un modo indirecto (por activacin de genes nucleares) como directamente sobre el propio ADNmt.

Tema 2. El Genoma Humano en accin


2.1. La cromatina durante el ciclo celular. 2.2. La secuencia influye en el estado funcional de la cromatina. 2.3. Modificaciones epigenticas en la regulacin del estado funcional de la cromatina. 2.4. Relacin entre secuencia, estructura y funcin de la cromatina: territorios cromosmicos.

2.1. La cromatina durante el ciclo celular


En las clulas somticas que tienen ncleo, la molcula de ADN est presente en una forma peculiar llamada originalmente cromatina. Por la estructura de la doble hlice del ADN, sabemos que la distancia entre nucletidos es de 0,34 nm; si el genoma humano haploide tiene 3x109 pares de bases, la longitud total del genoma en forma de doble hlice lineal sera algo superior a 1 metro, y adems cada ncleo contiene dos copias del genoma. Todo este material debe entrar en el ncleo de una clula eucariota, cuyo dimetro medio es de 5 mm. Esto significa que el ADN ha de adoptar un alto grado de empaquetamiento para poder alojarse dentro del ncleo. Este empaquetamiento se lleva a cabo mediante la unin de la doble hlice con varios tipos de protenas para dar lugar a una estructura que es, precisamente, la cromatina. Las clulas eucariotas, al proliferar, siguen una serie de etapas en las que se llevan a cabo los procesos necesarios para dar lugar a dos clulas hijas: duplicar los componentes celulares, segregarlos espacialmente y dividir la clula de modo que las dos clulas resultantes lleven todos los ingredientes necesarios para su correcto funcionamiento. Estas etapas deben completarse en orden, de un modo altamente regulado, y constituyen lo que se llama ciclo celular. En cada ciclo celular se distinguen por tanto varias fases: la interfase (etapa en la que la clula duplica su contenido), la mitosis (etapa en la que los componentes se separan a polos opuestos de la clula) y citoquinesis (separacin fsica de las dos clulas hijas). Probablemente sea la cromatina el componente celular en el que es ms importante la duplicacin y segregacin correctas, ya que esto va a asegurar que la informacin gentica se transmita sin alteraciones. Por tanto, es importante saber cmo se comporta la cromatina en las distintas etapas del ciclo celular.

-http://www.unav.es/asignatura/genmolhumbq/

33 de 172

Gentica Molecular Humana (F.Ciencias)-

La Figura 2.1 muestra las distintas fases del ciclo celular de una clula eucariota y los cambios que sufre la cromatina. El ciclo celular de una clula eucariota se puede esquematizar como muestra la figura. La INTERFASE est constituida por las fases G1, S y G2; durante la fase S se replica la cromatina para dar lugar a dos complementos cromosmicos completos. En la MITOSIS se separan los componentes nucleares y celulares para dar lugar a dos clulas hijas. Durante la interfase, que es la etapa ms larga del ciclo, la cromatina est sujeta a un grado de empaquetamiento de unas 2000 veces, es decir, lo que en su estado natural ocupara un tamao de 2000 mm se reduce a un tamao de 1 mm. Esto se consigue por la unin de la doble hebra de ADN con unas protenas bsicas llamadas histonas, cuyos grupos positivos interaccionan con los grupos negativos del esqueleto fosfato del ADN. Hay 5 tipos principales de histonas, llamadas H1, H2A, H2B, H3 y H4, que se asocian entre s para formar un octmero: dos molculas de H3 junto con dos molculas de H4 forman un tetrmero, y dos dmeros H2A/H2B forman otro tetrmero; ambos tetrmeros se asocian para formar un ncleo proteico (octmero) alrededor del cual se enrolla la molcula de ADN. En concreto, 146 pares de bases de ADN dan 1,65 vueltas alrededor del octmero, y sobre este complejo se une la histona H1. Esta estructura, de unos 10 nm de dimetro, es lo que se conoce con el nombre de nucleosoma, y es la unidad bsica de organizacin de la cromatina. Los nucleosomas estn unidos entre s por el filamento de ADN que se va enrrollando a su alrededor, como bolas en una cuerda, y esto da lugar a la fibra de cromatina de 10 nm. En esta estructura, unos 200 pares de bases ocupan 10 nm, lo que significa un grado de empaquetamiento de unas 6 veces respecto al tamao lineal que ocupara un fragmento de ADN de esa longitud (200 X 0,34 nm = 64 nm).

-http://www.unav.es/asignatura/genmolhumbq/

34 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 2.2. Esquema de un nucleosoma, con el ADN rodeando el octmero de histonas y la histona H1 en el origen del bucle. Imagen obtenida de http://themedicalbiochemistrypage.org/dna.html En condiciones fisiolgicas, la fibra de 10 nm sufre un segundo grado de enrollamiento sobre s misma para dar lugar a una estructura en forma de solenoide, con 6 nucleosomas por vuelta. Esta configuracin constituye la fibra de 30 nm, en la que el grado de empaquetamiento del ADN es de unas 40 veces. La fibra de 30 nm sufre diferentes grados de empaquetamiento durante interfase y, especialmente, en la mitosis, en la que la cromatina alcanza su empaquetamiento mximo (unas 10.000 veces) y da lugar a las estructuras visibles que llamamos cromosomas. Estos tipos de alto grado de enrollamiento se consiguen porque la fibra de 30 nm forma asas que se unen por su base a una estructura proteica que sirve como andamio. El andamio ("scaffold" en ingls) est constituido por protenas no histonas, de las que las principales son la Sc1 (idntica a la topoisomerasa II) y la Sc2 SMC2, que pertenece a una familia de protenas llamada SMC (S tructural Maintenance of Chromosomes, en ingls). Estas protenas cumplen tambin un papel importante en el mantenimiento de la condensacin de la cromatina (de ah que tambin se les llame condensinas). Las asas de la fibra de 30 nm se unen al andamio mediante unas secuencias ricas en Adeninas y Timinas llamadas SAR (Scaffold Attachment Region en ingls), que tienen gran afinidad por las protenas del andamio. La estructura que resulta de este enrollamiento da lugar a una fibra de unos 300 nm de grosor, en la que el grado total de empaquetamiento del ADN es de unas 2.000 veces. Las SAR son regiones importantes, dispersas por el genoma, que flanquean genes y a menudo se asocian con los orgenes de replicacin que veremos ms adelante, por lo que se piensa que pueden jugar un papel importante en la funcin y estructura de la cromatina. Finalmente, el empaquetamiento mximo de la cromatina durante la mitosis se consigue al espiralizarse la fibra de 300 nm para dar lugar a una estructura de 600 nm de grosor (una cromtide) en la que el ADN alcanza ya un grado de empaquetamiento de 10.000 veces. El video de la Figura 2.3 muestra los distintos grados de empaquetamiento que sufre la cromatina durante el ciclo celular.

2.2. La secuencia influye en el estado funcional de la cromatina


Como ya se ha dicho, el grado de empaquetamiento no es uniforme a lo largo de todo el genoma. De hecho, en el ncleo en interfase siempre se distingui una cromatina denominada eucromatina, poco condensada, y otra llamada heterocromatina, con un mayor grado de condensacin. Hoy sabemos que estas categoras morfolgicas tienen un correlato funcional, ya que la eucromatina es transcripcionalmente ms activa mientras que los genes incluidos en heterocromatina tienen un bajo nivel de expresin. La heterocromatina, a su vez, puede ser de dos tipos: constitutiva, que nunca se transcribe y se localiza en los centrmeros y en la constriccin secundaria de algunos cromosomas; facultativa, que en el fondo es un tipo de eucromatina que se heterocromatiniza en situaciones concretas, como es el caso del cromosoma X inactivo en las mujeres. Adems de estas dos grandes categoras de cromatina, es importante comprender que dentro de las regiones eucromticas la cromatina tampoco es totalmente homognea, como queda reflejado, por ejemplo, -http://www.unav.es/asignatura/genmolhumbq/ 35 de 172

Gentica Molecular Humana (F.Ciencias)-

en su distinta repuesta a varias tinciones. Este comportamiento es precisamente la base del patrn de bandas caracterstico de cada cromosoma y que permite la creacin del cariotipo convencional. Como veremos en un captulo posterior, la tincin con un colorante llamado Giemsa produce unas bandas oscuras (bandas G) separadas por bandas claras (bandas R). La tincin con otra sustancia llamada Quinacrina (que se une especficamente a regiones ricas en adeninas y timinas) produce un patrn de bandas similar a las bandas G, mientras que la tincin con Cromomicina-A (que se une preferentemente a regiones ricas en guaninas y citosinas) genera un patrn similar a las bandas R. Por tanto, las peculiaridades morfolgicas de la cromatina son debidas, al menos en parte, a diferencias en la secuencia de nucletidos del genoma; el modelo del andamio (scaffold) que vimos en el apartado anterior permite explicar esta relacin, ya que las bandas G representan regiones con un mayor grado de empaquetamiento del ADN, lo que implica una mayor densidad de las regiones de unin al andamio (llamadas SAR). Como las SAR son relativamente ricas en adenina y timina, esto explica que estas regiones genmicas se tian ms intensamente por Quinacrina y Giemsa, mientras las bandas R, ms ricas en guanina y citosina, tienen un menor grado de empaquetamiento, menor densidad de SAR y se tien dbilmente por estos colorantes. Por tanto, las distintas bandas del cariotipo reflejan no slo diferencias en la condensacin de la cromatina, sino tambin diferencias en su composicin: ya hemos visto que el genoma humano tiene un contenido medio en G+C del 41%, pero que esto no se distribuye de manera uniforme por todo el genoma. A su vez, las diferencias en condensacin y en composicin de las distintas regiones de cromatina se correlacionan con otra variable importante: la riqueza en genes y su actividad transcripcional. Por ejemplo, se estima que un 80% de los genes se localizan en bandas R (las ms ricas en nucletidos G+C), que son las menos condensadas. Tambin se ha observado que, en general, las bandas R son de replicacin temprana, mientras que las bandas G son de replicacin ms tarda. La replicacin del ADN en eucariotas comienza en muchos orgenes de replicacin durante la fase S del ciclo celular, pero no todos los orgenes de replicacin comienzan a funcionar a la vez: hay unos orgenes que siempre comienzan al principio de la fase S (replicacin temprana) y otros que van comenzando a funcionar ms tarde (replicacin tarda). Asimismo, se sabe que los genes constitutivos (housekeeping en ingls), que son los que se expresan en todos los tejidos, se replican temprano; por el contrario, los genes que estn en regiones heterocromticas (el cromosoma X inactivo, por ejemplo) son de replicacin ms tarda. Parece —por tanto— que regiones con alta densidad de genes, ricas en C+G y descondensadas se replican antes que regiones silenciadas con baja densidad de genes. Otro aspecto que diferencia los distintos tipos de bandas es la acetilacin de las histonas. Como se ver a continuacin, se ha podido comprobar que la acetilacin de las histonas que forman los nucleosomas lleva a la formacin de una cromatina ms abierta, que permite mejor el acceso de factores de transcripcin y la expresin de los genes contenidos en esas regiones. Esto se debe a que las colas amino-terminales de las histonas interaccionan con ms fuerza entre s y con el ADN cuando los grupos psilon-amino de las lisinas estn en su forma des-acetilada; la acetilacin relaja esas interacciones y descondensa parcialmente la fibra de 30 nm y la unin del ADN con los nucleososmas. Curiosamente, se ha comprobado que las histonas de las bandas G estn menos acetiladas que las histonas de las bandas R. Esto ayudara tambin a explicar la menor condensacin de la cromatina en las bandas R, y nos proporciona un mecanismo para entender por qu las bandas R se replican antes y son ms activas transcripcionalmente: por un lado, no necesitan descondensarse para que se lleve a cabo la replicacin, y por otro constituyen unos dominios en los que el ADN es ms accesible a los factores de transcripcin. Figura 2.4 Este video muestra el proceso de acetilacin de la lisina, y las modificaciones covalentes que sufren algunas lisinas de los extremos N-terminales de las histonas H3 y H4. Tambin se explica esquemticamente cmo estas modificaciones contribuyen a modificar el grado de compactacin de una regin de cromatina. En resumen, es importante darse cuenta de que los mecanismos bsicos de regulacin de la expresin gnica estn sometidos a un nivel superior de regulacin, dependiente de la situacin de un gen dentro del genoma y del estado funcional de la cromatina en que se encuentra, que a su vez est influido por el tipo de secuencias que la componen. Generalizando, podemos resumir las principales caractersticas de los dos -http://www.unav.es/asignatura/genmolhumbq/ 36 de 172

Gentica Molecular Humana (F.Ciencias)-

estados de cromatina ms frecuentes, representados por los dos tipos principales de bandas citogenticas (banda G, oscuras, y bandas R, claras):

Bandas G

Bandas R

Densidad en genes

Baja

Alta

Porcentaje de G+C

Bajo

Alto

Replicacin

Tarda

Temprana

Composicin

Ricas en A+T

Ricas en G+C

Acetilacin Histonas

Baja

Alta

Repeticiones predominantes LINE

SINE

2.3. Modificaciones epigenticas en la regulacin de la cromatina


Es muy importante comprender que los aspectos estructurales y funcionales se integran en un modelo "dinmico", segn el cual una regin de cromatina estar en un estado ms o menos favorable a la expresin gnica dependiendo del tipo de secuencias que la forman y tambin de las modificaciones epigenticas a ese nivel. Por modificaciones epigenticas se entienden todos aquellos cambios que sufre la cromatina pero que no afectan a la secuencia de nucletidos: por eso no son modificaciones "genticas", sino que estn "por encima" (que es lo que significa epi en griego). En los ltimos aos se ha comprobado experimentalmente la gran importancia que tienen los mecanismos que regulan la actividad de la cromatina mediante cambios epigenticos. Para entender esto, es importante recordar que la actividad transcripcional basal en eucariotas es esencialmente restrictiva, en el sentido de que los promotores estn en estado inactivo hasta que se ponen en marcha por la accin de los elementos llamados activadores y el ensamblaje del complejo basal de transcripcin. Para que estos factores proteicos se unan a sus dianas en el ADN es necesario que la cromatina de esa regin est relativamente descondensada, para exponer ms fcilmente la doble hlice y permitir el acceso de factores proteicos. De hecho, los genes que son transcripcionalmente activos se asocian habitualmente con sitios hipersensibles a DNAsa I, regiones cortas (unos pocos cientos de pares de bases) formadas por ADN que no est asociado a nucleosomas, precisamente porque se encuentra unido a factores de transcripcin.

-http://www.unav.es/asignatura/genmolhumbq/

37 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 2.5 Las modificaciones de las histonas influyen en las interacciones entre nucleosomas y, por tanto, en el grado de condensacin de la cromatina. En esta figura se muestra una regin abierta (con nucleosomas ms separados) flanqueada por regiones ms condensadas. Estas regiones menos condensadas pueden reconocerse porque constituyen sitios hipersensibles a ADNasa I, ya que permiten el acceso de esta nucleasa a la molcula de ADN. Tambin se ha visto que la unin al ADN de factores proteicos, como factores de transcripcin, se ve favorecida en estas regiones. Los nucleosomas son, por tanto, un elemento fundamental para mantener este estado basal restrictivo, al impedir el acceso de la maquinaria transcripcional a los promotores. La represin transcripcional mediada por nucleosomas se debe tanto a las interacciones directas del octmero de histonas con el ADN, como a las interacciones que se originan entre nucleosomas vecinos para dar lugar a la fibra de cromatina. Como hemos visto ms arriba, las colas N-terminales de las histonas de los nucleosomas quedan libres hacia fuera, y son las regiones ms susceptibles de ser modificadas qumicamente para variar su carga y alterar las interacciones, tanto entre histonas y ADN como entre nucleosomas vecinos. Por tanto, si conseguimos relajar alguna de estas interacciones conseguiremos favorecer la transcripcin de los genes que estn incluidos en esas regiones. Esta relajacin se puede conseguir gracias a que las colas N-terminales de las histonas tienen una serie de aminocidos (lisinas y serinas, principalmente) que pueden sufrir modificaciones covalentes del tipo acetilacin, metilacin fosforilacin, y que van a ser cruciales en la regulacin de estos fenmenos. A su vez, estos cambios se coordinan con otras modificaciones epigenticas que sufre la propia cadena de ADN en forma de metilacin de algunos nucletidos concretos, y en su conjunto ambos procesos constituyen un importante mecanismo de regulacin de la actividad transcripcional. A continuacin veremos por separado las modificaciones epigenticas que sufre la cromatina, por una parte, y el ADN por otra. A. Modificacin de la cromatina. Para superar la represin basal debida a la presencia de nucleosomas y facilitar la expresin de un gen, los activadores de la transcripcin pueden potenciar la actividad transcripcional alterando, en primer lugar, la propia estructura de la cromatina: aunque el activador no se

-http://www.unav.es/asignatura/genmolhumbq/

38 de 172

Gentica Molecular Humana (F.Ciencias)-

una directamente al promotor de un gen, puede reclutar distintas actividades modificadoras de la cromatina cuya accin sea conferir a esa regin un estado que facilite la transcripcin. Estas actividades pueden ser de varios tipos: complejos proteicos implicados en el remodelamiento nucleosomal: son capaces de mover los nucleosomas de su posicin para dejar expuesta una regin promotora y permitir la expresin gnica. Este tipo de actividad est mediada por complejos multiproteicos con actividad ATPasa, de los cuales el primero en ser aislado fue el complejo SWI/SNF (primero se identific en levaduras, despus en humanos). Este complejo desestabiliza el nucleosoma al romper los contactos del ADN con el octmero, que queda libre para moverse y asociarse con una regin vecina de la molcula de ADN. Todos los remodeladotes de nucleosomas pertenecen a la familia SNF2 de ATPasas, y pueden dividirse en 7 subgrupos dependiendo de los dominios proteicos que contienen. Figura 2.6 Los complejos "remodeladores" de la cromatina tienen actividad ATPasa y son capaces de mover nucleosomas para descubrir regiones del ADN necesarias para la transcripcin. En este video se ilustra la accin de un remodelador tpico. Las cuatro familias ms importantes y mejor estudiadas de estos remodeladores son SWI2, ISWI, CHD e Ino80. complejos implicados en la acetilacin de histonas: el factor Gcn5 de levadura fue el primer activador transcripcional con actividad acetilasa de histonas descubierto, en 1996. Posteriormente se vio que otros co-activadores de la transcripcin de mamferos tambin posean actividad acetil-transferasa, factores tales como p300, CBP (CREB-BP) y P/CAF, de ah que hoy en conozcan en conjunto con el nombre de HAT (Histone AcetylTransferase). stos actan como factores de transcripcin integradores de diversas vas de transduccin de seales implicadas en el control del ciclo celular y de los procesos de diferenciacin, reparacin y apoptosis. Otros activadores transcripcionales con actividad HAT son el factor de transcripcin TAFII250 (que forma parte del complejo TFIID), SRC-1 y ACTR (coactivadores de receptores nucleares). Al igual que la acetilacin de las histonas conduce a la activacin transcripcional, la des-acetilacin de las histonas crea una estructura cromatnica ms condensada que favorece el silenciamiento de la transcripcin de los genes incluidos en la esa regin genmica. En este sentido, se ha comprobado que los factores HDAC1 y HDAC2 (Histone De-Acetylase), cuya funcin es des-acetilar las histonas, estn presentes en el complejo Sin3-NcoR, un co-represor transcripcional que regula la expresin de genes importantes en el ciclo celular y en el desarrollo embrionario. En conjunto, acetilasas y des-acetilasas actan sobre los mismos aminocidos de las colas amino-terminales de las histonas H3 y H4, especialmente las lisinas 9, 14, 18 y 23 de la histona H3 y las lisinas 5, 8, 12 y 16 de la histona H4. En la figura 2.4 ya se ha visto el posible mecanismo por el que la des-acetilacin de las histonas favorece la compactacin de nucleosomas vecinos e impide la transcripcin en esa regin. De hecho, se ha comprobado que la des-acetilacin de la lisina 16 en la histona H4 provoca la condensacin de la fibra de 10 nm, mientras que la acetilacin de este residuo impide la formacin de la fibra de 30 nm y permite la interaccin con co-activadores de la transcripcin. otras modificaciones muy importantes son la fosforilacin de la histona H3 en la serina 10 y la metilacin de las lisinas 4, 9, 27, 36 y 79 en la histona H3 y de la lisina 20 de la histona H4, metilacin catalizada por unos complejos proteicos que tienen actividad metil-transferasa. Se ha comprobado que estas modificaciones actan en coordinacin con la acetilacin, estableciendo lo que ahora se conoce como el "Cdigo de Histonas". Segn este cdigo, una regin se comportar como eucromatina como heterocromatina dependiendo de las modificaciones epigenticas de las histonas que conforman los nucleosomas de la regin; las regiones limtrofes, en las que se da una transicin de un tipo de cromatina al otro, muestran caractersticas propias de ambos tipos de cromatina, y son capaces de unir complejos proteicos llamados aisladores (en ingls "insulator"), que forman una especie de barrera fsica e impiden que un tipo de cromatina se extienda ms all del lmite de la regin e invada la regin vecina. De modo general, el cdigo de histonas establece que una regin de eucromatina se caracteriza por tener la lisina 4 de la histona H3 metilada (con uno, dos o tres grupos -http://www.unav.es/asignatura/genmolhumbq/ 39 de 172

Gentica Molecular Humana (F.Ciencias)-

metilo), y las lisinas 9 y 14 de la misma histona acetiladas. Se ha comprobado que esta configuracin tiene la propiedad de unirse a un dominio proteico llamado "bromodominio", que est presente en muchos activadores de la transcripcin. Una regin con estas caractersticas puede heterocromatinizarse si sufre una cascada de alteraciones: la prdida de la metilacin de la lisina 4, la desacetilacin progresiva de las lisinas 9 y 14, y finalmente la metilacin de la lisina 9 constituyen una marca de heterocromatina, a la que se unen protenas que contienen un dominio de silenciamiento llamado "cromodominio" que recluta factores de silenciamiento como la protena HP1 (protena de heterocromatina-1). Estas interacciones estn influidas tambin por la fosforilacin de la serina 10 de la histona H3; por ejemplo, dicha fosforilacin -generada por la quinasa Aurora B— inhibe la unin de HP1 con la lisina 9 metilada durante la mitosis. Figura 2.7 El "Cdigo de histonas" permite saber el tipo de cromatina que formar una regin dependiendo de las modificaciones covalentes de las histonas en esos nucleosomas. En este video se muestran las distintas modificaciones de una regin de la histona H3, y se esquematiza el tipo de modificaciones tpicas de regiones de heterocromatina y de eucromatina. Estudios recientes han aportado nuevos datos sobre las modificaciones que sufren las histonas. En lo que se refiere a las metilaciones, diversos estudios de inmunoprecipitacin de cromatina han podido determinar la posicin de dichas modificaciones a lo largo de todo el genoma.Esto ha permitido comparar el estado de la cromatina que rodea al promotor frente al de otras regiones gnicas. Adems, combinando estos datos con los niveles de expresin de cada gen, se hapodido definir mejor el cdigo de metilaciones de histonas que caracteriza los promotores de genes activos y de genes silenciados. Esta informacin se resume en la siguiente figura, que muestra un gen activo tpico (la flecha hacia la derecha indica transcripcin activa a partir de ese punto). Las lneas de colores indican la intensidad de unin de anticuerpos frente aARN polimerasa II (verde), tri-metilacin de la lisina 4 de la histona H3 (azul), acetilacin de las lisinas 9 y 14 de la histona H3 (marrn) y tri-metilacin de la lisina 36 de la histona H3 (naranja). Puede verse que sta ltima se encuentra sobre todo en los nucleosomas que incluyen el cuerpo y el final del gen, mientras que las otras modificaciones son ms intensas en los nucleosomas correspondientes al sitio de inicio de la transcripcin.

La Figura 2.8 muestra las modificaciones de histonas de regiones gnicas segn la actividad transcripcional.

Los genes no activos, en cambio, estn caracterizados por la ausencia de estas modificaciones y la presencia de metilacin de la lisina 9 de la histona H3 (H3K9me1) y la tri-metilacin de la lisina 27 de la histona H3 (H3K27me3) en la zona del inicio de la transcripcin, y la tri-metilacin de la lisina 79 de la histona H3 (H3K79me3) a lo largo de todo el cuerpo del gen.

-http://www.unav.es/asignatura/genmolhumbq/

40 de 172

Gentica Molecular Humana (F.Ciencias)-

B. La metilacin del ADN juega un papel fundamental en el mantenimiento del silenciamiento transcripcional. El ADN de vertebrados se metila en el carbono 5 de las citosinas que estn en el dinucletido CpG (la "p" indica el grupo fosfato que une una citosina con una guanina, en direccin 5' -> 3'). Curiosamente, la abundancia de este dinucletido en el genoma de vertebrados es slo un 25% de lo esperado, es decir, el porcentaje normalizado de este dinucletido es de 0,25. En efecto, si el contenido en C+G del genoma es del 41%, la probabilidad esperada de encontrar un dinucletido CpG es (0,205 x 0,205) = 0,042 (o sea, 4,2%); en cambio, la frecuencia observada de este dinucletido est en torno al 1% en el genoma humano, de ah que el porcentaje normalizado sea 1/4 = 0,25. Adems, los dinucletidos CpG no estn distribuidos homogneamente a lo largo del genoma, sino que son ms abundantes en los genes, tanto en los exones como, sobre todo, alrededor del inicio de la transcripcin. Pues bien, los dinucletidos CpG que tienen metilada la citosina son los que estn distribuidos a lo largo de la secuencia de genes. Por el contrario, los dinucletidos CpG que no estn metilados que tienden a concentrarse en regiones que se denominan islas CpG. Aunque estas islas se han definido tradicionalmente como las regiones de un tamao igual o superior a 500 pb, con un contenido total de G+C superior a 50% y con un cociente de dinucletidos CpG observados frente a esperados superior a 0,6, hoy en da se pueden definir por su porcentaje normalizado de CpG. De hecho, el anlisis de todos los promotores del genoma humano identifica dos tipos de genes: los que tienen un promotor con un porcentaje normalizado de CpG en torno al 0,61 y los que tienen un promotor con un porcentaje normalizado de CpG en torno al 0,23. Los primeros constituyen un 70% de todos los promotores, y corresponden a los genes constitutivos domsticos ("housekeeping" en ingls). Por el contrario, los promotores con bajo porcentaje normalizado de CpG constituyen un 30% del total de los promotores, y corresponden a los genes que se expresan en tejidos especficos. Los promotores que contienen una isla CpG estn habitualmente hipometilados en la lnea germinal, lo cual les protege frente a las transiciones C->T que sufren las citosinas metiladas. Figura 2.9 En este video se puede ver el concepto de "isla CpG", al examinar la distribucin de dinucletidos CpG a lo largo de un gen y ver su estado de metilacin. La metilacin del ADN est catalizada por unas metil-transferasas especficas de las citosinas que forman parte de dinucletidos CpG, y se conocen bsicamente dos tipos de estas metil-transferasas de ADN. Las DNMT3A y DNMT3B son responsables de la metilacin de novo, es decir, la metilacin de dinucletidos CpG que no estaban previamente metilados. En cambio, la DNMT1 (ADN-metil-transferasa-1) es responsable de mantener la metilacin durante la replicacin. En efecto, dado que en la doble cadena de ADN un dinucletido CpG tiene realmente dos citosinas metilables (ya que existe un CpG en cada una de las cadenas de la doble hlice), un sitio totalmente metilado tendr realmente dos citosinas metiladas. Tras la replicacin del ADN, ambas dobles hlices conservarn una cadena con el CpG metilado (la proveniente de la molcula original), mientras que la cadena de nueva sntesis estar sin metilar. Esto genera dinucletidos CpG hemi-metilados, es decir, metilados en una de las citosinas pero no en la otra; la DNMT1 tiene la funcin de re-metilar precisamente estos dinucletidos para restablecer el estado inicial de metilacin completa que tena la molcula original. Figura 2.10 Un dinucletido CpG totalmente metilado quedar hemi-metilado tras la replicacin del ADN de esa regin. La metilasa de mantenimiento DNMT1 se encarga de re-metilar estas regiones, como muestra este video. Numerosos estudios han mostrado el significado biolgico de la metilacin del ADN: 1) es un importante mecanismo epigentico de silenciamiento gnico a nivel transcripcional, y permite mantener el silenciamiento de ciertos genes durante los procesos de diferenciacin celular; 2) la metilacin es un mecanismo de defensa frente a elementos mviles del genoma, cuyos promotores estn habitualmente silenciados por metilacin; y 3) la metilacin es un mecanismo estabilizador de la cromatina, especialmente de la heterocromatina pericentromrica, ya que la des-metilacin de este tipo de cromatina conduce a la aparicin de reordenamientos cromosmicos severos.

-http://www.unav.es/asignatura/genmolhumbq/

41 de 172

Gentica Molecular Humana (F.Ciencias)-

Los mecanismos moleculares por los que la metilacin conduce al silenciamiento transcripcional pueden ser mltiples: impidiendo la unin de factores de transcripcin al promotor. Por ejemplo, algunos factores de transcripcin generales como Sp1, CREB, E2F NF-kB se unen a dominios que contienen CpG, y esta unin disminuye cuando estos dominios estn metilados. Sin embargo, ste mecanismo no se puede aplicar de modo general a todos los genes. mediante la unin especfica de represores transcripcionales al ADN metilado. Existen varias protenas de unin a los dinucletidos CpG metilados, denominadas genricamente MeCP ("Methyl-Cytosine binding Protein") MDB ("Methyl Binding Domain"), que forman parte de complejos con actividad represora de la transcripcin. Por ejemplo, MeCP-2 es una protena que contiene un dominio de unin a dinucletidos CpG metilados, as como otro dominio por el que se une a un represor transcripcional llamado Sin3. Curiosamente, Sin3 reprime la transcripcin a travs de su unin con HDAC2 (que, como ya hemos visto, des-acetila las lisinas de la histona H3). De esta manera, la represin transcripcional debida a la metilacin de los dinucletidos CpG se produce gracias a la asociacin entre metilacin del ADN y acetilacin de la cromatina, ya que el dominio de represin transcripcional de MeCP-2 es capaz de reclutar el complejo Sin3-NCoR-HDAC2 y as iniciar un foco de cromatina hipoacetilada en una regin especfica del genoma. Esto explica que las regiones en las que el ADN est metilado sean capaces de silenciar genes cercanos (aunque stos no tengan sus dinucletidos CpG metilados), al englobarlos en una regin genmica silenciada por des-acetilacin. Figura 2.11 La regulacin epigentica de la transcripcin gnica incluye tanto la metilacin del ADN como las modificaciones covalentes de las histonas. Como se muestra en este video, es precisamente la interaccin entre ambos procesos lo que permite modificar la cromatina para facilitar la transcripcin o para silenciar una regin. De todas formas, uno de los hallazgos novedosos del proyecto ENCODE (mencionado en el captulo 1) ha sido que la relacin entre metilacin y unin de factores de transcripcin es, a menudo, contraria a lo que se intua. La visin clsica es que lo primero es la metilacin del ADN, y esto impide (o permite) la unin de factores de transcripcin y as regula la expresin de un gen. Ahora, en cambio, sabemos que en muchos casos es al revs: la unin de factores de transcripcin impide la metilacin de esa regin de ADN. Dado que se trata de procesos reversibles, en un equilibrio dinmico, esto permite una regulacin muy fina de la expresin gnica. Como ya se ha mencionado, una propiedad muy importante de la metilacin del ADN es que es reversible: se ha comprobado que los promotores que han sido silenciados por metilacin pueden reactivarse si se des-metila esa regin. Un mecanismo posible para explicar esta reactivacin es la prdida de la metilacin durante la replicacin: esto sucedera si ciertos factores de transcripcin activadores nucleares consiguieran unirse a sus promotores inmediatamente despus de la replicacin y antes de que acte la DNMT1 de mantenimiento en los sitios hemi-metilados. Una vez que se estabiliza el complejo basal de transcripcin sobre esa regin, ste atraera algunos componentes con actividad HAT, que a su vez actuaran manteniendo la cromatina abierta y permitiendo la transcripcin. Esto, adems, impedira la accin de la DNMT1 y terminara por eliminar la metilacin en esa regin tras varios ciclos de replicacin. Este mecanismo se conoce como des-metilacin pasiva. Otro mecanismo alternativo para explicar la re-expresin de genes silenciados por metilacin, sobre todo en clulas diferenciadas que ya no se replican, es la desmetilacin activa, aunque todava no se ha aislado de modo concluyente ninguna des-metilasa de ADN. Estudios recientes han demostrado que una protena llamada TET1 tiene actividad 5-metilcitosina(5mC)-hidroxilasa, convirtiendo las 5mC en 5-hidroxi-mC en clulas de mamferos. Estas 5-hidroxi-mC son despus desaminadas a 5-hidroxi-mU por unas desaminasas llamadas AID o APOBEC, y los 5-hidroxi-mU son convertidos en citosinas por el sistema de reparacin BER (que se estudiar en detalle en el Tema 3) a travs de una ADN-glicosilasa llamada TDG. -http://www.unav.es/asignatura/genmolhumbq/ 42 de 172

Gentica Molecular Humana (F.Ciencias)-

En el ao 2009 se descubri que algunas clulas humanas llevan un nuevo tipo de metilacin del ADN (previamente descrito slo en plantas), que no afecta a las citosinas de dinucletidos CpG sino a las citosinas de los trinucletidos CHG CHH (siendo H cualquier nucletido excepto G). En humanos, esta modalidad de metilacin slo se da en clulas pluripotenciales, llegando a constituir un 25% de todas las citosinas metiladas en clulas madre embrionarias. Al contrario que la metilacin de CpGs, esta metilacin no-CpG es ms intensa en el cuerpo de los genes y su relacin con la expresin gnica no es directa. Se piensa que este nuevo tipo de metilacin juega un papel importante en el mantenimiento del estado pluripotencial, ya que desaparece durante la diferenciacin celular.

Figura 2.12 Proceso de desaminacin activa de citosinas metiladas en mamferos. En resumen, la metilacin del ADN constituye un importantsimo mecanismo epigentico de regulacin de la expresin gnica, debido a su interaccin con los mecanismos que modifican la estructura de la cromatina. El mantenimiento de los patrones de metilacin explica tambin que las modificaciones epigenticas sean heredadas establemente tras la replicacin del ADN. Adems, como ya se ha mencionado, la metilacin tiene importantes implicaciones biolgicas, y por tanto la alteracin de los procesos normales de metilacin de la cromatina puede perturbar procesos fisiolgicos importantes. En primer lugar, por ser un mecanismo fundamental en el silenciamiento de retrovirus endgenos, transposones y ADN satlite, las alteraciones en la metilacin de estos elementos puede provocar numerosas anomalas genticas . Adems, la metilacin es la base molecular de los fenmenos de impronta genmica (imprinting) que se estudiarn ms adelante, y es un mecanismo fundamental en la regulacin de la expresin gnica durante el desarrollo embrionario. De hecho, el embrin sufre una onda de des-metilacin genmica global en la fase de mrula de 8 clulas, seguida por la re-metilacin gradual que vuelve a fijar los patrones de metilacin en la fase de blastocisto. Tambin la inactivacin del cromosoma X en mujeres es un proceso bsicamente controlado por procesos de metilacin, acetilacin y silenciamiento. Por tanto, cada vez est ms claro que la des-regulacin de las modificaciones epigenticas de la cromatina est en la base de algunas enfermedades humanas. El caso ms claro es el de una enfermedad neurolgica hereditaria llamada Sndrome de Rett, en el que se han identificado mutaciones en el gen que codifica la protena de unin a metil-citosinas MECP2. Probablemente, esto origine un exceso de ruido transcripcional por falta de silenciamiento global de muchos genes, con efectos ms marcados en el cerebro que en otros rganos. Por otra parte, el papel de la metilacin en cncer tambin est cobrando cada vez ms importancia, ya que se ha visto que muchos tipos de tumores tienen alteraciones importantes en los procesos de metilacin de la cromatina: -http://www.unav.es/asignatura/genmolhumbq/ 43 de 172

Gentica Molecular Humana (F.Ciencias)-

la desaminacin de citosinas metiladas (debida habitualmente a la accin de una citidn-desaminasa, bien por desaminacin hidroltica espontnea) provoca un cambio de Citosina por Timina, haciendo que los dinucletidos CpG metilados sean puntos calientes (hotspots) para la generacin de mutaciones de este tipo. De hecho, se ha estimado que el 30% de las mutaciones encontradas en tumores en el gen TP53 (que codifica la protena p53, un supresor tumoral importante) son transiciones C->T que tienen lugar dentro de dinucletidos CpG. se ha comprobado que durante el proceso de iniciacin tumoral hay una hipometilacin global del genoma de la clula pre-maligna, lo que provoca un aumento en la inestabilidad genmica y la aparicin de anomalas cromosmicas. Por ejemplo, los ratones en los que el gen DNMT1 ha sido inactivado muestran una elevada tasa de deleciones o duplicaciones de regiones cromosmicas. Adems, algunos oncogenes concretos se sobreexpresan en algunos tumores por des-metilacin de sus promotores (por ejemplo el oncogn BCL2). Del mismo modo, se ha identificado una enfermedad ( Sndrome ICF, siglas de Inmunodeficiencia, inestabilidad Centromrica y defectos Faciales) en la que los pacientes tienen mutaciones en el gen DNMT3B, que codifica una metil-transferasa que metila especficamente los satlites centromricos 2 y 3; la desmetilacin de esas regiones de heterocromatina provoca fusiones entre cromosomas. En conjunto, estos datos sugieren que la metilacin es un mecanismo muy importante para mantener la estabilidad del genoma. al mismo tiempo, la hipermetilacin puntual de algunos genes supresores tumorales, con el consiguiente silenciamiento y prdida de funcin, es un mecanismo muy frecuente de generacin de distintos tipos de cncer. Por ejemplo, el gen RB1 est frecuentemente metilado en un tipo de tumores llamados retinoblastomas espordicos. Tambin es frecuente la hipermetilacin (y silenciamiento) del gen supresor tumoral p16 en varios tipos de tumores; la hipermetilacin del gen VHL (Von Hippel-Lindau) en 20% de los carcinomas de clulas renales espordicos; la inactivacin, por hipermetilacin, del gen de reparacin de desemparejamientos hMLH1 en tumores de colon espordicos que muestran inestabilidad de microsatlites. En conjunto, se estima que en tejido tumoral hasta un 10% de las islas CpG estn metiladas, en contraste con clulas normales en las que este porcentaje es mucho ms bajo. por su parte, algunos complejos con actividad modificadora de la cromatina se han asociado tambin con el desarrollo de cncer. Por ejemplo, el gen AIB1, que tiene actividad acetilasa de histonas, est amplificado en cncer de mama y por tanto se expresa a niveles ms altos de lo normal. Por otro lado, el co-activador transcripcional CBP, que tambin funciona como una acetilasa de histonas, est fusionado con el gen MOZ con el gen MLL en pacientes con leucemia mieloide aguda; esta fusin hace que la actividad acetilasa est aumentada en determinadas clulas de la mdula sea y esto desencadena la leucemia. Adems, otro co-activador transcripcional con actividad acetilasa de histonas (la protena p300) est mutado en cncer colorrectal y delecionado en el 80% de los glioblastomas, un tipo de tumor cerebral. Lo mismo puede decirse de los complejos con actividad des-acetilasa de histonas (HDAC): ya hemos visto que la supresin de Myc y la unin de Rb con el factor de transcripcin E2F dependen en gran medida de su unin con complejos que tienen actividad des-acetilasa. Adems, se ha demostrado que algunas oncoproteinas virales como HPV E7 el antgeno T de SV40 inactivan el gen RB1 al impedir su unin con complejos que tienen actividad HDAC. Finalmente, las translocaciones asociadas con la leucemia promieloctica producen fusiones entre factores de transcripcin que interaccionan con diversas acetilasas y des-acetilasas de histonas, con complejos remodeladores de la cromatina y con protenas que tienen actividad metil-transferasa de histonas. Figura 2.13 La regulacin de la transcripcin de los genes que responden al cido retinoico se lleva a cabo mediante la actuacin de complejos con actividad acetilasa o des-acetilasa de histonas. Este video muestra la regulacin normal de la expresin de un gen en respuesta a la presencia de cido retinoico, y la alteracin de este mecanismo en la leucemia promieloctica aguda con la translocacin cromosmica 15;17. -http://www.unav.es/asignatura/genmolhumbq/ 44 de 172

Gentica Molecular Humana (F.Ciencias)-

Considerando todos los ejemplos citados en los prrafos anteriores, podemos concluir que los procesos que regulan la metilacin de la cromatina estn implicados en la iniciacin y progresin tumoral; esto, adems, abre nuevas posibilidades teraputicas en muchos tipos de cncer, ya que el estado de metilacin es potencialmente modificable mediante frmacos.

2.4. Relacin entre secuencia, estructura y funcin de la cromatina: territorios


Al ocuparnos de los mecanismos que regulan la funcin del genoma a nivel global, es importante tener en cuenta el nivel superior de organizacin de un genoma dentro del ncleo. En los ltimos aos se ha puesto en evidencia que distintas regiones de la fibra de cromatina tienden a ocupar posiciones concretas en el ncleo, dependiendo de la secuencia subyacente, del estado transcripcional de los genes de esa regin y de sus modificaciones epigenticas, del tiempo de replicacin del ADN implicado, etc. Por tanto, cada vez est ms claro que si queremos tener una imagen completa de cmo se regula la funcin del genoma, no podemos ignorar aspectos estructurales tales como la composicin en nucletidos o la posicin dentro del ncleo. Uno de los aspectos ms intrigantes de la biologa genmica de los ltimos aos es la organizacin espacial de la cromatina dentro del ncleo de la clula eucariota, dando lugar a lo que se han denominado " territorios cromosmicos". Este concepto ha venido a completar la imagen del ncleo eucariota como una estructura compartimentalizada, en la que distintas regiones contienen maquinarias especficas que llevan a cabo funciones concretas. Esta nocin debe integrarse con la presencia de dominios cromatnicos definidos y ms o menos estables a lo largo de la vida de una clula. Diversos estudios han mostrado de forma convincente que la cromatina correspondiente a cada uno de los cromosomas tiende a ocupar unas posiciones concretas en el ncleo en interfase, y que esas posiciones tienden a mantenerse durante el ciclo celular. Por ejemplo, la posicin de un cromosoma concreto dentro del ncleo est relacionada con el tamao del cromosoma y con su riqueza en genes, que ―como hemos visto― se correlaciona tambin con la secuencia de nucletidos subyacente. En general, se considera que los cromosomas pequeos tienden a localizarse hacia el interior del ncleo; igualmente, cromosomas ricos en genes tienden a ocupar posiciones centrales. Tambin existen datos que muestran que las regiones pobres en genes y en secuencias Alu se asocian con la periferia del ncleo, dejando la cromatina rica en genes en el interior. De todas formas, todava se desconoce cmo se establecen estos territorios y cmo se mantienen tras la mitosis.

Figura 2.14 En el enlace http://www.euchromatin.org/Cremer01.htm se pueden ver imgenes que ilustran el concepto de territorio cromosmico. En http://www.nature.com/scitable/topicpage/Chromosome-Territories-The-Arrangement-of-Chromosomes-in-30 hay una breve revisin sobre el tema (en ingls). La replicacin del ADN y la transcripcin gnica son dos procesos que tienen lugar dentro del ncleo y que exigen una remodelacin importante de la fibra de cromatina para permitir el acceso de las maquinarias proteicas que los llevan a cabo. Adems, se ha visto que ambos procesos no tienen lugar al azar, en cualquier lugar del ncleo, sino en compartimentos especializados a los que acuden las fibras de cromatina que estn en la vecindad. Se habla as de "fbricas de replicacin" de "fabricas de transcripcin", regiones nucleares ocupadas por regiones genmicas que se replican o transcriben simultneamente aunque pertenezcan a territorios cromosmicos distintos. Lgicamente, las asas de cromatina que ocupan una fbrica determinada tendrn una configuracin similar, en cuanto al grado de condensacin de la cromatina, la secuencia de nucletidos, la riqueza en genes, etc; esto explica que el genoma se organice como un mosaico de regiones que comparten caractersticas similares, ya que esas regiones podran interaccionar dentro del ncleo al situarse en una misma fbrica de replicacin o de transcripcin. Por ejemplo, se ha visto que en el genoma humano existen unas regiones llamadas RIDGES (Regions of IncreaseD Gene Expression, en ingls) en las que son ms abundantes los genes que se transcriben activamente, y son regiones ricas en G+C, pobres en repeticiones tipo LINE y con densidad gnica alta. Junto a stas, se observan tambin regiones con poca densidad en genes, bajo nivel transcripcional y relativamente pobres en G+C, que se llaman por tanto anti-RIDGES. Algo similar detect el proyecto ENCODE, del que se ha -http://www.unav.es/asignatura/genmolhumbq/ 45 de 172

Gentica Molecular Humana (F.Ciencias)-

hablado en el captulo anterior, al analizar una gran cantidad de modificaciones epigenticas a lo largo de todo el genoma. Segn los datos de ENCODE, se pueden definir dos tipos de regiones genmicas: a) dominios activos, que seran las regiones definidas por niveles altos de transcripcin, replicacin temprana, acetilacin de la histona H3 y des-metilacin de la lisina 27 de la histona H3 (H3K27); b) dominios inactivos, correspondientes a regiones de replicacin tarda con poca actividad transcripcional, baja acetilacin de H3 y metilacin de H3K27. Los dominios activos son muy ricos en sitios de inicio de la transcripcin, islas CpG y repeticiones Alu, mientras que las repeticiones tipo LINE1 y LTR estn sobre-representadas en los dominios inactivos. Pues bien, los genes presentes en RIDGES tienden a localizarse, dentro del ncleo, en torno a las fbricas de transcripcin. Lo mismo sucede con los genes de replicacin temprana, que se asocian significativamente con las fbricas de replicacin nucleares. Por tanto, los modelos actuales postulan que los genes que son replicados o transcritos residen en regiones cromatnicas relativamente descondensadas, las cuales salen de sus propios territorios cromosmicos hacia fbricas de replicacin o transcripcin vecinas. En esas fbricas, por tanto, pueden interaccionar regiones alejadas de un mismo cromosoma, o incluso asas de cromatina de territorios cromosmicos distintos; esto permite explicar, en el caso de la transcripcin, la accin de potenciadores de la expresin que actan a larga distancia incluso en trans. Una de las aportaciones del proyecto ENCODE ha sido la de analizar, a nivel global en todo el genoma, interacciones fsicas entre regiones distantes (interacciones de promotores con enhancers y otros elementos reguladores relativamente alejados o incluso situados en otros cromosomas). Esto da lugar a un cuadro bastante complejo en el que los promotores interaccionan con muchos sitios, la mayora de los cuales estn a bastante distancia (>120 kilobases). De hecho, slo el 7% de las interacciones se producen entre sitios reguladores y el gen ms cercano. Adems, se observaron interacciones entre mltiples elementos a la vez, lo que da lugar a redes de interaccin que permiten una primera visin del genoma en tres dimensiones. Como es lgico, en todas estas interacciones son importantes las modificaciones epigenticas de la cromatina y del ADN que hemos estudiado en este Captulo, que en el fondo constituyen la base molecular que permite los fenmemos de condensacin y descondensacin necesarios para la replicacin, transcripcin y desplazamiento fsico de las asas de cromatina. Conjugando todos estos elementos, obtenemos una visin dinmica de la cromatina nuclear en la que que la estructura del ncleo se integra con la funcin y secuencia del genoma. Esta visin es mucho ms rica que los modelos anteriores, que no tenan en cuenta todos estos factores, y adems permite explicar mucho mejor la regulacin fina de la expresin gnica durante el desarrollo embrionario la diferenciacin celular. La otra cara de la moneda es que se trata de procesos tremendamente complicados y, por ello, potencialmente frgiles, de modo que pequeas perturbaciones en estos mecanismos pueden dar lugar a alteraciones genticas y enfermedades humanas. En este sentido, el cncer es un ejemplo tpico de proceso complejo de des-regulacin de la diferenciacin celular, en el que se observan importantes alteraciones epigenticas y una fuerte desorganizacin de la estructura nuclear.

Tema 3: Origen de la variacin gentica en humanos


3.1 Variacin en el ADN: polimorfismos y mutaciones 3.2. Recombinacin a nivel molecular 3.3. Mecanismos de reparacin del ADN en humanos. Enfermedades causadas por alteraciones en los mecanismos de reparacin 3.4. Organizacin y expresin de los genes de las inmunoglobulinas

3.1 Variacin en el ADN: polimorfismos y mutaciones

-http://www.unav.es/asignatura/genmolhumbq/

46 de 172

Gentica Molecular Humana (F.Ciencias)-

La variacin observable en los individuos se debe en gran medida a la variacin gentica, sobre la que se aade la variacin producida por la influencia del ambiente. La variacin gentica se debe a la presencia de cambios genticos heredables a nivel celular (de una clula a sus clulas hijas) que adems son transmitidos a la siguiente generacin si afectan a la lnea germinal (pero no son transmitidos si solamente afectan a clulas somticas). Como es sabido, un gen —localizado en un locus— puede presentarse en formas diferentes debidas a variaciones en la secuencia. Cada forma alternativa se denomina alelo, y el porcentaje de individuos de la poblacin que presenta cada alelo se denomina frecuencia allica. Cuando un locus se presenta, al menos, en dos formas allicas y la frecuencia allica del alelo ms raro es del 1% o mayor, ese locus se llama locus polimrfico, y esa variacin se denomina polimorfismo. La variacin inter-individual garantiza la adaptacin de una especie a condiciones ambientales cambiantes, pero los mismos mecanismos que crean esa variacin son tambin responsables de originar mutaciones ms graves, que en algunos individuos desencadenan una enfermedad. En humanos, la variacin entre individuos se genera principalmente de dos maneras: durante el proceso de reproduccin sexual, por recombinacin entre cromosomas homlogos durante la meiosis (y, ms raramente, en mitosis). A sta cuestin dedicaremos los siguientes apartados de este tema. Adems, durante la vida de un individuo se van introduciendo muchas nuevas mutaciones en el genoma de sus clulas, aunque slo un pequeo porcentaje de estos cambios afectan a las clulas germinales y quedan fijados en el genoma de la especie. La tasa de nuevas mutaciones es resultado del equilibrio entre mutacin y reparacin de las mutaciones. En efecto, en cada divisin celular se incorporan 6x109 nucletidos, y se estima que se producen unas 1017 divisiones celulares durante la vida media de un individuo: por tanto, un sistema sin errores debera tener una exactitud de 6x1026, lo que es virtualmente imposible. De hecho, se sabe que la ADN polimerasa produce un error cada 104 nucletidos incorporados, aunque est dotada de un sistema de edicin que mejora esta tasa hasta 10 7. Considerando un genoma diploide de 6x109 nucletidos, esto significa unas 600 mutaciones por cada divisin celular en cada clula del organismo, lo cual es muy superior a lo observado y sugiere, por tanto, la existencia de sistemas celulares de reparacin del ADN que se ocupan de reparar la inmensa mayora de las mutaciones introducidas en el genoma, contribuyendo a mantener una fidelidad alta. En efecto, las tasas de divisin celular son distintas en la lnea germinal que en los diferentes tejidos, e incluso no son las mismas en la lnea germinal masculina que en la femenina (mucho mayores en la masculina). Las tasas de mutacin estimadas, mediante diversos procedimientos, se sitan en torno a 1x10 -9 substituciones por nucletido por divisin en clulas somticas, y 1,3x10-8 substituciones por nucletido por generacin en la lnea germinal. Se ha calculado que, de media, una persona experimenta 1017 divisiones celulares somticas a lo largo de su vida, lo cual debera traducirse en unas 6x108 mutaciones somticas a lo largo de la vida de una persona. Recientemente, estas tasas de mutacin se han podido calcular directamente, gracias a la secuenciacin de genomas completos en familias en las que se ha ledo el genoma de los padres y de uno o ms hijos. Los estudios realizados hasta el momento indican que, en condiciones normales, cada hijo lleva entre 40 y 70 mutaciones nuevas en la lnea germinal, lo que equivale a una tasa de mutacin entre 0,9-1,2 x 10-8 por nucletido por cada generacin. Dando como vlidas las estimaciones de que la lnea germinal sufre 216 divisiones celulares por cada generacin, esto supone una tasa de mutacin observada en lnea germinal (considerando un genoma haploide) en torno a 0,15 mutaciones por divisin celular. Uno de estos estudios detect, curiosamente, una tasa de mutacin paterna superior a la materna en una familia europea, mientras que la tasa de mutacin materna fue superior a la paterna en una familia africana.

-http://www.unav.es/asignatura/genmolhumbq/

47 de 172

Gentica Molecular Humana (F.Ciencias)-

Finalmente, hay que tener en cuenta que no todas las substituciones tendrn el mismo efecto a nivel funcional. De hecho, muchas mutaciones sern silenciosas porque no afectan a ADN codificante o a regiones importantes del genoma; otras, las ms dainas, sufrirn una fuerte presin selectiva y su frecuencia allica ser muy baja en la poblacin. En definitiva, siempre se ha de recordar que la presencia de polimorfismos y mutaciones en las poblaciones humanas es el resultado del equilibrio entre mutacin-reparacin-seleccin.

3.2. Recombinacin a nivel molecular


Uno de los temas ms importantes en gentica es la caracterizacin de los mecanismos moleculares por los que se produce intercambio de material gentico entre cromtides durante la meiosis, y ms raramente en la mitosis. Distintos modelos han intentado explicar cmo dos molculas de ADN homlogas pueden entrecruzarse e intercambiar material gentico. El paso inicial comn a todos los modelos propuestos es el alineamiento preciso de ambas molculas, precisamente debido a que son cadenas de ADN homlogas, es decir, pertenecientes a cromosomas homlogos y por tanto con la misma secuencia de nucletidos. En realidad, hoy sabemos que ambas molculas no son absolutamente idnticas, ya que pueden existir diferencias allicas en su secuencia (por ejemplo, pequeas diferencias de un nucletido). En cualquier caso, el alineamiento de dos secuencias homlogas es un requisito imprescindible para que se inicie el proceso de recombinacin, que se denomina por eso recombinacin homloga. Dicho alineamiento, como es lgico, se produce durante la profase I de la meiosis merced al complejo sinaptonmico que mantiene estrechamente unidos los cromosomas homlogos en toda su longitud. Es lgico pensar que dicha configuracin permite que dos molculas de ADN de secuencia homloga se mantengan en contacto. Los primeros modelos de recombinacin proponan que, tras el alineamiento, ambas molculas de ADN sufren una mella en una de sus cadenas, exactamente en la misma posicin, y esto deja dos cadenas "libres" que se intercambian entre s y se unen a la molcula homloga por complementariedad de bases. Dado que la generacin de dos mellas simultneas en la misma posicin es un evento muy improbable, Meselson y Radding propusieron otro modelo en el que una sola mella en una de las dos molculas es suficiente para iniciar el proceso de recombinacin, ya que la cadena libre puede invadir la doble hlice homloga. Los estudios llevados a cabo en distintas especies de eucariotas en los ltimos aos han demostrado que la recombinacin se inicia por la aparicin de una rotura completa de una de las dos molculas homlogas, es decir, una rotura bi-catenaria (de las dos cadenas de una doble hlice). Dichas lesiones, llamadas DSB (D ouble-Strand Break en ingls), se generan con cierta frecuencia en el ADN celular en respuesta a diversas causas; parece comprobado que la creacin especfica de un DSB durante profase I es el proceso iniciador de la recombinacin. En levaduras, estas roturas son generadas por la protena SPO11. Segn el modelo actual de recombinacin homloga, en este proceso intervienen una serie de complejos proteicos: Complejo RAD50, tambin llamado MRN formado por las molclulas MRE11, RAD50 y NBS1. El complejo RAD52, que incluye varios componentes (RAD51, RAD52, RAD54, RAD55 y RAD57 entre otros). La molcula RPA (la misma protena A de la replicacin). Tras la creacin de un DSB, bien por lesiones que sufre el ADN o bien por protenas que cortan la doble cadena de forma programada, los extremos libres son procesados mediante la actividad exonucleasa del complejo RAD50, que acta en direccin 5->3 y por tanto genera extremos libres ms largos en la hebra 3'. Este extremo protruyente se recubre de RPA, RAD51 y otras molculas del complejo RAD51 para formar un filamento nucleo-proteico. Este filamento tiene la capacidad de invadir la doble hebra homloga, abriendo en ella una burbuja, y se empareja a la cadena complementaria que discurre en direccin antiparalela. A partir de este extremo 3' se extiende la cadena usando la hebra complementaria como molde, -http://www.unav.es/asignatura/genmolhumbq/ 48 de 172

Gentica Molecular Humana (F.Ciencias)-

al tiempo que tambin se extiende tambin el otro extremo que haba quedado libre. Tras una corta extensin, los extremos libres se unen por accin de una ligasa y esto genera dos estructuras en las que una hebra salta de una molcula de ADN a la molcula homloga. Dichas estructuras se denominan estructuras de Holliday, que fue el primero en proponer su existencia. Es importante tener en cuenta que si las dos molculas de ADN no son inicialmente idnticas en su secuencia, durante el proceso de recombinacin se pueden formar molculas hbridas, en las que ambas cadenas no son idnticas. Dichas molculas de ADN se llaman heteroduplex, y son muy importantes porque los desemparejamientos son corregidos por un mecanismo de reparacin que se estudiar en otro captulo; dicha correccin hace que una de las dos cadenas se modifique para hacerse perfectamente complementaria a la otra, en un proceso llamado conversin gnica. Como veremos en otras partes de este texto, la conversin gnica es un mecanismo que da lugar a varias enfermedades genticas en humanos. Las estructuras de Holliday dan lugar unas estructuras cruciformes formadas por dos molculas de ADN, llamadas tambin estructuras chi, que han de resolverse de algn modo para permitir la separacin de las dos cromtides. La resolucin de las estructuras de Holliday puede hacerse segn un plano vertical o segn un plano horizontal, y es precisamente el tipo de resolucin que se lleva a cabo lo que determina el tipo de molculas que se generan. Por ejemplo, si las dos estructuras de Holliday se resuelven segn planos distintos, las molculas resultantes van a dar lugar a un sobrecruzamiento (la configuracin que da lugar a los quiasmas que se ven en la meiosis); en cambio, cuando las dos estructuras de Holliday se resuelven segn el mismo plano se producir recombinacin sin sobrecruzamiento. A su vez, cada una de estas dos posibilidades puede darse con sin conversin gnica, dependiendo de la presencia de heterodplex y del modo en que se reparan esos desemparejamientos. Figura 3.1 En este videose muestra, paso a paso, el proceso de recombinacin molecular segn el modelo de iniciacin por una rotura bicatenaria (DSB). En este otro video se explica con mayor detalle cmo se lleva a cabo la resolucin de una estructura de Holliday. Curiosamente, el modelo de recombinacin iniciado por una rotura bicatenaria es fruto de los estudios de reparacin de este tipo de lesiones en eucariotas. Como veremos a continuacin, las roturas bicatenarias son un tipo frecuente de agresin al ADN, y son reparados en clulas somticas precisamente por un mecanismo de recombinacin homloga que tiene lugar durante la fase S del ciclo celular. En los ltimos aos se ha visto que este mismo mecanismo explica tambin las predicciones acerca de la recombinacin durante la meiosis, y que de hecho la maquinaria proteica responsable es bsicamente la misma. Por tanto, hoy en da se considera como un mismo mecanismo que se ha adaptado a dos funciones celulares importantes como la reparacin del ADN y la generacin de variabilidad gentica durante la formacin de los gametos. Ms recientemente, se ha sugerido que la recombinacin homloga tambin puede tener otra funcin importante: la reiniciacin de la replicacin del ADN. A menudo, la horquilla de replicacin se para prematuramente durante la sntesis de ADN y toda la maquinaria replicativa se desensambla. Esto puede suceder durante la replicacin de una doble cadena en la que hay una mella, o bien por el retroceso de una horquilla de replicacin que se ha detenido ante la presencia de una lesin. Antes se pensaba que estas horquillas interrumpidas se reinician por el ensamblaje de un nuevo complejo de replicacin en ese punto, pero cada vez hay ms datos a favor de la hiptesis de que la replicacin se reinicia en esas horquillas por un fenmeno de recombinacin homloga. Dicha recombinacin podra darse entre las dos cromtides hermanas idnticas (la cromtide con la horquilla interrumpida y la que se ha originado por la replicacin hasta ese punto), que sera lo normal, o bien puede darse entre cromtides de cromosomas homlogos, en cuyo caso se originara un fenmeno de recombinacin homloga con posible sobrecruzamiento. Probablemente, este proceso es el responsable de los eventos de recombinacin que tienen lugar durante mitosis en clulas somticas (en las que, evidentemente, no hay meiosis). De hecho, algunos autores han sugerido que, originalmente, la principal funcin del mecanismo de recombinacin fue precisamente la reparacin de horquillas de replicacin interrumpidas.

3.3. Mecanismos de reparacin del ADN en humanos.

-http://www.unav.es/asignatura/genmolhumbq/

49 de 172

Gentica Molecular Humana (F.Ciencias)-

A. Reparacin de desemparejamientos entre nucletidos normales. Los mecanismos de reparacin mencionados actan reparando tipos especficos de dao al ADN. Los desemparejamientos entre bases normales pueden originarse por la tautomera de las bases (la forma imina de Citosina empareja con Adenina, o la forma enlica de Timina empareja con Guanina), por desaminacin de citosinas metiladas (las citosinas metiladas de los dinucletidos CpG se desaminan a Timina), y principalmente por los errores de la ADN polimerasa durante la replicacin del ADN. Tambin se producen desemparejamientos durante la formacin de heteroduplexes en los procesos de recombinacin. Adems, el deslizamiento de la cadena nueva sobre la cadena molde durante la replicacin tambin puede producir bucles de insercin/delecin (IDLs=bucles de insercin/delecin). Todos estos tipos de desemparejamiento se corrigen por el sistema MMR (mismatch repair), cuyos componentes conocidos en humanos son hMLH1, hMSH2, hMSH3, hMSH6, hPMS1, hMLH3 y hPMS2 (homlogos de MutS y MutL de E. coli). Estas subunidades actan como heterodmeros hMSH2/hMSH6, que reconocen tanto los bucles (loops) de inserciones/deleciones de 1 a 8 nucletidos como los desemparejamientos simples de una base; o bien actan como heterodmeros hMSH2/hMSH3, que reconoce slo bucles. Cada uno de estos dmeros, a su vez, acta junto con los homlogos de MutL, que son hMLH1/hPMS2 y hMLH1/hPMS1 (recientemente se ha descrito tambin hMLH1/hMLH3). En concreto, los heterodmeros hMSH2/hMSH6 junto con hMLH1/hPMS2 reparan los desemparejamientos simples, mientras que cualquiera de los dos complejos (hMSH2/hMSH3 hMSH2/hMSH6) en combinacin con hMLH1/hPMS2 son capaces de reparar stem-loops (tallo-bucle) producidos por IDLs, como se muestra en la figura. El video de la Figura 3.2 muestra algunos desemparejamientos entre nucletidos normales y la formacin de los bucles de insercin/delecin. Adems, se esquematiza la estructura y funcionamiento del sistema de reparacin de desemparejamientos MMR (Mismatch Repair System). En E. coli, este sistema acta unindose al desemparejamiento y a una base metilada adyacente, corta la cadena no metilada (recin sintetizada) hasta una distancia de 1-2 kb del mismatch, una endonucleasa corta los nucletidos contenidos en el asa, y la polimerasa rellena el hueco. En mamferos el mecanismo no est todava totalmente explicado, pero se ha encontrado una protena (MBD4 MED1) que se une a metil-citosinas, tiene actividad N-glicosilasa y forma complejos con MLH1, adems de modular el sistema de MMR. Cuando hay defectos en este proceso de reparacin aparecen errores durante la replicacin del ADN, errores que se pueden ver al analizar secuencias repetidas cortas tipo Microsatlite. Por tanto, los defectos en el sistema de reparacin de desemparejamientos dan lugar al fenmeno conocido como Inestabilidad de Microsatlites (MIN= Microstallite INstability) o "fenotipo mutador". Se conocen algunas enfermedades debidas a mutaciones en componentes de estos sistemas de reparacin. Por ejemplo, 90% de los pacientes con cncer colo-rectal no-polipsico hereditario (HNPCC Sndrome de Lynch) tienen mutaciones en uno de los genes hMSH2, hMLH1, hPMS1, hPMS2 o hMSH6, de forma los individuos que han heredado una mutacin en uno de los alelos tienen una alta probabilidad de sufrir una segunda mutacin en el otro alelo en alguna de sus clulas somticas, por lo que el riesgo global de desarrollar este tipo de cncer es del 80-85% (o del 75% a los 55 aos) en estos sujetos. Estos tumores muestran inestabilidad de microsatlites, pero adems la inestabilidad tambin afecta a genes que tienen repeticiones en sus secuencias codificantes (BAX, TGFBRII). Son las mutaciones en estos genes las que a menudo llevan al desarrollo de neoplasias. Curiosamente, los pacientes homocigotos para mutaciones en MLH1 (dos mutaciones en la lnea germinal) desarrollan en la infancia neoplasias hematolgicas adems de otros tumores (neurofibromatosis, meduloblastoma), lo que sugiere la existencia de genes implicados en la hematopoyesis y en el control del crecimiento celular que son dianas del sistema MMR. B. Reparacin de nucletidos daados. Otros sistemas detectan la presencia de bases anormales tales como, por ejemplo, los uracilos que aparecen por la des-aminacin de una citosina. En general, estas modificaciones estn debidas a la accin de mutgenos (benzopirenos del tabaco, agentes alquilantes, diversos agentes qumicos de la dieta, el dao -http://www.unav.es/asignatura/genmolhumbq/ 50 de 172

Gentica Molecular Humana (F.Ciencias)-

causado por especies reactivas de oxgeno, as como las alteraciones debidas a la radiacin ultravioleta. Los procesos qumicos que con mayor frecuencia provocan mutaciones son 1) las oxidaciones por radicales libres, especialmente la formacin de 8-oxoguanina, que se empareja con T en vez de C (se calcula que se forman unas 10.000 al da en cada clula) y 2) las reacciones hidrolticas, ya que la molcula de ADN sufre una hidrlisis espontnea lenta que hace que se pierdan unas 10.000 purinas al da en un genoma humano, con la consiguiente creacin de otros tantos sitios apurnicos. Tambin la radiacin UV produce sitios apurnicos, pero sobre todo provoca dmeros de pirimidinas. En la Figura 3.3 podemos ver la estructura de algunos nucletidos anormales que se generan por la accin de diversos agentes. Por ejemplo, se muestran la 06-metil-guanina, la 8-oxo-guanina y los dmeros de pirimidinasgenerados por la accin de la luz ultravioleta. En general, todas estas lesiones son graves, ya que impiden la replicacin correcta del ADN y, a la larga, llevan a la muerte celular. Podemos generalizar diciendo que las lesiones del ADN producidas por la presencia de nucletidos anormales se corrigen por cuatro mecanismos: reversin directa, BER (Base Excision Repair), NER (Nucleotide Excision Repair) por polimerasas capaces de pasar por encima de la lesin. De modo esquemtico, el video de la Figura 3.4 muestra los cuatro mecanismos principales por los que se reparan las lesisones que incluyen nucletidos daados. A continuacin se ve con ms detalle cada uno de estos mecanismos: 1. Al contrario que otras especies, la reversin directa por enzimas fotoreactivadoras no existe en humanos. Nuestro nico recurso en este sentido consiste en un enzima llamado MGMT (metil-guanina metil-t ransferasa), que puede eliminar el metilo introducido por agentes alquilantes en la guanina (el cual dara lugar a transiciones GA, pues la O6-metilguanina se empareja con Timina). 2. La reparacin por escisin de bases (BER) elimina las bases que han sufrido ataques hidrolticos (des-aminacin, por ejemplo) por ROS o la 8-oxo-guanina producida por el tabaco. El paso crtico en este tipo de reparacin es la rotura del enlace N-glicosdico que une la base al esqueleto desoxi-ribosa-fosfato, catalizado por ADN glicosilasas (especficas para determinados tipos de lesin: UDG, OGG, etc). Posteriormente, el sitio AP (apurnico apirimidnico) es roto por una AP endonucleasa que cataliza la incisin del enlace fosfodiester en posicin 5 al sitio AP. La escisin del azcar se completa con la eliminacin del residuo desoxi-ribosa-fosfato por la accin de una desoxi-ribosa-fosfodiesterasa que corta el otro enlace fosfodister. Finalmente, se rellena el hueco mediante la accin de ADN pol β y una ADN ligasa. Este mecanismo de reparacin parece necesario para la viabilidad, ya que el ratn knock-out para ADN pol β es letal embrionario. Un proceso paralelo es crucial en la diversificacin de los genes de las inmunoglobulinas, ya que los linfocitos B expresan un enzima llamado AID (Activation-Induced Deaminase) que desamina citosinas y las convierte en uracilos; dichos uracilos crean sitios AP que pueden ser procesados por un complejo llamado RAD50 (que veremos ms adelante) que tienen una actividad liasa que rompe el esqueleto desoxi-ribosa-fosfato y rompe el ADN. Dichas roturas son necesarias para que los genes de la inmunoglobulinas se reordenen y puedan dar lugar a la diversidad necesaria para una adecuada respuesta inmune. Figura 3.5 Las lesiones que incluyen desemparejamientos con algn nucletido anormal o daado son reparadas por el sistema de escisin de bases (BER). Como se muestra en este video, en dicho sistema intervienen una glicosilasa, una endonucleasa, una polimerasa y una ligasa. 3. La reparacin por escisin de nucletidos (NER) elimina fotoproductos producidos por UV y otros aductos que confieren estructuras anormales a la cadena de ADN. El mecanismo de actuacin de este sistema de reparacin no est totalmente claro, pero se sabe que requiere la formacin de un complejo entre -http://www.unav.es/asignatura/genmolhumbq/ 51 de 172

Gentica Molecular Humana (F.Ciencias)-

XPC (protena que es esencial para NER) y RPA (protena de unin a ADN monocatenario) con la regin lesionada. Sobre este foco tambin se unen XPA y el complejo TFIIH (que contiene, entre otras, las protenas XPB (ERCC3) y XPD (ERCC2), ambas con actividad helicasa necesaria para llevar a cabo NER). En levaduras se ha identificado una protena llamada DDB (DNA damagen binding) que reconoce la lesin inicial y es lal que recluta XPC. Curiosamente, DDB es necesaria para que NER funcione, pero slo in vivo (no in vitro, usando ADN purificado). Esto hace pensar que DDB acta sobre la cromatina (ADN con histonas), pero no est claro cmo. A continuacin, el paso clave en NER es la creacin de dos incisiones, flanqueando la lesin, en la cadena de ADN que est daada: una incisin tiene lugar 3 a 9 bases en direccin 3 de la lesin y la otra incisin se produce 16 a 25 bases en direccin 5 de la lesin, comprendiendo unas 25-30 bases en total. En mamferos, la incisin 3 la lleva a cabo una nucleasa llamada XPG, y la incisin 5 la realiza el heterodmero XPF/ERCC1. Tras las incisiones y eliminacin de la regin daada, tiene lugar la resntesis de esa regin mediante la accin de un holoenzima que contiene PCNA y DNApol δ o ε. Figura 3.6 Como muestra este video, el sistema de reparacin por escisin de nucletidos (NER) incluye varios complejos multi-proteicos que eliminan los nucletidos flanqueantes a la lesin, de modo que el hueco es rellenado por polimerasas especiales y sellado por una ligasa. Un aspecto especialmente interesante es la relacin del NER con la transcripcin, a travs de la presencia de XPB y XPD en TFIIH (que es uno de los factores de transcripcin generales), dando lugar al concepto de Reparacin acoplada a la transcripcin (TCR=Transcription-Coupled Repair). De hecho, se ha comprobado que el dao por UV se repara con ms eficacia y ms rpido en la cadena que se transcribe y en genes transcripcionalmente activos. Tambin se ha visto que ciertos tipos de dao oxidativo puede repararse por TCR incluso cuando el NER no funciona. Adems de los citados XPB y XPD, otras dos protenas con actividad helicasa (CSA y CSB) son responsables de TCR, y tambin se ha implicado a hMLH1 en TCR. Las mutaciones que destruyen el sistema TCR dan lugar a una enfermedad llamada Sndrome de Cockayne . Las mutaciones en genes que codifican otras protenas asociadas con NER dan lugar a varias enfermedades (Xeroderma pigmentosum, Tricotiodistrofia), que en su conjunto cursan con fotosensibilidad e inestabilidad cromosmica, y aumento del riesgo de aparicion de melanoma (un tipo de cncer de piel). Finalmente, algunos pacientes tienen una variante de Xeroderma Pigmentosum sin defectos en NER (llamada XP variante, XP-V), que est debida a mutaciones en el gen humano homlogo del gen RAD30 de levadura. Este gen codifica la polimerasa eta (Polh), que puede replicar el ADN correctamente incluso en la presencia de dmeros de pirimidinas. 4. Respecto al ltimo mecanismo de reparacin de nucletidos daados (es decir, las polimerasas capaces de "saltarse" la lesin), recientemente se ha visto que Pol z (polimerasa zeta) Pol h (polimerasa eta) son capaces de sintetizar ADN frente a dmeros TT. Sin embargo, as como Pol h suele introducir dos Adeninas, Pol z introduce bases incorrectas y por tanto es un mecanismo de reparacin de baja fidelidad. C. Reparacin de roturas de la doble hebra del ADN. La creacin de roturas bicatenarias del ADN (DSB=Double-Strand Breaks) es un paso necesario para la recombinacin homloga en meiosis y mitosis, y para la reordenacin V(D)J de genes de las inmunoglobulinas y receptores de clulas T. Adems, este tipo de roturas aparecen durante la replicacin del ADN y tambin son causadas por diferentes agentes genotxicos: radiacin ionizante (rayos X), ROS originados por el metabolismo celular. Los DSB se reparan por dos vas principales, en diferentes fases del ciclo celular: Fusin no homloga de extremos (NHEJ), que funciona sobre todo en G1/S (antes de la replicacin del ADN) y Recombinacin homloga (HR), que tericamente actuara en S/G2, cuando ya hay dos cromtides hermanas (de manera que se utiliza la doble hebra homloga como molde para la reparacin). -http://www.unav.es/asignatura/genmolhumbq/ 52 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 3.7 El video muestra los efectos de una rotura bicatenaria del ADN (DSB) sobre el metabolismo celular, y los mecanismos de control del ciclo y de reparacin que se ponen en marcha para evitar que dicha roture tenga graves consecuencias. 1. Recombinacin Homloga: como ya hemos comentado al inicio de este tema, la maquinaria responsable del mecanismo molecular de recombinacin meitica se utiliza tambin para reparar DSB a partir de una cromtide hermana. Tras el procesamiento de los extremos libres por el complejo MRN (llamado tambin RAD50), la protena RAD51 (homloga del RecA, que en E. coli es fundamental en la respuesta SOS) forma filamentos sobre el extremo monocatenario de ADN que queda libre, paso que es necesario para que se pueda realizar la invasin de la cadena libre a la doble cadena homloga. RAD51 es indetectable en G1 y se expresa en S/G2. Los ratones RAD51 knock-out son letales embrionarios y sus clulas muestran inestabilidad cromosmica. Una lnea celular de pollo, en la que RAD51 est bajo el control de un promotor represible, muestra inestabilidad cromosmica y muerte celular cuando se reprime la expresin de RAD51, lo que refuerza la necesidad de este gen para la viabilidad celular. Hay otros genes implicados en reparacin de DSB que tienen cierta homologa con RAD51 y que podran modular la accin de ste. Por ejemplo, se ha visto que la ausencia del gen XRCC2 (20% de homologa con Rad51) disminuye la eficacia de la recombinacin homloga en la reparacin de DSB, pero no es letal; lo mismo podra suceder con RAD55 o RAD57. Por otra parte, se ha comprobado en levaduras que la protena RPA altera la eficacia con la que se forman los filamentos de RAD51. RAD52 parece actuar como el portero del mecanismo de recombinacin homloga. Esta protena interacciona con RPA y con RAD51, favoreciendo la formacin del filamento de RAD51 en presencia de RPA. Como el ratn RAD52 knock-out no es letal (slo se observa una ligera disminucin en la eficacia de recombinacin homloga), se postula la existencia de genes homlogos de RAD52 complementen la ausencia de ste. La expresin del complejo RAD50 no vara durante el ciclo celular, por lo que debe regularse post-traduccionalmente (mediante fosforilacin o por compartimentalizacin en el ncleo). Este complejo tiene actividad 53 exonucleasa, y parece transducir seales de dao de ADN hacia la parada del ciclo celular. Experimentos de irradiacin en bandas han mostrado, mediante anticuerpos monoclonales contra un componente de este complejo, que RAD50 se asocia a los DSB muy pronto tras la irradiacin. En humanos, los pacientes con el llamado "Sndrome de Roturas de Nimega" tienen mutaciones en un componente de este complejo llamado NBS1, muestran sensibilidad a radiacin ionizante e inestabilidad cromosmica, y las clulas de estos pacientes no son capaces de formar focos despus de la irradiacin con rayos X ultrablandos; por tanto, lo ms probable es que la protena NBS1 sea responsable de dirigir el complejo RAD50 a los lugares de dao del ADN.

Figura 3.8 La figura muestra inmunofluorescencias de un fibroblasto que ha sido irradiado, utilizando anticuerpos frente a la histona H2AX fosforilada (en verde, a la izquierda), o bien anticuerpos frente a la subunidad cataltica de ADN-PK (en rojo, en el centro). La imagen de la derecha muestra la superposicin de las otras dos imgenes, apareciendo en amarillo los puntos en los -http://www.unav.es/asignatura/genmolhumbq/ 53 de 172

Gentica Molecular Humana (F.Ciencias)-

que coincide una seal verde con una roja.La imagen est tomada de la pgina del Lawrence Berkeley National Laboratory en la universidad de California La imagen de la Figura 3.8 demuestra que tras la irradiacin (que genera muchas roturas bicatenarias en el ADN) se crean unos focos de reparacin donde se concentran las maquinarias encargadas de llevar a cabo dicha reparacin. Aunque en esta imagen se muestran molculas que intervienen en la reparacin no homloga de extremos libres, la utilizacin de anticuerpos frente a componentes del sistema de reparacin por recombinacin homloga (RAD51, NBS, etc) da lugar a imgenes similares. Una observacin muy interesante es la implicacin de BRCA1 y BRCA2 (genes mutados en ciertos tipos de cncer de mama familiar) con la reparacin de DSB, ya que se ha visto que las protenas codificadas por estos genes interaccionan con RAD51, bien directamente (BRCA2) o de manera indirecta (BRCA1). ambas son protenas nucleares que se expresan en S/G2, funcionan como activadores transcripcionales, y los ratones knock out de ambas son letales embrionarios. En cambio, un ratn que lleva una copia de BRCA2 truncada (BRCA2tr/tr) sufre linfomas del timo, alta inestabilidad cromosmica y estimulacin de la va de sealizacin de p53. BRCA1 se fosforila tras dao al ADN, y se ha descrito la asociacin de BRCA1 con el complejo RAD50 en el momento del ciclo celular en que BRCA1 est fosforilado (S/G2). Por otra parte, en estudios de co-localizacin tras irradiacin similares a los descritos arriba, se ha visto que BRCA1 est presente en focos nucleares que contienen RAD50 en unas clulas o en focos que contienen RAD51 en otras clulas, pero no hay clulas en las que se asocie con ambos a la vez. Una hiptesis atractiva es que durante la reparacin de DSB por recombinacin homloga BRCA1 coopera con RAD50 en el procesamiento de los extremos del ADN daado y que, mediante la interaccin entre BRCA1 y BRCA2 (que se asocia fsicamente a RAD51), facilita el acoplamiento con los procesos de recombinacin mediados por RAD51. En el ao 2011 se public otra propiedad muy interesante de BRCA1: es capaz de ubiquitinar la histona H2A de la cromatina pericentromrica, mantenindola as silenciada. La ausencia de BRCA1 permite la transcripcin del ADN satlite de esas regiones, lo cual conduce a la formacin de DSBs y fallos en la reparacin por recombinacin homloga, aunque no se sabe exactamente cmo se produce esto. 2. Fusin no homloga de extremos (NHEJ): El proceso general de reparacin es similar pero sin recombinacin, ya que en este caso no existe una doble cadena homloga: simplemente se fusionan los extremos libres. Tras la generacin del DSB, los extremos libres tambin son procesados por una nucleasa; posteriormente se procede a la unin de los mismos y a la ligacin, perdindose siempre algunas bases en la regin de unin. Este mecanismo tiene lugar fisiolgicamente en linfocitos, donde es responsable de la reordenacin de segmentos V(D)J de los genes de inmunoglobulinas, como se ver a continuacin. Un componente principal de este sistema es el complejo ADN-PK (DNAPK), una serina/treonina kinasa nuclear que consta de una subunidad cataltica (DNAPKcs) y de un heterodmero de unin a ADN llamado KU (que a su vez se compone de KU70 y KU80). El complejo ADN-PK se asocia a los extremos rotos, ayuda al alineamiento de los extremos y facilita su ligacin. Este sistema de reparacin es importante, sobre todo en clulas del sistema inmune, y de hecho las mutaciones en el gen que codifica la DNAPKcs provocan la enfermedad llamada Inmunodeficiencia Combinada Severa (SCID). Adems, el complejo ADN-PK fosforila y activa una nucleasa llamada Artemis, que es la responsable de llevar a cabo el procesamiento de los extremos libres para que se puedan religar. Este ltimo paso, la unin de los extremos ya procesados, es realizado por una ligasa (ADN ligasa IV) que acta junto con XRCC4, una fosfoproteina nuclear que tambin es sustrato de ADN-PK in vitro. Figura 3.9 El mecanismo ms utilizado en mamferos para reparar las roturas bicatenarias del ADN es la fusin no homloga de extremos (NHEJ). En este video se muestran los complejos proteicos implicados y su funcionamiento en dicho sistema, que tambin se puede ver en este otro video. Es muy interesante la asociacin que se ha encontrado en levaduras entre Ku70 y protenas silenciadoras de la transcripcin de telmeros (Sir2, Sir3 y Sir4), sugiriendo la posibilidad de que Ku reclute protenas Sir a -http://www.unav.es/asignatura/genmolhumbq/ 54 de 172

Gentica Molecular Humana (F.Ciencias)-

los DSB para inducir un estado de cromatina condensada que evite la transcripcin o replicacin y facilite el proceso de reparacin, o bien evite que los extremos libres de ADN puedan interaccionar con otras molculas de ADN. Dado que la disrupcin de Ku o del complejo RAD50 lleva al acortamiento de telmeros en levaduras, es lgico pensar que Ku se una al ADN telomrico e interaccione con Sir4 para inhibir la replicacin a ese nivel. Tradicionalmente se ha considerado que el principal mecanismo de reparacin de DSB en mamferos es la fusin de extremos (NHEJ), ya que se ha visto que la frecuencia de recombinacin homloga en mitosis es muy baja. Esto es lo contrario de lo que sucede en levaduras, donde el principal mecanismo de reparacin de DSBs es la recombinacin homloga. Actualmente, en cambio, esto est en discusin. Por un lado, parece que la recombinacin mittica en mamferos es ms alta de lo que se crea: del orden de 10-4 a 10-5; por otro lado, los ratones incapaces de llevar a cabo NHEJ (DNAPK knock-out) no son letales, mientras que los ratones incapaces de recombinacin homloga (kncok-out para RAD51 RAD54) s son letales. Esto indica que HR puede de alguna forma complementar la ausencia de NHEJ, pero en cambio NHEJ no puede complementar la ausencia de HR en clulas somticas. D. Mecanismos de reparacin presentes en mitocondrias. Un tema reciente en patologa gentica humana es la alteracin de los mecanismos de reparacin del ADN mitocondrial. Tradicionalmente se ha considerado que las mitocondrias de mamferos no son capaces de llevar a cabo ningn tipo de reparacin, ya que los dmeros de pirimidinas no son reparados con eficacia. Esto explicara adems la mayor tasa de mutaciones del ADN mitocondrial (ADNmt) respecto al ADN nuclear. Hoy se sabe que hay ciertos tipos de dao que s pueden repararse en mitocondrias (por ejemplo, los sitios AP originados por dao oxidativo) y en general parece que las mitocondrias de organismos superiores son capaces de llevar a cabo BER pero no NER ni MMR. El tipo de dao que puede repararse mediante BER va a estar limitado por la presencia de ADN glicosilasas en la mitocondria, y hasta el momento se ha demostrado la presencia de uracil-ADN-glicosilasa (UDG) y de 8-oxo-guanina-glicosilasa (OGG). Adems, otras glicosilasas tienen seales de localizacin mitocondrial en sus extremos N-terminal. Una diferencia del BER que se lleva a cabo en mitocondrias con el BER nuclear es que la polimerasa presente en mitocondrias es la ADN pol γ, que adems posee actividad liasa (fosfodiesterasa). Tambin existe dentro de la mitocondria una actividad ADN ligasa, que al parecer se origina a partir del gen de la ADN ligasa III por un codn de iniciacin alternativo que crea una seal de localizacin mitocondrial.

3.4. Organizacin y expresin de los genes de las inmunoglobulinas


El sistema inmune adaptativo consta de dos tipos de respuesta ante la presencia en el organismo de elementos extraos (antgenos): una respuesta humoral, mediada por anticuerpos, y una respuesta celular mediada por linfocitos T. Los anticuerpos son inmunoglobulinas secretadas por clulas plasmticas, que se originan a partir de linfocitos B que se han activado por la unin de antgenos a los receptores de membrana (que son esas mismas inmunoglobulinas). Los anticuerpos estn formados por dos cadenas pesadas y dos cadenas ligeras; segn las tipos de cadenas, se pueden obtener distintas clases de inmunoglobulinas. Los receptores de membrana de las clulas T estn formados por heterodmeros de cadenas muy relacionadas evolutivamente con las de las inmunoglobulinas. Para garantizar el correcto funcionamiento del sistema inmune, es necesario generar una enorme diversidad de inmunoglobulinas y de receptores de clulas T, de manera que el organismo pueda reconocer y neutralizar todo aquello que no sea un antgeno propio. Sin embargo, el genoma humano slo tiene tres loci para inmunoglobulinas (uno llamado IGH para la cadena pesada, y otros dos loci -llamados IGK e IGLpara cada una de las cadenas ligeras) y cuatro genes para las cuatro cadenas del receptor de clulas T (TRA, TRB, TRG y TRD). Cada linfocito B o T es monoespecfico (lleva un tipo de receptor concreto), pero se producen millones de clulas, cada una con una inmunoglobulina distinta. Cmo se genera tal diversidad a partir de los mismos genes?

-http://www.unav.es/asignatura/genmolhumbq/

55 de 172

Gentica Molecular Humana (F.Ciencias)-

La solucin es generar muchas protenas distintas a partir de un mismo gen. En el caso de los anticuerpos, la variabilidad de la protena (que es lo que hace que reconozca antgenos distintos) viene dada por una regin variable tanto en la cadena pesada como en la ligera, mientras que el resto del pptido es una regin constante (C), que no cambia.

Figura 3.10 Estructura de una inmunoglobulina (imagen tomada de http://atlasgeneticsoncology.org/Educ/PolyIgEng.html) La regin variable est codificada por un exn que se forma a partir de varios segmentos genmicos llamados V, D o J en el caso de las cadenas pesadas (los genes de las cadenas ligeras slo tienen segmentos V y J). Durante la maduracin de los linfocitos, se dan eventos de recombinacin por los que se yuxtapone un segmento D a un segmento J, y despus este segmento D-J se yuxtapone a un segmento V. El resultado es un segmento V-D-J que conforma el exn que codifica la regin variable de la inmunoglobulina. Despus de la transcripcin este exn se ayusta a un exn codificante de la regin constante (C). Como el ms cercano de estos codifica la IgM, sta inmunoglobulina es la primara en ser fabricada por los linfocitos B. Despus, durante la maduracin de estas clulas, el mismo exn V-D-J puede unirse al exn que codifica para la IgD, mediante ayuste alternativo. Para los otros tipos de inmunoglobulinas, es necesario un fenmeno de recombinacin similar al que se describe a continuacin, en un proceso llamado cambio de clase.

-http://www.unav.es/asignatura/genmolhumbq/

56 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 3.11 Procesamiento de los genes de las cadenas ligeras de las inmunoglobulinas. (imagen tomada de http://atlasgeneticsoncology.org/Educ/PolyIgEng.html) Dado el gran nmero de segmentos V, D y J que tiene este locus gnico, el nmero de posibles combinaciones es altsimo. Como se ve en la tabla, el locus IGH tiene alrededor de 40 segmentos V, 23 segmentos D y 6 segmentos J, lo cual puede originar hasta 6.000 combinaciones diferentes de regiones variables. Como cada cadena pesada puede unirse a dos tipos distintos de cadena ligera, el nmero de posibilidades es todava mayor. A esto hay que aadir otros procesos que todava generan ms diversidad, al introducir mutaciones en la propia secuencia del gen, y que hacen posible que una persona pueda generar millones de anticuerpos distintos.

Figura 3.12 Nmero de posibles molculas diferentes generadas en los genes de las inmunoglobulinas (imagen tomada de http://atlasgeneticsoncology.org/Educ/PolyIgEng.html) El mecanismo molecular por que se fusionan los distintos segmentos genmicos es peculiar, pero en lneas generales podemos decir que se trata de una variante del proceso de reparacin de roturas bicatenarias de ADN por fusin de extremos no homlogos. En este caso concreto, la rotura bicatenaria es generada de forma programada por unas recombinasas llamadas RAG1 y RAG2. Estas protenas llevan a cabo la rotura slo en regiones genmicas que contienen secuencias concretas. En el caso de los genes de inmunoglobulinas, cada segmento V, D J est flanqueado por unos motivos de ADN de 7 de 9 nucletidos, llamados heptmero y nonmero respectivamente. Estos dos motivos estn separados por secuencias espaciadoras de 12 o 23 nucletidos. Las protenas RAG reconocen estas configuraciones y llevan a cabo dos roturas bicatenarias, en los flancos de dos segmentos distintos. Despus, la maquinaria de reparacin por fusin de extremos no homlogos lleva a cabo la unin de los extremos sueltos (las llamadas uniones codificantes), dando adems una molcula circular que se pierde.

-http://www.unav.es/asignatura/genmolhumbq/

57 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 3.13 Procesamiento de los extremos mediante NHEJ iniciado por recombinasas RAG. (imagen tomada de http://atlasgeneticsoncology.org/Educ/PolyIgEng.html) La formacin de los receptores de clulas T es similar al reordenamiento de los genes de inmunoglobulinas. En conjunto, este increble proceso genera la diversidad necesaria para el correcto funcionamiento del sistema inmune, de ah que las mutaciones en genes que codifican protenas de este sistema de reparacin (DNA-PK, KU, etc) se asocien con inmunodeficiencias humanas.

Tema 4. Bsqueda de genes responsables de enfermedades


4.1. El concepto de ligamiento: fraccin de recombinacin y distancia gentica. 4.2. Informatividad de los marcadores utilizados en estudios de ligamiento. 4.3. El clculo del LOD score. 4.4. Identificacin de factores genticos en enfermedades complejas: heredabilidad y estudios de asociacin (GWAS. 4.5. Deteccin de variantes raras de alto riesgo relativo: hacia los genomas individuales y la medicina personalizada.

4.1. El concepto de ligamiento

-http://www.unav.es/asignatura/genmolhumbq/

58 de 172

Gentica Molecular Humana (F.Ciencias)-

En los aos 90 se comenzaron a identificar los primeros genes responsables de enfermedades genticas, es decir cul gen es el que est mutado en determinada enfermedad. Lgicamente, inicialmente se trataba de enfermedades monognicas, en las que un nico gen es el responsable. La metodologa utilizada para esto se basaba en el anlisis de ligamiento, que haba sido ya desarrollado por T.H. Morgan en sus trabajos con Drosophila. Aunque algunos autores ya haban sugerido que los genes se sitan en cromosomas concretos, la primera evidencia clara de esto vino al demostrarse que locus white de Drosophila est ligado al cromosoma X de la mosca. Despus, Morgan identific otro mutante llamado rudimentary que tambin mostraba ligamiento al cromosoma X, y estudi la segregacin simultnea de estos dos genes. Segn las leyes de la herencia mendeliana, dos loci que estn en cromosomas distintos segregarn de manera independiente, es decir, los dos alelos de cada locus se distribuirn en los gametos de modo aleatorio. En cambio, cuando los dos loci estn en el mismo cromosoma (se dice entonces que son sintnicos), cabe pensar que siempre se heredar la misma combinacin de alelos y un miembro de la descendencia que herede un alelo concreto de uno de los loci tambin heredar el alelo del otro locus que estaba en el mismo cromosoma parental. Por el contrario, si se produce una recombinacin (con sobrecruzamiento) en algn punto intermedio entre ambos loci durante la meiosis, los gametos llevarn combinaciones allicas que no estaban presentes en ninguno de los progenitores, es decir, se formen gametos recombinantes. Morgan comprob que poda darse recombinacin entre el locus white y el locus rudimentary en Drosophila, pero al estudiar otros mutantes observ que nunca se detectaba recombinacin con otros loci localizados en el mismo cromosoma, y llam ligamiento a ese fenmeno. Alfred Sturtevant, un estudiante de Morgan, demostr que la probabilidad de que haya una recombinacin entre dos loci depende de la distancia fsica que los separa, y por tanto la frecuencia con que aparecen recombinantes puede utilizarse para deducir la distancia que separa dos genes que estn en el mismo cromosoma; Sturtevant construy en una noche el primer mapa gentico de ligamiento, en el que se representaba el orden y la distancia de cinco genes localizados en el cromosoma X de Drosophila. Poco despus, Calvin Bridges detect los primeros casos de ligamiento entre genes localizados en autosomas, y poco a poco se fueron describiendo distintos grupos de ligamiento. El concepto de ligamiento gentico, por tanto, va intrnsecamente unido al de distancia fsica entre genes, que es la que origina distintas proporciones de individuos recombinantes en la descendencia. Cuando ambos loci estn suficientemente alejados (aunque estn en el mismo cromosoma) existe una probabilidad tan alta de que haya un sobrecruzamiento entre ellos que segregarn de manera similar a una segregacin independiente, produciendo gametos recombinantes en la mitad de la descendencia (50% de gametos recombinantes y 50% de gametos no-recombinantes). En este sentido, es importante recordar que el sobrecruzamiento tiene lugar entre dos cromtides, cada una perteneciente a un cromosoma homlogo; las otras dos cromtides no se recombinan, de ah que un sobrecruzamiento da lugar a cuatro gametos de los cuales dos son recombinantes y los otros dos son idnticos a los cromosomas originales. Sin embargo, a medida que dos loci sintnicos se sitan ms cerca uno del otro, la probabilidad de que haya un sobrecruzamiento entre ellos es cada vez menor, y por tanto la probabilidad de formacin de gametos recombinantes tambin va decreciendo. Puede llegarse a un punto en que los loci estn tan juntos que nunca se d un sobrecruzamiento entre ellos, de modo que no se originarn gametos recombinantes y no se encontrarn individuos recombinantes en la descendencia. Por tanto, la cuantificacin del nmero de eventos de recombinacin entre dos loci nos permite estimar la distancia gentica entre ellos: a mayor proximidad, menor probabilidad de recombinacin y por tanto el porcentaje de individuos recombinantes ser menor. Cuando ambos loci estn suficientemente alejados (aunque estn en el mismo cromosoma) existe una probabilidad tan alta de que haya un sobrecruzamiento entre ellos que segregarn de manera similar a una segregacin independiente, produciendo gametos recombinantes en la mitad de la descendencia (50% de gametos recombinantes y 50% de gametos no-recombinantes). En este sentido, es importante recordar que el sobrecruzamiento tiene lugar entre dos cromtides, cada una perteneciente a un cromosoma homlogo; las otras dos cromtides no se recombinan, de ah que un sobrecruzamiento da lugar a cuatro -http://www.unav.es/asignatura/genmolhumbq/ 59 de 172

Gentica Molecular Humana (F.Ciencias)-

gametos de los cuales dos son recombinantes y los otros dos son idnticos a los cromosomas originales. Sin embargo, a medida que dos loci sintnicos se sitan ms cerca uno del otro, la probabilidad de que haya un sobrecruzamiento entre ellos es cada vez menor, y por tanto la probabilidad de formacin de gametos recombinantes tambin va decreciendo. Puede llegarse a un punto en que los loci estn tan juntos que nunca se d un sobrecruzamiento entre ellos, de modo que no se originarn gametos recombinantes y no se encontrarn individuos recombinantes en la descendencia. Por tanto, la cuantificacin del nmero de eventos de recombinacin entre dos loci nos permite estimar la distancia gentica entre ellos: a mayor proximidad, menor probabilidad de recombinacin y por tanto el porcentaje de individuos recombinantes ser menor. Figura 4.1 En este video se ilustra el fenmeno del ligamiento de dos loci: la distancia entre ambos determina la probabilidad de un sobrecruzamiento, de tal manera que la probabilidad de encontrar individuos recombinantes en la descendencia es menor cuanto ms cerca estn. En Gentica Humana, la cuantificacin de la frecuencia de recombinacin se hace estudiando la segregacin de dos secuencias de ADN en los individuos de una familia, e identificando aquellos individuos cuyo genotipo slo pueda explicarse por una recombinacin en la meiosis de uno de los progenitores. Las secuencias que se utilizan en estudios de ligamiento se denominan marcadores genticos, que son secuencias que se encuentran en distintas formas (distintos alelos) en la poblacin general, ya que para detectar si ha habido recombinacin debemos ser capaces de distinguir los distintos alelos. Adems, los estudios de ligamiento entre marcadores sirven para establecer mapas de ligamiento en los que estos marcadores estn en un orden determinado, separados por distancias precisas. Por tanto, los marcadores utilizados en estudios de ligamiento son polimorfismos genticos, es decir, secuencias que se encuentran en la poblacin en varias formas posibles. Diferentes individuos de la poblacin pueden tener, por tanto, distintos genotipos (distintas combinaciones de alelos) para un marcador concreto. Los principales tipos de polimorfismos genticos que se utilizan como marcadores en estudios de ligamiento han sido explicados con detalle al hablar del genoma humano. Para realizar mapas de ligamiento entre marcadores, es necesario ante todo genotipar cada uno de los marcadores en todos los miembros de una varias familias. Al analizar los genotipos de cada individuo y la segregacin de los diferentes alelos, se pueden identificar los individuos recombinantes, aquellos cuyo genotipo slo puede explicarse por una recombinacin en uno de sus progenitores. La cantidad de individuos recombinantes en la descendencia nos permite calcular la fraccin de recombinacin (representada por la letra griega θ), que se define como el nmero de individuos recombinantes dividido por el nmero total de individuos en la descendencia. Adems de estudiar la distancia entre marcadores, en los estudios de ligamiento que se realizan en Gentica Humana es frecuente buscar cul es la distancia entre un marcador y el locus responsable de una enfermedad gentica. En estos casos, el anlisis de ligamiento nos permitir calcular la distancia entre el marcador y el gen responsable de una enfermedad. Utilizando esta metodologa se han identificado los genes responsables de muchas enfermedades genticas, mediante una estrategia denominada clonaje posicional: al conocer la distancia que separa el locus responsable de una enfermedad de varios marcadores genticos concretos, se simplifica enormemente la tarea de identificar el gen causal. Figura 4.2 Se muestra el rbol correspondiente a una familia en la que segrega una enfermedad autosmica dominante, indicando los individuos enfermos (smbolos rojos) y los genotipos de un marcador que podra estar en ligamiento con la enfermedad.Como se explica en el video, al analizar la descendencia en la generacin III podemos deducir fcilmente si un individuo es recombinante o no, y calcular la fraccin de recombinacin. La fraccin de recombinacin, calculada tal y como se ha explicado en la Figura anterior, nos permite estimar la distancia gentica entre dos loci, distancia que se mide en centimorgans (cM): cuando entre dos loci se detecta una fraccin de recombinacin θ = 0,01 (1% de individuos recombinantes), se dice que ambos loci estn a una distancia gentica de 1 cM. Esta distancia gentica (1 cM) equivale -http://www.unav.es/asignatura/genmolhumbq/ 60 de 172

Gentica Molecular Humana (F.Ciencias)-

aproximadamente a 1 Mb (megabase) de distancia fsica, aunque esta equivalencia vara a lo largo del genoma y hay funciones matemticas ms exactas para convertir la distancia gentica en distancia fsica. En cualquier caso, es importante comprender que la fraccin de recombinacin nunca podr ser mayor a 0,5 (50%), ya que ste es precisamente el porcentaje de individuos recombinantes que se producen en ausencia de ligamiento (cuando siempre hay una recombinacin, como se ha explicado ms arriba) o en el caso de que ambos loci estn situados en cromosomas distintos.

4.2. Informatividad de los marcadores utilizados en estudios de ligamiento


Como acabamos de explicar, para poder realizar estudios de ligamiento es necesario identificar los individuos recombinantes para determinar la fraccin de recombinacin. Por desgracia, en ocasiones es imposible establecer si un individuo de la descendencia es recombinante o no, bien porque el individuo que transmite la enfermedad es homocigoto para el marcador analizado, o bien porque es heterocigoto idntico al otro progenitor; estas situaciones dan lugar a lo que denominamos familias no-informativas o semi-informativas, respectivamente. Figura 4.3 El video explica el concepto de informatividad de un marcador, segn la probabilidad de encontrar individuos heterocigotos distintos para ese marcador en la poblacin general. Se muestran varios ejemplos de familias informativas, semi-informativas o no informativas. Lo posibilidad de perder informatividad subraya la importancia de usar marcadores para los que todos los rboles analizados sean informativos, lo cual depender directamente de la informatividad de los marcadores utilizados. La informatividad de un marcador refleja la probabilidad de encontrar individuos heterocigotos para ese marcador en la poblacin general, y es funcin del nmero de alelos posibles para el marcador y de las frecuencias relativas de cada alelo en la poblacin. Teniendo en cuenta las caractersticas de cada tipo de marcador, es posible calcular dos parmetros que definen la informatividad de un marcador gentico: el ndice de heterocigosidad y el PIC (contenido de informacin de un polimorfismo, P olymorphism Information Content en ingls). Estos parmetros se calculan mediante la siguiente frmula:

El primer miembro (1 - Σpi 2) es la heterocigosidad, es decir, el porcentaje de individuos de la poblacin general que son heterocigotos para ese marcador. Ya hemos visto que si el individuo que transmite la enfermedad es homocigoto para un marcador, esa familia no ser informativa para ese marcador, de ah que la heterocigosidad sea una medida de la informatividad de un marcador gentico. Como pi2 es la frecuencia de homocigotos para cada alelo del marcador, el sumatorio de todos los posibles homocigotos se le resta a 1 y se obtiene as el porcentaje de heterocigotos. Como criterio general, se puede decir que la heterocigosidad de un marcador aumenta: (a) con el nmero de alelos que ese marcador presenta en la poblacin general; y (b) cuanto ms parecidas son las frecuencias de los distintos alelos de ese marcador. El segundo miembro de la ecuacin le resta a la heterocigosidad la probabilidad de que una familia no sea informativa debido a que ambos padres son heterocigotos idnticos (en cuyo caso, como hemos visto antes, la mitad de la descendencia ser informativa (homocigotos) y la mitad ser no-informativa -http://www.unav.es/asignatura/genmolhumbq/ 61 de 172

Gentica Molecular Humana (F.Ciencias)-

(los heterocigotos). Como es sabido, para dos alelos i y j con frecuencias allicas pi y pj la frecuencia de heterocigotos es 2pipj. Por tanto, la probabilidad de que dos individuos sean heterocigotos idnticos es 2pipjx 2pipj= 4(pi2pj2), pero como slo se pierde informatividad en la mitad de la descendencia, en la ecuacin se resta slo 2(pi2pj2). Algunos ejemplos del clculo del PIC ilustrarn la informatividad de los distintos tipos de marcadores genticos. Por ejemplo, un marcador biallico (el caso tpico sera un RFLP) con frecuencias allicas iguales (p1=p2=0,5) tendra: Heterocigosidad = [1 - (p12+p22)] = [1 - (0.52+ 0.52)] = 1- 0.5 = 0.5 PIC = 1 - (p12+p22) - 2(p12 x p22) = 1 - (0.52+ 0.52) - 2(0.52 x 0.52) = 0.375 En cambio, un marcador con cuatro alelos (alelos 1, 2, 3 y 4) en el que cada alelo tiene una frecuencia p = 0,25, presentar en principio 6 posibles combinaciones de heterocigotos, con genotipos (1-2), (1-3), (1-4), (2-3), (2-4) y (3-4). Por tanto, para calcular todos los posibles casos de heterocigotos idnticos en la poblacin, habr que sumar [2(p12 p22)] + [2(p12 p32)] + [2(p12 p42)] + [2(p22 p32)] + ... hasta completar las seis posibles combinaciones de heterocigotos. Aplicando la frmula general: Heterocigosidad = [1 - (0,252+ 0,252+ 0,252+ 0,252 )] = 0,75 PIC= 1 - (0,252+ 0,252+ 0,252+ 0,252 ) - 6 [2(0,252 x 0,252 )] = 0,703 Como se ve, el hecho de que un marcador tenga 4 posibles alelos en vez de 2 aumenta su informatividad casi al doble. De hecho, un marcador con 10 alelos arrojara, aplicando la frmula anterior, un PIC de 0,891 si las frecuencias allicas son iguales. Por tanto, de los distintos marcadores que se han mencionado ms arriba, los ms informativos son los de tipo microsatlite, seguidos por SNP y RFLP. De todas formas, como ya se ha comentado, la posibilidad de estudiar a la vez miles de SNPs de forma automatizada (algo que no es posible con los microsatlites), junto con su alta densidad a lo largo del genoma, hace que los SNP sean hoy en da los marcadores de mayor utilidad en los estudios de asociacin que se explicarn ms adelante. Sea cual sea el tipo de marcador utilizado, los estudios de ligamiento requieren genotipar a todos los miembros de una familia para detectar la presencia de individuos recombinantes y as poder calcular la fraccin de recombinacin. En el ejemplo de la familia con una enfermedad autosmica dominante presentado en la Figura 4.2, hemos podido establecer que el individuo transmisor de la enfermedad transmita a la vez el alelo 2 del marcador, ya que ambos se localizan a poca distancia en el mismo cromosoma. Sabemos esto porque este individuo, a su vez, hered la enfermedad de su padre, que tambin le transmiti el alelo 2 del marcador. Cuando en un individuo que transmite una enfermedad podemos determinar inequvocamente el origen parental tanto del alelo que causa la enfermedad como de los alelos del marcador -es decir, podemos determinar qu alelos de cada uno de los dos loci van en el mismo cromosoma- se dice que conocemos la fase de ligamiento de ese individuo. Precisamente es el hecho de conocer la fase de ligamiento en el individuo transmisor lo que hace que todas las meiosis de este individuo sean informativas, y nos permite determinar con certeza si los individuos de la descendencia son recombinantes o no. Se recordar que en el caso concreto de esta familia haba un individuo recombinante de un total de 6, lo que sugiere que ambos loci (el marcador y el gen de la enfermedad) estn en ligamiento a una distancia que produce 1 recombinante de cada 6 individuos (fraccin de recombinacin θ= 1/6=0,17, es decir a una distancia gentica de 17 cM). El principal problema es que este resultado podra haberse dado por azar: tericamente es posible que no haya ligamiento y que una descendencia ms numerosa nos mostrase una fraccin de recombinacin ms cercana al 50% de individuos recombinantes. -http://www.unav.es/asignatura/genmolhumbq/ 62 de 172

Gentica Molecular Humana (F.Ciencias)-

Frente a esta "hiptesis nula" (no ligamiento) tenemos una hiptesis alternativa de que existe ligamiento entre ambos loci, a una distancia tal que origina una θ = 0,17. Cmo podemos determinar cul de las dos hiptesis es la verdadera , al menos, la que mejor explica los datos obtenidos en esta familia?

4.3. El clculo del LOD score


Para cuantificar la significacin de cada una de estas hiptesis, los estudios de ligamiento utilizan un mtodo llamado "Estimacin de la Mxima Verosimilitud" ("verosimilitud" es la traduccin del trmino ingls likelihood). Este mtodo consiste en estimar la verosimilitud de cada hiptesis, calculando la probabilidad de encontrarnos con esa fraccin de recombinacin cuando se verifica esa hiptesis. Por ejemplo, para estimar la verosimilitud de la hiptesis de ligamiento, calculamos la probabilidad de obtener 1 recombinante de cada 6 individuos en el caso de que exista ligamiento a una distancia de 17 cM; para estimar la verosimilitud de la hiptesis nula, calculamos la probabilidad de obtener 1 recombinante de cada 6 individuos en el caso de que no exista ligamiento, y as sucesivamente. La siguiente caja ilustra el razonamiento matemtico que se sigue para estimar estas probabilidades, con un ejemplo del lanzamiento de monedas: Aplicando esta forma de proceder al rbol que hemos venido estudiando, recordamos que hay 5 individuos no-recombinantes y 1 recombinante, luego formulamos la hiptesis H1 de que la distancia entre el locus de la enfermedad y el locus del marcador es tal que producen una frecuencia de recombinacin θ=1/6. Por tanto, bajo esta hiptesis, la probabilidad de encontrar un individuo recombinante es P(R)=1/6, y la probabilidad de encontrar un no-recombinante es P(NR)=5/6. La verosimilitud de que esta hiptesis (H1, θ=1/6) explique nuestros datos experimentales (5 no-recombinantes y 1 recombinante) se calcula aplicando la frmula general: L(H1) = θR x (1 - θ)NR Por el contrario, la verosimilitud de la hiptesis nula para explicar nuestros datos sera: L(H0) = 0,5(R+NR) Para calcular cuntas veces ms verosmil es nuestra hiptesis que la hiptesis nula, hallamos el cociente de verosimilitudes (likelihood ratio). En gentica humana, para que este cociente sea significativo al 95% se requiere que sea mayor o igual a 1000. Es fcil darse cuenta que uno de los principales problemas que nos encontramos es el tamao pequeo de las generaciones, al contrario de los estudios de ligamiento que se hacen en otras especies. Una forma de solventar este problema es repetir el anlisis en varias familias distintas, y combinar los resultados obtenidos en cada una de ellas con el fin de aumentar la potencia estadstica de los estudios de ligamiento. Para poder combinar resultados de familias distintas, Newton Morton ide el concepto del Lod score (que podra traducirse como "puntuacin lod" y se representa por la letra Z), que es el log10del cociente de verosimilitudes. Por tanto, un cociente de verosimilitudes = 1000 equivale a un lod score igual a 3 (Z=3), y ste es precisamente el valor mnimo de Z que se requiere para poder afirmar que existe ligamiento significativo entre dos loci. Para hallar el lod score mximo de todos los posibles, es habitual utilizar programas de ordenador que calculan directamente el lod score que se obtiene para varias hiptesis de ligamiento y a distintos valores de θ. Adems, como los resultados de una sola familia raras veces sern significativos, necesitamos combinar los resultados obtenidos a partir de los datos de varias familias. Para ello, se suman los lod scores (Z) obtenidos para cada q en las distintas familias que estamos analizando, hasta identificar la fraccin de recombinacin q a la que obtenemos el lod score mximo en el conjunto de las familias analizadas. ste es el valor que finalmente nos permitir afirmar si existe o no ligamiento significativo entre el gen de la enfermedad y este marcador. Adems, como la Z mxima se obtiene a una fraccin de recombinacin concreta, podemos tambin estimar la distancia gentica ms probable entre ambos loci, expresada -http://www.unav.es/asignatura/genmolhumbq/ 63 de 172

Gentica Molecular Humana (F.Ciencias)-

—como siempre— en centimorgans. Por ejemplo, si la Z mxima se obtuvo a una θ = 0,16, la distancia gentica entre ambos loci estar en torno de 16 cM, con un intervalo de confianza cuyo clculo es tambin sencillo.

Figura 4.4 El clculo del LOD score (Z) puede ilustrarse con el ejemplo de esta familia, en la que se indica el nico individuo recombinante de la generacin III con una flecha. La fraccin de recombinacin es 0,17, por lo que se calcula la verosimilitud (likelihood) de la hiptesis de ligamiento a esa fraccin de recombinacin y a la fraccin de recombinacin que obtendramos si no hubiese ligamiento (0,5). Tras calcular el cociente de ambas verosimilitudes, calculamos el LOD score como se ve en la parte de abajo de la figura. Este video explica cmo se calcula el LOD score para todas las fracciones de recombinacin posibles, representando grficamente los resultados. Como los resultados de una sola familia no son suficientes para detectar ligamiento, lo habitual es combinar los resultados obtenidos para varias familias y sumar los LOD score a cada fraccin de recombinacin. Por ejemplo, si combinamos los resultados de 5 familias como la anterior, obtenemos:

-http://www.unav.es/asignatura/genmolhumbq/

64 de 172

Gentica Molecular Humana (F.Ciencias)-

Ahora, el valor ms alto de LOD scoreaparece a una fraccin de recombinacin de 0,20. De todas formas, para calcular elLOD score mximo (Zmax) hemos de representar grficamente esos datos, buscar los valores con Z>3 y detectar el punto ms alto de la curva: Estos resultados indican que, efectivamente, el LOD score mximo se obtiene a una fraccin de recombinacin de 0,16. Como Z>3 en ese punto, se puede concluir que existe ligamiento entre este marcador y el gen que causa la enfermedad, y que la distancia ms probable entre ambos es de 16 cM. Un problema muy importante en los estudios de ligamiento es que muchas veces no podemos deducir la fase de ligamiento en el progenitor que transmite la enfermedad, al no poder establecer con exactitud si un alelo concreto del marcador est en el mismo cromosoma que lleva el alelo mutado o si est en el cromosoma homlogo. Lgicamente, esto impide establecer si un individuo de la descendencia es recombinante o no, y por tanto complica mucho el clculo de la fraccin de recombinacin. De hecho, hay dos posibles fases de ligamiento que tienen la misma probabilidad, y esto ha de tenerse en cuenta a la hora de estimar la verosimilitud de cada hiptesis. As, se calcula el cociente de verosimilitudes para cada una de las fases de ligamiento alternativas y se halla el lod score promedio de ambas: Z(θ) = log10 [ [θR x (1 - θ)NR / 0,5(R+NR)] + [θNR x (1 - θ)R / 0,5(R+NR) ]] Lgicamente, el desconocimiento de la fase de ligamiento en el individuo que transmite la enfermedad hace que el valor final del lod score sea ms bajo, por lo que -si los loci estudiados estn realmente en ligamiento— ser necesario estudiar un mayor nmero de familias para poder alcanzar el valor umbral de Z=3. Es muy til representar los valores que adopta el lod score Z en funcin de los distintos valores de la fraccin de recombinacin θ. Cuando se hace esto, podemos observar varios tipos posibles de curva: Si no se ha encontrado ningn individuo recombinante en ninguna de las familias estudiadas, esto quiere decir que los dos loci que estamos estudiando (el locus de la enfermedad y el del marcador) estn en ligamiento y tan cercanos entre s que no se producen sobrecruzamientos entre ellos. El lod score es mximo a θ = 0, para ir bajando hasta Z=0 para una θ = 0,5. -http://www.unav.es/asignatura/genmolhumbq/ 65 de 172

Gentica Molecular Humana (F.Ciencias)-

Cuando existe ligamiento, lo ms habitual es hallar una curva de forma parablica, con un pico mximo de lod score a una determinada fraccin de recombinacin. En estos casos el lod score a la fraccin de recombinacin θ = 0 debe ser (- ∞), ya que hemos encontrado individuos recombinantes en alguna de las familias y esto hace imposible la hiptesis de que la fraccin de recombinacin sea cero. El intervalo de confianza de la fraccin de recombinacin mxima se calcula trazando una horizontal una unidad de lod score por debajo de la Z mxima, y viendo dnde corta ambas ramas de la curva. Como siempre, el lod score Z se hace 0 para una fraccin de recombinacin θ =0.5, pues en este caso el cociente de verosimilitudes L(H1)/L(H0) = 1, y el log10 de 1 es igual a 0. En ocasiones, la curva alcanza valores de Z inferiores a -2. En estas circunstancias podemos afirmar que NO existe ligamiento por debajo de una determinada fraccin de recombinacin θ y por tanto ambos loci necesariamente estn a una distancia gentica superior a la indicada por esa fraccin de recombinacin (si es que efectivamente estn en ligamiento). Finalmente, hay ocasiones en que no encontramos ligamiento significativo, pero tampoco podemos excluirlo para ninguna de las θ estudiadas, puesto que no hay ningn valor de lod score que sea superior a +3 o inferior a -2. En estos casos no podemos extraer ninguna informacin til de los datos obtenidos de estas familias.

4.4. Identificacin de factores genticos en enfermedades complejas.


Algunos rasgos fenotpicos cuantitativos, como por ejemplo la presin arterial o los niveles de glucosa en sangre, se encuentran en la poblacin mostrando una distribucin normal debido a la interaccin varios genes (cada uno de los cuales se heredara de forma mendeliana) a los que se aade la accin de factores ambientales, lo cual se denomina herencia multifactorial. Por ejemplo, podemos imaginar un modelo sencillo de dos loci que regulan la presin sangunea, de forma que cada uno de ellos se hereda de modo mendeliano y provoca un aumento de 20 mm de presin arterial cuando se encuentra en estado homocigoto para el alelo dominante (mayscula), 10 mm en los heterocigotos o no provoca ningn aumento en los homocigotos para el alelo recesivo (minscula). Representando estos valores en un grfico de barras, se puede comprobar que 1/16 de la poblacin tendr un genotipo AA/BB (aumento de 40 mm de presin arterial), 4/16 de la poblacin tendr genotipos que provocan un aumento de 30 mm, 6/16 tendr genotipos con 20 mm, 4/16 con 10 mm y 1/16 sern genotipo aa/bb (0 mm de aumento). Como se ve, estos valores se aproximan a una distribucin normal. Lgicamente, la presencia de ms loci hace que aparezcan ms categoras (ms barras) y que la curva de distribucin se "suavice" cada vez ms. La variacin debida a factores ambientales (ingesta de sal, ejercicio fsico, etc.) sobreaadidos a los factores genticos producir la curva gaussiana tpica de muchos de estos rasgos cuantitativos. Figura 4.5 incluye un video que ilustra la importancia de la herencia multifactorial en las enfermedades complejas. En el campo de la Gentica Humana la herencia multifactorial es de gran importancia, porque la mayora de los fenotipos y muchas enfermedades, conocidas como enfermedades complejas, siguen este tipo de herencia. De hecho, las enfermedades multifactoriales o complejas son las ms importantes desde el punto de vista epidemiolgico, por lo que actualmente son objeto de investigacin con el fin de identificar los factores genticos y ambientales implicados. Fruto del trabajo de estos ltimos aos, se ha detectado un alto nmero de loci genticos relacionados con el desarrollo de enfermedades como cncer, diabetes, hipertensin, esquizofrenia, enfermedades neuro-degenerativas, etc. Para cuantificar la magnitud del componente gentico de una enfermedad, concepto anlogo a la heredabilidad, se utilizan actualmente dos procedimientos:

-http://www.unav.es/asignatura/genmolhumbq/

66 de 172

Gentica Molecular Humana (F.Ciencias)-

Clculo del riesgo relativo. Si calculamos el riesgo relativo de padecer la enfermedad que tienen distintos grupos de personas relacionadas genticamente, como por ejemplo los hermanos de individuos enfermos, y vemos que el riesgo de padecer la enfermedad en ese grupo es significativamente mayor que en la poblacin general, podemos deducir que existen factores genticos que determinan la aparicin de esta enfermedad. El riesgo relativo se calcula como lR, en la que el subndice R indica el grado de parentesco del grupo que estamos estudiando con los individuos enfermos. Por ejemplo lo (la "O" viene del ingls offspring, que significa "descendencia") indicara la prevalencia de la enfermedad en los hijos e hijas de individuos enfermos; ls (la "S" viene del ingls sibs, que significa "hermanos y hermanas") sera la prevalencia de la enfermedad en los hermanos y hermanas de individuos enfermos, etc. Calculando el cociente de cada uno de estos riesgos entre el riesgo poblacional general podemos calcular el riesgo relativo. Un concepto similar al de riesgo relativo es el de odds ratio (cociente del producto cruzado), que se calcula de otro modo pero nos da prcticamente la misma informacin. La interpretacin de estos clculos es la misma: si los parientes de los individuos enfermos tienen un riesgo significativamente aumentado de padecer la enfermedad frente al riesgo de la poblacin general, se puede suponer que la enfermedad tiene un componente gentico importante.

Clculo de las tasas de concordancia en parejas de gemelos. Si una enfermedad tiene un componente gentico significativo, aparecer con mayor frecuencia en individuos con mayor parecido gentico que en individuos genticamente ms distantes. Un modo elegante de estudiar esto en la prctica es comparar los gemelos dicigticos (cuyo grado de identidad gentica es igual al de una pareja cualquiera de hermanos) y los gemelos monocigticos, ya que stos son prcticamente idnticos desde el punto de vista gentico. Este tipo de estudios, que han dado abundantes frutos en Gentica Humana, se basan en el clculo de las tasas de concordancia, es decir, el porcentaje de parejas de gemelos que concuerdan para un mismo rasgo fenotpico (una enfermedad, en este caso), de manera que simplemente calculamos el porcentaje de parejas de gemelos en las que ambos padecen la misma enfermedad. Estas parejas seran "concordantes" para esa enfermedad, mientras que las parejas en las que un gemelo est enfermo pero el otro est sano seran parejas "discordantes". Pues bien, si una enfermedad tiene un fuerte componente gentico, la tasa de concordancia en parejas de gemelos monocigticos (MC) ser claramente ms alta que en parejas de gemelos dicigticos (DC), pues aquellos comparten mayor nmero de genes que stos. Adems, este tipo de anlisis tiene la ventaja de que corrige la influencia de los factores ambientales, ya que en la mayora de los casos ambos hermanos gemelos —tanto MC como DC— han estado sometidos a las mismas influencias ambientales. En el caso de rasgos cuantitativos (la presin arterial, por ejemplo) la estimacin de la concordancia puede realizarse mediante el clculo del coeficiente de correlacin intraclase (correlacin de los valores de presin arterial de un hermano con su gemelo respectivo), de forma que un coeficiente de correlacin R = 1 equivale al 100% de concordancia. La comparacin de concordancias entre gemelos MC y DC se hace del mismo modo que se comparan dos coeficientes de correlacin. En el caso de rasgos cualitativos (presencia o ausencia de una enfermedad) simplemente calculamos el porcentaje de parejas de gemelos que concuerdan para esa enfermedad y as obtenemos la tasa de concordancia (porcentaje de parejas concordantes respecto al total de parejas). Con estos datos podemos estimar la heredabilidad (h), mediante la frmula h = 2 (Cmc - Cdc), en la que C es la tasa de concordancia (Cmc en monocigticos y Cdc en dicigticos). Los valores de heredabilidad calculados de este modo tienen un rango terico entre +1.5 (que correspondera a un rasgo -http://www.unav.es/asignatura/genmolhumbq/ 67 de 172

Gentica Molecular Humana (F.Ciencias)-

monognico autosmico recesivo, con Cmc = 1 y Cdc = 0.25) y 0 (Cmc = Cdc, en el caso de un rasgo infludo slo por el ambiente). En general, se considera que las enfermedades con una heredabilidad en torno a 1 (o superior) tienen un componente gentico importante.

Hoy en da, las nuevas tecnologas de genotipaje que utilizan marcadores tipo SNP (Single Nucleotide Polymorphisms, ya vistos anteriormente) han acelerado enormemente la identificacin de genes que confieren susceptibilidad a enfermedades comunes. En este sentido, es importante detectar los SNP que pueden ser ms informativos en estos estudios: se estima que en toda la poblacin mundial se encuentran ms de 10 millones de SNPs en los que ambas variantes allicas tienen una frecuencia mayor o igual a 1%. A pesar del indudable inters que tienen estos polimorfismos para realizar estudios de asociacin allica, genotipar todos estos SNPs en un nmero grande de individuos es impracticable. Podemos salvar este obstculo gracias a que muchos SNP, por estar muy cerca fsicamente, se heredan juntos en pequeos bloques de desequilibrio de ligamiento. La combinacin concreta de alelos de los distintos SNP que estn en un mismo bloque constituye un haplotipo caracterstico de ese bloque. Por tanto, un grupo reducido de SNPs de cada haplotipo pueden ser representativos de todo ese haplotipo (por lo que reciben el nombre de tag-SNPs, o SNP-etiqueta); de este modo, no es necesario genotipar todos los SNPs del genoma, sino slo los SNP-etiqueta. De hecho, la metodologa actual permite analizar 500.000 a 1 milln de SNPs rutinariamente, lo cual es suficiente para cubrir todos los haplotipos del genoma humano. El Proyecto Internacional Hapmap ha construido un catlogo con todos los haplotipos de SNPs presentes en diversas poblaciones humanas, detallando la estructura y el tamao de los bloques de desequilibrio de ligamiento del genoma. Esto hace posible llevar a cabo estudios de asociacin para identificar las regiones donde residen los genes que confieren susceptibilidad a enfermedades comunes. A continuacin se explica cmo se llevan a cabo estos estudios, conocidos como GWAS (en ingls, Genome Wide Association Study). Fases de un estudio de GWAS: 1. Seleccin de SNPs a genotipar: Utilizando herramientas bioiformticas es relativamente sencillo visualizar la posicin y tamao de los bloques haplotpicosa lo largo del genoma (bloques de SNPs que estn en desequilibrio de ligamiento). La posicin y tamao de estos bloques nos ayuda a seleccionar los SNPs ms adecuados para cubrir todo el genoma con el menor nmero posible de sondas. Este trabajo previo de seleccin habitualmente lo hacen los fabricantes de microarrays de SNPs, que actualmente analizan en torno a los 500.000 1.000.000 de SNPs por microarray. 2. Toma de muestras de las cohortes a estudiar: Los estudios de asociacin "genome-wide" requieren un gran nmero de muestras, para poder detectar seales de asociacin dbiles. Idealmente, deben utilizarse -http://www.unav.es/asignatura/genmolhumbq/ 68 de 172

Gentica Molecular Humana (F.Ciencias)-

cohortes (casos y controles, por lo general) de al menos 1.000 individuos cada una, sin diferencias de sexo, edad y procedencia tnica. 3. Anlisis de resultados: Utilizando distintas herramientas, se generan los haplotipos y se buscan seales de asociacin, es decir, SNPs en los que un alelo est estadsticamente sobre-representado en los casos (enfermos)respecto a los controles (sanos). Esto se hace utilizando un test de Chi-cuadrado o de Fisher, con correccin para pruebas mltiples.

La Figura 4.5 muestra el valor de asociacin (en el eje Y) para varios miles de SNPs distribuidos por todo el genoma. Hay dos SNP con valores de asociacin que significativamente elevados. La posicin de estos SNP indica que en esa regin existe uno o varios genes implicados en el desarrollo del rasgo fenotpico que se est analizando (una enfermedad, por ejemplo). Imagen obtenida de http://www.goldenhelix.com/images/solutions/visualization/manhattan.png 4. Refinar la asociacin y replicar los resultados: En la etapa final, las regiones para las que se detect asociacin deben refinarse genotipando ms SNPs en esa zona concreta, para as delimitar mejor la regin implicada. Adems, los resultados deben confirmarse estudiando cohortes distintas con un nmero de casos y controles similar al del primer estudio. Los estudios de asociacin a escala genmica estn dando resultados muy valiosos. En los aos 2007 y 2008 se han publicado bastantes estudios que encuentran regiones claramente asociadas con diversas enfermedades multifactoriales. Uno de estos trabajos, desarrollado por el Wellcome Trust Case Control Consortium (WTCCC), estudi 2.000 muestras de pacientes britnicos con una de las siete enfermedades multifactoriales ms comunes (depresin, enfermedad coronaria, enfermedad de Crohn, hipertensin, artritis reumatoide, diabetes tipo 1 y diabetes tipo 2). Estas cohortes (14.000 individuos en total) fueron comparadas con 3.000 controles sanos, y en cada uno de los 17.000 individuos se genotiparon 500.000 SNPs, encontrando asociacin significativa con varias regiones del genoma.

-http://www.unav.es/asignatura/genmolhumbq/

69 de 172

Gentica Molecular Humana (F.Ciencias)-

A finales de 2010, se haban publicado ms de 1.200 estudios de GWAS en todo el mundo, con datos de asociacin para ms de 200 enfermedades o rasgos genticos (el catlogo completo puede consultarse en http://www.genome.gov/gwastudies/).

4.5. Deteccin de variantes raras de alto riesgo


En cualquier caso, los estudios de asociacin slo detectan variantes genticas comunes (el alelo de menor frecuencia est presente en, al menos, el 5% de la poblacin), por lo que su efecto sobre la enfermedad es -por definicin- pequeo (el riesgo de los individuos que lo portan aumenta poco en relacin al riesgo general). Se acepta que deben existir otras variantes ms raras (frecuencia menor al 5%) con mayor efecto fenotpico, que estn situadas cerca de las seales de asociacin. La deteccin de estas variantes, implicadas directamente en el desarrollo de las enfermedades, requerir la secuenciacin exhaustiva del genoma completo de casos y controles. Con estas nuevas metodologas, es previsible que en los prximos aos se identifiquen las principales variantes que confieren susceptibilidad a las enfermedades ms frecuentes. Por ejemplo, podemos pensar que en un futuro no muy lejano un paciente hipertenso que acuda a la consulta gentica ser estudiado para detectar variantes de predisposicin en varios genes, y gracias a los resultados se le clasificar dentro de un grupo molecular determinado que permitir asignarle un tratamiento diettico o farmacolgico especfico. Desde este punto de vista, el genotipado de polimorfismos concretos puede convertirse en un anlisis de rutina en el diagnstico de un nmero creciente de enfermedades humanas en el prximo decenio.

Tema 5. Bases moleculares de las alteraciones citogenticas


5.1. El estudio de los cromosomas humanos. 5.2. El fenmeno de no disyuncin meitica y sus implicaciones. 5.3. Mutaciones debidas a repeticiones dispersas. 5.4. Desrdenes genmicos.

5.1. El estudio de los cromosomas humanos


La citogentica constitucional se ocupa del anlisis de los cromosomas en clulas que representan la lnea germinal del individuo (habitualmente linfocitos de sangre perifrica), y se llama as para distinguirla de los estudios citogenticos sobre poblaciones celulares concretas que no representan la constitucin gentica de todo el individuo (clulas somticas, por ejemplo las clulas de un tumor). La citogentica constitucional refleja, por tanto, la estructura cromosmica que ha sido heredada y que, a su vez, se transmitir a la descendencia. La citogentica clsica se basa en la creacin y anlisis del cariotipo, que es la presentacin ordenada de los cromosomas cuando se hacen visibles en metafase. Hasta los aos 50 se crea que los humanos tenamos 48 cromosomas y que el sexo dependa del nmero de cromosomas X, como sucede en Drosophila. En 1956 se determin el nmero exacto de cromosomas de la especia humana, y en 1959 ya se haban identificado las anomalas cromosmicas caractersticas de los Sndromes de Down, Turner y Klinefelter. Esto se debi a mejoras tcnicas que permitieron cultivar leucocitos de sangre perifrica (estimulando el crecimiento en cultivo con fitohemaglutinina y mitgenos), detener el ciclo celular especficamente en metafase (utilizando sustancias como colchicina) y realizar tinciones especficas del ADN. En 1968 Caspersson introdujo las bandas Q, y en 1971 se introdujeron las bandas G, que son el mtodo ms utilizado para generar cariotipos.

-http://www.unav.es/asignatura/genmolhumbq/

70 de 172

Gentica Molecular Humana (F.Ciencias)-

La cromatina es una estructura dinmica cuyo grado de empaquetamiento es mximo durante la mitosis, y por eso en esta fase del ciclo celular se puede ver en una forma especialmente condensada que da lugar a los cromosomas. Como hemos visto, esta condensacin se produce porque la fibra de cromatina de 300 nm se enrolla en forma de espiral, proporcionando un grado de empaquetamiento unas 5 veces mayor al observado durante la interfase. La mitosis es el proceso de divisin de las clulas somticas, fundamental en la proliferacin celular que tiene lugar durante el desarrollo embrionario, el crecimiento y el mantenimiento de los tejidos. Supone una reorganizacin drstica de todos los componentes celulares, pero muy especialmente de los cromosomas, cuya segregacin a cada una de las clulas hijas debe ser muy precisa y estar finamente regulada y coordinada con la separacin fsica de las nuevas clulas (citoquinesis). Durante la mitosis, la maquinaria celular se especializa en llevar a cabo los distintos procesos que tienen lugar en la clula: condensacin de la cromatina, formacin del huso mittico, segregacin de los componentes y fisin celular. Figura 5.1 video que ilustra las principales fases de la mitosis, en lo que respecta al comportamiento de los cromosomas y la separacin de las cromtides hermanas. La primera fase de la mitosis (profase), comienza con la condensacin de la cromatina, la ruptura de la envuelta nuclear y el desarrollo del huso mittico. Es importante recordar que la cromatina ha sido replicada en la fase S de la interfase previa, por lo que cada cromosoma est ahora formado por dos cromtides hermanas. Los microtbulos se unen a los quinetocoros, estructuras proteicas formadas sobre los centrmeros de cada cromosoma, y comienzan a transportar a los cromosomas hacia el plano ecuatorial del huso. En la fase siguiente (metafase) cada cromosoma est unido a microtbulos procedentes de los dos polos de la clula, de modo que todos los cromosomas estn en el ecuador del huso mittico sometidos a fuerzas tensionales opuestas. Los mecanismos moleculares que regulan la cohesin de cromtides hermanas comienzan a conocerse cada vez mejor, y su implicacin en patologa humana est adquiriendo mayor relevancia. Por ejemplo, se han identificado las protenas cromosmicas necesarias para mantener la cohesin de cromtides hermanas, que se denominan cohesinas. En eucariotas funcionan como cohesinas al menos cuatro miembros de la familia SMC (Structural Maintenance of Chromosomes), y en Xenopus (sapo) se ha identificado un complejo que es necesario para la cohesin y que est formado por SMC1 y SMC3 junto con SCC1 (Sister Chromatid Cohesion 1). La cohesin se establece en la fase S del ciclo celular, durante la replicacin del ADN, aunque las cohesinas estaban ya presentes en la cromatina. Al replicarse el ADN, ambas cromtides quedan unidas por las cohesinas en toda su longitud, distinguindose dos tipos de cohesin: la cohesin en los centrmeros y la cohesin en los brazos cromosmicos. Ambos tipos de cohesin estn mediados por cohesinas, pero los procesos que los regulan son algo diferentes. El mantenimiento de esta cohesin durante metafase es muy importante, porque es precisamente el balance entre las fuerzas de los microtbulos y la cohesin de ambas cromtides lo que permite el alineamiento de los cromosomas en el mismo plano: la tendencia de los microtbulos a separar las cromtides se ve contrarrestada por la cohesin que las mantiene unidas, y gracias a esta cohesin se genera la tensin necesaria para formar la placa metafsica. Es precisamente la prdida brusca de cohesin lo que permite la separacin de las cromtides. Lgicamente, un componente fundamental en estos procesos es el quinetocoro, que en definitiva es el punto de cada cromosoma donde se anclan los microtbulos. Existe en clulas eucariotas un sistema que comprueba que todos los quinetocoros estn unidos a microtbulos y activa un punto de control que impide la separacin de las cromtides antes de conseguir la perfecta unin de todos los quinetocoros a sus microtbulos respectivos. La metafase va seguida por la anafase, en la que tiene lugar la segregacin de las cromtides hermanas de cada cromosoma hacia polos opuestos de la clula. La separacin simultnea de 46 pares de cromtides hermanas en la transicin metafase-anafase es un momento crucial del ciclo celular, y por tanto est finamente regulado. Por ejemplo, es crtico que la cohesin se pierda en el momento adecuado, para que cada cromtide pueda migrar a una clula hija sin errores. En general, se observa que primero se pierde la cohesin en los centrmeros, y a medida que los microtbulos van "tirando" de los quinetocoros se va perdiendo la cohesin en los brazos. La separacin se lleva a cabo mediante la degradacin de las cohesinas. La ltima fase de la mitosis es la telofase, en la que -http://www.unav.es/asignatura/genmolhumbq/ 71 de 172

Gentica Molecular Humana (F.Ciencias)-

los cromosomas vuelven a descondensarse y se forma la envoltura nuclear alrededor de cada uno de los nuevos ncleos que se han formado en cada polo de la clula. Terminada la mitosis, el proceso de divisin celular se completar con la citoquinesis, en la que los componentes celulares se reordenan y se reorganiza el citoesqueleto para facilitar la divisn fsica de la clula en dos clulas hijas. Dada la importancia de la separacin de las cromtides hermanas en anafase, se ha investigado mucho en torno a su regulacin. Se sabe que la degradacin de las cohesinas se lleva a cabo por dos mecanismos distintos: fosforilacin (mediada por la quinasa Polo) de algunos componentes, y proteolisis de otros. Las protenas implicadas en la proteolisis de la cohesinas se llaman separinas ( separasas). Se ha comprobado que las separinas son capaces de romper el complejo cohesina porque degradan la protena SCC1 (una cohesina) durante el comienzo de la anafase, permitiendo la separacin de las cromtides por la fuerza que ejercen los microtbulos. Cmo se activan las separinas en el momento exacto de la anafase? Esto se ha resuelto gracias a la identificacin de las securinas, protenas que inhiben la accin proteoltica que ejercen las separinas sobre las cohesinas. Por tanto, durante la mitosis las securinas estn unidas a las separinas y as inhiben su accin, de modo que el complejo cohesina permanece intacto y las cromtides permanecen unidas. La disociacin de las cohesinas se produce por la degradacin sbita de las securinas al comienzo de la anafase, de manera que las separinas quedan libres y pueden cortar por proteolisis el complejo cohesina. El evento crucial, por tanto, es la degradacin de securinas, degradacin que est mediada por un complejo proteico llamado APC (Anaphase Promoting Complex) que posee actividad ubiquitina-protein-ligasa y promueve la degradacin de diversas protenas al comienzo de la anafase. Lgicamente, estos procesos no deben comenzar hasta que todos los quinetocoros estn correctamente unidos a los microtbulos del huso, pues de lo contrario la segregacin de las cromtides no sera correcta. Por tanto, existe tambin un mecanismo de sealizacin que detecta si todos los quinetocoros han sido correctamente unidos por microtbulos y enva una seal de activacin del APC, para que d comienzo la prdida de cohesin. Figura 5.2 Proceso de degradacin de las cohesinas, necesario para que pueda tener lugar la correcta separacin de las cromtides hermanas durante la mitosis, explicado en este video. En organismos de reproduccin sexual, la formacin de los gametos implica un modo de divisin celular diferente al de las clulas somticas. Los gametos debern poseer una sola copia de cada cromosoma, de modo que el cigoto resultante de la unin del gameto masculino y del gameto femenino en la fertilizacin sea diploide (con un cromosoma de origen paterno y otro cromosoma de origen materno en cada par cromosmico). Para obtener un nmero haploide (n) de cromosomas en los gametos, el proceso de formacin de los mismos (gametognesis) tiene unas caractersticas especiales. La principal peculiaridad es la existencia de un tipo distinto divisin celular en el que una clula diploide (2n) replica su ADN una vez (duplicando su contenido total en ADN de 2C a 4C) pero experimenta dos divisiones cromosmicas; esto tiene como consecuencia que los gametos masculino (espermatozoide) y femenino (oocito) llevan un nmero haploide de cromosomas (n) y un contenido total de ADN igual a C (una cromtide por cromosoma). Este modo de divisin celular se denomina meiosis, y tiene adems otras caractersticas muy importantes para la transmisin de la variabilidad gentica. En ambas lneas germinales, masculina o femenina, la gametognesis comienza cuando los gonocitos experimentan una serie de divisiones mitticas tpicas en las que las clulas van madurando hasta llegar a formar las gonias (espermatogonias u oogonias, respectivamente) y los gametocitos primarios, que son clulas diploides (2n). A partir de este momento, las clulas replican su ADN en la fase S y a continuacin entran en meiosis, en vez de dividirse por mitosis.

-http://www.unav.es/asignatura/genmolhumbq/

72 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 5.3 Visin general de la gametognesis, tanto en la va masculina (espermatognesis) como en la femenina (oognesis). El desarrollo es paralelo en ambas vas, con la diferencia de la aparicin de corpsculos polares en la oognesis. La maduracin final hace que los espermatozoides y el vulo sean clulas de caractersticas muy distintas. La imagen representa una clula con dos pares cromosmicos, uno en tonos rojos y otro en tonos azules. Es muy importante seguir la pista a las distintas cromtides. La meiosis incluye en realidad dos distintas divisiones cromosmicas, por lo que suele separarse en dos fases llamadas meiosis I ( primera divisin meitica) y meiosis II (segunda divisin meitica). La meiosis I es la ms importante de las dos, y comienza con una profase larga, complicada y claramente distinta de la profase de la mitosis. Esta profase de la meiosis I (llamada, por tanto, profase I) comienza con la condensacin de la cromatina que, no lo olvidemos, se haba replicado en la fase S precedente. Ambas cromtides estn ntimamente unidas formando un nico filamento, que se une por sus extremos a la membrana nuclear. Esta primera parte de la profase I se llama leptoteno. En la siguiente etapa, llamada cigoteno, los cromosomas homlogos se emparejan longitudinalmente con gran exactitud, de manera que las secuencias de cada uno de los dos homlogos quedan perfectamente alineadas. La unin entre los cromosomas de cada par se hace progresivamente ms fuerte, dando lugar a un fenmeno que se conoce como sinapsis. La sinapsis se mantiene gracias a la formacin del complejo sinaptonmico. La profase I contina con la siguiente etapa, paquiteno, en la que los cromosomas se condensan todava ms y cada par de homlogos apacece como un bivalente (una estructura formada por dos cromosomas) ttrada (por estar formada por cuatro cromtides). De todas formas, el evento ms importante de la etapa de paquiteno es el intercambio de material gentico entre cromosomas homlogos, a travs del proceso de recombinacin que estudiaremos ms adelante. En la siguiente etapa, la de diploteno, desaparece el complejo sinaptonmico y los cromosomas homlogos comienzan a separarse. Recordemos que hasta este momento la clula es diploide (2n) con contenido 4C de ADN, al tener dos cromtides por cromosoma. Durante la separacin de los cromosomas homlogos en diploteno, las dos cromtides de cada cromosoma permanecen todava -http://www.unav.es/asignatura/genmolhumbq/ 73 de 172

Gentica Molecular Humana (F.Ciencias)-

unidas entre s. Sin embargo, debido al intercambio de material gentico precedente, la separacin pone de manifiesto los puntos en los que se produjo un sobrecruzamiento, ya que esas regiones forman "puentes" que mantienen unidos a los dos homlogos de cada par e impiden la separacin total. Estos puntos se denominan quiasmas, y han de resolverse de algn modo para que la separacin de los cromosomas pueda completarse. Por tanto, la profase I termina con una etapa corta denominada diaquinesis, en la que la cromatina alcanza su grado mximo de condensacin y los cromosomas aparecen ms cortos y gruesos. Tras la profase I, los espermatocitos primarios entran ahora en metafase I, en la cual desaparece la membrana nuclear, se forma el huso y los microtbulos traccionan por los quinetocoros. Esto hace que los bivalentes, que llevan los cromosomas parcialmente separados (unidos nicamente por los quiasmas), se orienten en el ecuador de la clula. Debido a esta configuracin, los cromosomas homlogos se sitan en la placa metafsica con los centrmeros apuntando cada uno hacia uno de los polos de la clula. En la anafase I, la traccin de los microtbulos y la activacin del Complejo Promotor de la Anafase permiten la separacin total de cada cromosoma homlogo hacia uno de los polos, fenmeno llamado disyuncin. Finalmente, en la telofase I se han formado ya dos grupos de cromosomas en cada polo de la clula: cada uno de estos grupos consta de un nmero haploide (n) de cromosomas, cada uno de los cuales posee dos cromtides (contenido total de ADN igual a 2C). La meiosis I termina con la citoquinesis, la divisin fsica de las dos clulas hijas. Esta ltima fase es diferente en la lnea germinal masculina y femenina, porque as como las clulas hijas del espermatocito primario son iguales, en el caso de la lnea femenina una de las dos clulas hijas se lleva casi todo el citoplasma mientras que la otra es mucho menor. Por tanto, en la espermatognesis cada esperamatocito primario da lugar a dos espermatocitos secundarios, mientras en la oognesis cada oocito primario da lugar a un oocito secundario y a un corpsculo polar de primer orden. La segunda divisin meitica, meiosis II, es prcticamente igual a una mitosis. La nica diferencia estriba en que la clula que se divide es haploide, mientras que en el caso de la mitosis la clula es diploide. Por tanto, esta divisin celular va a separar las dos cromtides que componen cada cromosoma de un gametocito secundario, para generar gametos con un nmero haploide de cromosomas (n), cada uno de los cuales est formado por una sola cromtide (contenido total de ADN igual a C). Como decamos al principio, esto asegura que la fecundacin da lugar a un cigoto diploide (2n) con contenido de ADN igual a 2C, al recibir un complemento cromosmico de cada gameto. El modo en que se completa la meiosis es tambin diferente en ambos sexos. As como la espermatognesis discurre de un modo continuo desde que se alcanza la madurez sexual, la oognesis se detiene en profase I, de manera que un alto nmero de oocitos primarios permanecen en un estado prolongado de diploteno, llamado dictioteno. Estos oocitos slo proseguirn su maduracin al llegar la madurez sexual, cuando con cada ciclo menstrual un oocito culmina la meiosis I y completa tambin la meiosis II para dar un oocito secundario (vulo) y un segundo corpsculo polar. Figura 5.4 Video en el que se muestran esquemticamente las distintas fases de la meiosis. Es importante fijarse en un hecho distintivo de la anafase de la meiosis I, que no comparten ni la anafase de la meiosis II ni la anafase de la mitosis. Este hecho consiste en que los cromosomas homlogos se separan pero, al mismo tiempo, las dos cromtides de cada cromosoma, por la accin de unas molculas llamadas shugoshinas, deben permanecer unidas por los centrmeros. Esto se consigue porque las cohesinas centromricas no son degradadas por las separasas. Las shugoshinas se unen especficamente a los centrmeros y, por su asociacin con una fosfatasa, impiden la fosforilacin de las cohesinas a ese nivel, lo cual a su vez impide que las cohesinas sean degradadas por las separasas. Despus, en la meiosis II, la ausencia de shugoshinas permite una segunda ola de activacin de separasas que finalmente llevar a la separacin completa de las dos cromtides de cada cromosoma homlogo.

5.2. El fenmeno de no disyuncin meitica y sus implicaciones

-http://www.unav.es/asignatura/genmolhumbq/

74 de 172

Gentica Molecular Humana (F.Ciencias)-

Se estima que hasta un 5% de todas las concepciones humanas son aneuploides, aunque la gran mayora de stas terminan en abortos espontneos y no se reconocen clnicamente. La incidencia de aneuploidas vara segn el periodo gestacional:
Frecuencia de anomalas cromosmicas en:

Mortinatos (20 a 40 semanas de gestacin): 4%

Abortos espontneos detectables clnicamente (7 a 8 semanas de gestacin): 35%

Abortos espontneos NO detectables clnicamente (antes de 7 semanas): 20%

Tambin se ha visto que hasta un 20% de los oocitos humanos son portadores de aneuploidas, mientras que slo el 1-2% de los espermatozoides tienen alteraciones en el nmero de cromosomas. De estos datos se concluye que la segregacin de cromosomas durante la meiosis —especialmente durante la oognesis— es un proceso que no se lleva a cabo de modo totalmente eficaz en humanos. La segregacin cromosmica incorrecta origina alteraciones cromosmicas en el embrin, pero la mayora de estos embarazos se pierden porque esas alteraciones son letales en estados iniciales del desarrollo embrionario. Como se recordar, los cromosomas homlogos y las cromtides hermanas se separan en cada una de las dos divisiones que tienen lugar durante la meiosis. Las aneuploidas se producen por una separacin incorrecta (no-disyuncin) en una de las dos divisiones meiticas, aunque lo ms frecuente es la falta de disyuncin en meiosis I por la presencia de un sobrecruzamiento mal posicionado. Se ha visto en el Captulo 2 que una gonia diploide da lugar a cuatro gametos haploides ya que, tras la replicacin del ADN en el gonocito primario, la primera divisin meitica genera clulas con un solo cromosoma de cada par (aunque cada uno tiene todava dos cromtides hermanas); la segunda divisin meitica separa las cromtides hermanas a cada uno de los gametos. Teniendo este esquema en mente, es fcil comprender que los efectos de una no-disyuncin en la meiosis I sern distintos a los efectos de una no-disyuncin en la meiosis II. Si la no-disyuncin ha tenido lugar en meiosis I, se producirn 2 gametos nulismicos (sin ninguna copia de ese cromosoma) y dos gametos dismicos (con dos copias), los cuales llevarn una copia de cada cromosoma homlogo presente en la clula progenitora (es decir, son heterodismicos). Por el contrario, si la no-disyuncin sucede en la meiosis II, tendremos 2 gametos normales, un gameto nulismico y un gameto dismico con dos copias idnticas (isodismico). El video de la Figura 5.5 muestra los tipos de gametos resultantes de la no-disyuncin en meiosis I o en meiosis II. Como se ha mencionado ms arriba, est comprobado que la mayora de los errores de disyuncin tienen lugar durante la oognesis, especialmente en meiosis I. Esto se ha relacionado con el hecho de que la gametognesis femenina ―al contrario de lo que sucede en la espermatognesis― experimenta una meiosis I especialmente larga (comienza en el periodo fetal y culmina individualmente con cada ovulacin, entre 15 y 45 aos despus). Este hecho podra aumentar la sensibilidad del oocito a sufrir no-disyunciones. Estudios recientes muestran que la aparicin de no-disyunciones tiene que ver con la posicin de los quiasmas durante la recombinacin, de modo que los quiasmas que estn demasiado cerca de los centrmeros o de los telmeros favorecen los errores en la separacin de los cromosomas homlogos. Actualmente se piensa que la maquinaria que procesa los quiasmas va perdiendo eficacia con los aos, por lo que los oocitos con quiasmas en localizaciones "subptimas" originan errores de disyuncin con mayor facilidad en oocitos "viejos" que en oocitos "jvenes". Esto encaja bien con el hecho de que las aneuploidas son ms frecuentes al aumentar la edad materna. -http://www.unav.es/asignatura/genmolhumbq/ 75 de 172

Gentica Molecular Humana (F.Ciencias)-

Respecto a las causas moleculares de la no-disyuncin, es razonable pensar que la des-regulacin de los procesos de recombinacin, cohesin y separacin de cromtides sea responsable, en buena medida, de la segregacin deficiente de los cromosomas a las clulas hijas. Como se recordar, durante la meiosis I cada pareja de quinetocoros hermanos es arrastrada hacia un extremo del huso acromtico; si ha habido un sobrecruzamiento, la cohesin debida a la presencia de los quiasmas se opondr a la fuerza de los microtbulos que tienden a separar los dos cromosomas homlogos. Por tanto, es fundamental que la cohesin entre cromosomas homlogos se mantenga a nivel de los centrmeros mientras los homlogos se separan, para que las cromtides se mantengan unidas hasta la llegada de la meiosis II. En este sentido, la alteracin de cualquiera de las protenas que regulan estos procesos (estudiadas en el apartado anterior) puede provocar la aparicin de aneuploidas. Por ejemplo, los ratones con mutaciones en SMC1beta (una cohesina especfica de la meiosis) han puesto de manifiesto que dicha cohesina se une a los quiasmas y que es causa de aneuploidas relacionadas con la edad, ya que la frecuencia de no-disyunciones va aumentando con la edad en las hembras. Esto se ha visto corroborado por la deteccin de alteraciones de estos mecanismos en clulas tumorales, caracterizadas por la presencia de aneuploidas muy marcadas. Se ha visto, por ejemplo, que en tumores colorrectales aneuploides hay mutaciones en el gen BUB1, que codifica una protena del complejo proteico que regula la cohesin en los quinetocoros. Adems, se ha demostrado que una securina denominada PTTG (pituitary tumour transforming gene) tiene propiedades de oncogn: muestra niveles altos de expresin en tumores pituitarios y es un factor de mal pronstico en cncer de colon, ya que los niveles de PTTG correlacionan con la invasividad del tumor. Todo esto pone de manifiesto que los genes implicados en los mecanismos que regulan la segregacin de cromtides hermanas durante la divisin celular son muy importantes para mantener una correcta segregacin cromosmica durante la mitosis, y es lgico pensar que lo mismo se puede aplicar a la meiosis.

5.3. Mutaciones debidas a repeticiones dispersas


Las repeticiones dispersas del genoma humano, estudiadas con detalle en el Tema 1, suelen dar lugar a reordenamientos cromosmicos por un mecanismo denominado "sobrecruzamiento desigual" (en ingls, UnEqual Cross-over, UEC). Habitualmente, la recombinacin homloga durante la meiosis tiene como finalidad producir nuevas combinaciones de alelos, ya que se recombinan cromosomas homlogos. El sobrecruzamiento desigual consiste en la recombinacin entre secuencias homlogas pero no-allicas (es decir, que tienen homologa en su secuencia pero estn en localizaciones genmicas diferentes). Tal es el caso, por ejemplo, de los genes parlogos (miembros de una familia gnica, con alto grado de homologa entre ellos) o de las repeticiones dispersas tipo SINE LINE (cuyos miembros tienen una secuencia muy homloga). Un buen ejemplo que ilustra los efectos del sobrecruzamiento desigual es el mecanismo que origina varones con cariotipo XX mujeres XY (con disgenesia gonadal y disfuncin ovrica). Hasta un 30% de los casos de estas patologas son debidos a un sobrecruzamiento desigual entre los genes PRKX y PRKY, genes homlogos que estn cerca de la Regin Pseudoautosmica de los cromosomas sexuales X e Y, respectivamente. Fruto de esta recombinacin desigual, el gen SRY —gen que determina el sexo masculino, situado en el cromosoma Y— acompaa al fragmento telomrico del cromosoma Y que se mueve al cromosoma X, dando como resultado un cromosoma X que contiene SRY y un cromosoma Y sin SRY. Esto origina individuos que fenotpicamente son varones a pesar de ser XX, as como mujeres con cariotipo XY.

-http://www.unav.es/asignatura/genmolhumbq/

76 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 5.6 Esquema de la translocacin entre los cromosomas X e Y por un sobrecruzamiento desigual entre secuencias muy homlogas (aunque no idnticas) en ambos cromosomas. Adems, los fenmenos de recombinacin desigual son causa frecuente de duplicaciones o deleciones cuando tienen lugar entre repeticiones no allicas de gran tamao con un alto grado de homologa, como son las duplicaciones segmentarias del genoma humano, que ya mencionamos en el captulo 4. Habitualmente, esto sucede entre secuencias que pertenecen a cromosomas distintos, pero en ocasiones la recombinacin o sobrecruzamiento desigual tambin puede tener lugar entre cromtides hermanas. En este caso se produce el llamado "intercambio desigual entre cromatides hermanas" (en ingls, UnEqual Sister Chromatid Exchange, abreviado UESCE), que da lugar a alteraciones en ambas cromtides de un mismo cromosoma: habitualmente se produce una duplicacin en una cromtide y una delecin en la otra. El video de la Figura 5.7 muestra el proceso de recombinacin desigual entre secuencias homlogas no-allicas, tanto en el caso de que estas secuencias estn en cromosomas distintos como si estn en cromtides hermanas. Otro posible efecto de la recombinacin desigual entre secuencias homlogas es la conversin gnica entre ellas. Como hemos visto en un captulo anterior, durante los procesos de recombinacin homloga se forma un heterodplex que puede dar lugar a un proceso de conversin gnica, de modo que una de las secuencias se copia a la otra. Habitualmente, la conversin gnica tiene lugar entre alelos de un mismo gen; sin embargo, la recombinacin desigual entre dos secuencias no allicas (un gen y un pseudogen no funcional, por ejemplo) puede provocar la conversin de la secuencia del gen en la secuencia del pseudogen, lo que equivaldra a anular la funcin del gen. Un ejemplo clsico de este mecanismo es la enfermedad llamada "Hiperplasia Suprarrenal Congnita" (dficit del enzima 21-hidroxilasa). Alrededor del 75% de los casos de esta enfermedad estn provocados por un fenmeno de conversin gnica entre el gen CYP21B (que codifica el enzima) y el pseudogen CYP21A (que no es funcional). De modo general, hasta ahora hemos considerado elementos repetidos que estn en la misma orientacin (en sentido 5 -> 3) cuando se recombinan ilegtimamente. Puede suceder, sin embargo, que las repeticiones

-http://www.unav.es/asignatura/genmolhumbq/

77 de 172

Gentica Molecular Humana (F.Ciencias)-

estn invertidas (en orientaciones contrarias una respecto de la otra). En este caso, la recombinacin entre elementos repetidos dar lugar a la inversin de la regin que queda entre las repeticiones, como se ver en un ejemplo del siguiente apartado.

5.4. Desrdenes genmicos


En conjunto, los procesos de recombinacin desigual dan lugar a un grupo de enfermedades humanas que se conocen con el nombre de Desrdenes Genmicos, y que incluyen ­-entre otros― los Sndromes por microdelecin: enfermedades debidas a pequeas deleciones (no visibles en un cariotipo convencional) que elimina uno o varios genes. Los Desrdenes Genmicos se pueden agrupar como sigue: A. Debidos a deleciones: Los pacientes con Ictiosis ligada al X tienen una delecin del gen de la sulfatasa esteroidea en Xp22, por reordenacin entre elementos repetidos (separados por 1,9 Mb) que flanquean este gen. La delecin que produce el Sndrome de Williams-Beuren est originada por recombinacin entre duplicaciones segmentarias que flanquean el gen de la elastina en 7q11, repeticiones que estn separadas por 1,6 Mb. La causa ms frecuente de los Sndromes de Prader-Willi y de Angelman es una delecin de 4 Mb por recombinacin desigual entre duplicaciones en 15q11-q13. La reordenacin ms frecuente en el cromosoma 22 es la delecin de unas 3 Mb en 22q11.2, que se encuentra en el 90% de pacientes con Sndrome de Di George con Sndrome Cardio-velo-facial. Un caso especial de delecin de secuencias repetidas es la contraccin de una serie de repeticiones en tndem cerca del telmero 4q, que origina una enfermedad llamada distrofia facio-escpulo-humeral. Recientemente se ha comprendido el mecanismo molecular de dicha enfermedad. En la regin subtelomrica 4q existe un elemento llamado D4Z4 que est repetido en tndem. Los cromosomas normales tienen entre 10 y 100 repeticiones del elemento. Los cromosomas contrados, que tienen entre 1 y 10 repeticiones, pueden dar lugar a la enfermedad si adems ese cromosoma tiene un satlite beta a continuacin de la repeticin (lo que se conoce como variante 4qA); los cromosomas 4q sin el satlite beta no dan lugar a la enfermedad, aunque tengan slo 1-10 repeticiones D4Z4 (variante 4qB). Esta contraccin desencadena la enfermedad mediante la des-regulacin de genes cercanos a esa regin, especialmente por sobre-expresin del gen DUX1.

-http://www.unav.es/asignatura/genmolhumbq/

78 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 5.8 Se esquematizan las regiones delecionadas en algunos desrdenes genomicos. En todos los casos se muestran los elementos repetidos (duplicaciones segmentarias, habitualmente) que interaccionan enprocesos de recombinacin desigual y provocan la delecin de la regin que queda entre ellos. Dichos elementos aparecen como rectngulos verdes. -http://www.unav.es/asignatura/genmolhumbq/ 79 de 172

Gentica Molecular Humana (F.Ciencias)-

B. Debidos a duplicaciones/deleciones: Los reordenamientos entre dos elementos llamados CMT1A-REP, localizados en 17p12, dan lugar a individuos con la duplicacin o con la delecin de la regin comprendida entre ambas repeticiones. Esta regin incluye el gen PMP22, que codifica una protena de la mielina, y la duplicacin o delecin de esta regin origina enfermedades dos distintas (Charcot-Marie-Tooth o Neuropata Hereditaria con Parlisis por Presin, respectivamente). Las repeticiones CMT1A-REP tienen un tamao de unas 30 kb y estn a una distancia de 1,5 Mb, de forma que el sobrecruzamiento desigual entre ellas origina la delecin o duplicacin de esa regin. Estas repeticiones tienen una regin pequea (1,7 kb) que es casi totalmente idntica en todas ellas, y tambin contienen un elemento similar al transposn "mariner". Parece que la presencia de ste ltimo puede favorecer la accin de una transposasa a este nivel y facilitar la recombinacin desigual entre cromtides. Algo similar sucede en el Sndrome de Smith-Magenis, debido a una delecin de unas 5 Mb en 17p11.2. Los individuos con duplicacin de esa regin tienen un fenotipo distinto.

Figura 5.9 Regiones del cromosoma 17 que se alteran en el Sindrome de Charcot-Marie-Tooth y en el Sndrome de Smith-Magenis. En ambos casos, las alteraciones estn provocadas por recombinacin desigual entre elementos homlogos (rectngulos verdes). En la parte izquierda se esquematizan las alteraciones que dan lugar al Sndrome deCharcot-Marie-Tooth (CMT) y a la Neuropata Hereditaria con Parlisis por Presin (HNPP), por duplicacin o delecin dela misma regin genmica, respectivamente. C. Debidos a Inversiones: Cuando la recombinacin desigual se produce entre repeticiones invertidas que estn en la misma cromtide, a menudo se originan inversiones cromosmicas. Este fenmeno es especialmente frecuente como causa de Hemofilia A, una coagulopata debida al dficit de Factor VIII de la coagulacin. El gen que codifica el Factor VIII tiene un elemento llamado int22h que est repetido dos veces antes del exn 1 y otra vez (en la orientacin contraria) en el intrn 22 (entre los exones 22 y 23). Un sobrecruzamiento desigual entre uno de los elementos que estn antes del exn 1 con el elemento del intrn 22 dar lugar a una inversin de toda la regin comprendida entre ambas repeticiones, rompiendo totalmente la capacidad codificante del gen. Este mecanismo es responsable de un 45% de los casos de Hemofilia A en humanos, lo que subraya la gran importancia de este tipo de fenmenos en patologa humana. -http://www.unav.es/asignatura/genmolhumbq/ 80 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 5.10 La mutacin ms frecuente en el gen del Factor VIII de la coagulacin (causa de la hemofilia A) esuna inversin que incluye toda la parte inicial del gen hasta el exn 22. Dicha inversin se debe a la recombinacin desigual entre unos elementos repetidos en orientacin invertida, tal y como se muestra en este video. Otro ejemplo de inversin es la que da lugar a la distrofia muscular de Emery-Dreifuss, por recombinacin entre repeticiones invertidas en Xq28. Este caso es especialmente interesante porque se ha detectado la inversin de esta regin en un tercio de las mujeres normales. D. Otras anomalas: La recombinacin desigual entre elementos duplicados del genoma humano origina tambin otros procesos. Por ejemplo, la duplicacin invertida del cromosoma 15 es el cromosoma marcador que se encuentra con mayor frecuencia en recin nacidos. Tambin se encuentra un cromosoma marcador dicntrico debido a una duplicacin invertida en 22q en pacientes con Sndrome de Ojo de Gato, por reordenamientos entre duplicaciones segmentarias. Estas mismas duplicaciones estn implicadas en la translocacin t(11;22)(q23;q11), que es la nica translocacin recproca equilibrada recurrente en humanos. Finalmente, se ha observado que hasta un 1% de los casos de retraso mental espordico pueden ser debidos a una microdelecin en 17q21.31, por recombinacin entre duplicaciones segmentarias flanqueantes. En esta regin, se ha visto que el 80% de los europeos llevan cromosomas tipo H1, formados por dos parejas de duplicaciones segmentarias (en la figura, una pareja aparece en tonos rojos y otra pareja en tonos verdes). El 20% de la poblacin lleva cromosomas tipo H2, originados por una inversin por recombinacin entre las duplicaciones verdes. Como resultado de esa inversin, las duplicaciones rojas queden dispuestas en orientacin directa (es decir, apuntando en el mismo sentido) en los cromosomas con la forma H2; por el contrario, en los cromosomas con la configuracin H1 estn en orientacin invertida. Precisamente, un fenmeno de recombinacin desigual entre repeticiones directas, como las duplicaciones segmentarias rojas del cromosoma con la configuracin H2, puede originar la delecin de toda la regin comprendida entre las repeticiones. En la parte inferior de la figura se muestra el resultado de dicho proceso, con un cromosoma que lleva una delecin de 600-750 kb. Esta microdelecin elimina los genes que estn en esa regin, y se ha visto que hasta el 1% de los casos de retraso mental espordico son portadores de esta microdelecin.

-http://www.unav.es/asignatura/genmolhumbq/

81 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 5.11 muestra la estructura de 17q21.31 y la microdelecin que se origina en esta regin.

Tema 6. La mutacin como causa de enfermedad


6.1. Caractersticas generales de las mutaciones. 6.2. Potencial patognico de las mutaciones en el ADN codificante. 6.3. El proceso de ayuste y su regulacin. 6.4. Potencial patognico de mutaciones que afectan a las secuencias consenso de ayuste.

6.1. Caractersticas generales de las mutaciones


Ya se ha mencionado que el genoma humano est sujeto a variacin gentica y que esta capacidad de introducir modificaciones genticas heredables supone una ventaja para la especie, al permitir la adaptacin a condiciones ambientales cambiantes. Sin embargo, la existencia de una tasa mutacional basal tiene el peligro de introducir cambios genticos deletreos en un individuo o una familia concreta, provocando enfermedades heredables. Por tanto, de modo general podemos decir que la presencia de mutaciones en una poblacin est sujeta al juego entre la tasa mutacional basal (la velocidad a la que se producen nuevas mutaciones en la lnea germinal de esa poblacin) y la presin selectiva frente a cada una de las mutaciones, de forma que aquellas mutaciones que sean muy agresivas no se extendern al resto de la poblacin tan rpidamente como mutaciones con efectos fenotpicos ms leves. Por ejemplo, ya hemos visto en otro captulo que las aberraciones cromosmicas (trisomas, monosomas, etc) son raras pero casi siempre patognicas, mientras que los polimorfismos de secuencia —variantes allicas que no causan ninguna enfermedad— son mucho ms frecuentes. En cierto modo, lo mismo sucede con los distintos tipos de mutaciones: aquellas que provocan alteraciones graves del producto proteico suelen ser menos frecuentes por estar sometidas a una fuerte presin selectiva en su contra.

-http://www.unav.es/asignatura/genmolhumbq/

82 de 172

Gentica Molecular Humana (F.Ciencias)-

Antes de estudiar todos los posibles tipos de mutaciones, ser de gran utilidad recordar la estructura y procesamiento de un gen tpico, porque esto nos ayudar a comprender cmo se clasifican y sus efectos. Como apreciamos en la siguiente figura, en un gen podemos distinguir (en el ADN genmico) una regin 5' no-traducida (desde el inicio de la transcripcin hasta el ATG que seala el inicio de la traduccin), exones separados por intrones (que contienen las secuencias consenso de ayuste GT-AG), el codn de terminacin (TAA en la figura) y la regin 3' no traducida, que incluye la seal de poliadenilacin (AATAAA). La transcripcin del gen y la posterior maduracin del transcrito primario dan como resultado el ARNm maduro, que despus es traducido en la protena correspondiente. En general, los distintos tipos de mutaciones que se encuentran en un gen pueden ser tanto mutaciones simples (deleciones, inserciones o substituciones que afectan a un nucletido o a unas pocas bases) o reordenamientos grandes (deleciones parciales o reordenamientos que dan lugar a duplicaciones o deleciones del gen).

Figura 6.1 Se muestra un gen con cuatro exones (rectngulos coloreados), el ARNm generado por el proceso de ayuste y la protena final (lnea naranja). La flecha horizontal de la parte superior representa una posible delecin del gen, que incluya varios exones. Las flechas azules representan posibles mutaciones de las regiones codificantes, que afectan al codn de inicio (ATG), al codn de parada (TAA), a la seal de poliadenilacin (AATAAA) o a codones codificantes de aminocidos. De estos ltimos, se presenta una mutacin que crea un codn de parada (STOP) y otra mutacin que provoca un cambio de aminocido en la protena (Leucina por Prolina en posicin 166). Las flechas de color naranja representanmutaciones quedestruyen alguna de las secuencias de ayuste (GT/AG). Las substituciones simples de un nucletido por otro se denominan transiciones transversiones, segn provoquen el cambio de purina por purina pirimidina por pirimidina (transiciones), o el cambio de una purina por pirimidina viceversa (transversiones). En el esquema adjunto, las transiciones se representan por flechas moradas y las transversiones por flechas verdes. Como puede apreciarse en la imagen, las transversiones deberan ser el doble de frecuentes que las transiciones (8 posibles transversiones por 4 posibles transiciones). En cambio, al analizar las mutaciones presentes en enfermedades humanas encontramos que las transiciones -http://www.unav.es/asignatura/genmolhumbq/ 83 de 172

Gentica Molecular Humana (F.Ciencias)-

son ms frecuentes. Esto es debido a que —en general— las transiciones provocan una alteracin menos severa del producto proteico, por lo que la presin selectiva contra ellas es menor. Adems, el dinucletido CpG suele estar metilado en la citosina, y la des-aminacin espontnea de una metil-citosina da lugar a una transicin del tipo C->T. Como este cambio tiene lugar con relativa frecuencia en el genoma de mamferos, esto tambin contribuye a la alta frecuencia de transiciones que se observa en estas especies. Nomenclatura general de mutaciones: Llegados a este punto, interesa estudiar la nomenclatura recomendada para describir los distintos tipos de mutaciones que hemos visto hasta ahora. Aunque las recomendaciones van cambiando con el paso de los aos, a continuacin se resumen las reglas principales: 1. Describir la mutacin utilizando la numeracin de nucletidos de la secuencia genmica (g.) o del ADNc (c.) o la numeracin de la secuencia de aminocidos, segn los casos. Siempre la Adenina del codn de iniciacin ATG se toma como posicin +1, por lo que el nucletido anterior es la posicin -1. 2. Describir las substituciones de nucletidos segn el esquema general: Intervalo + secuencia antigua + tipo de cambio + secuencia nueva. Utilizar una flecha el signo ">" para las sustituciones, "del" para deleciones, "ins" para inserciones. Los rangos se indican con guin bajo (de subrayado) para evitar confusiones con el signo negativo. Las combinaciones de dos o ms alteraciones se separan con el signo + y se incluyen en corchetes. Algunos ejemplos: g.12T>A (Cambio de timina por adenina en el nucletido 12 de la secuencia genmica) [6T>C + 13_14del] (Dos cambios en el mismo alelo) [6T>C] + [13_14del] (Dos mutaciones, una en cada alelo) 14-15insT (Insercin de timina entre dos nucletidos) 112_117delAGGTCAinsTG (Insercin de TG en vez de AGGTCA, tambin se podra indicar como 112_117>TG) 3. En repeticiones en tandem, se asigna por convenio el cambio a la ltima repeticin (la que ocupa una poscin ms 3): por ejemplo, la delecin de un dinucletido TG en la secuencia ACTGTGTGCC (siendo A el nucletido 1991) se describira como 1997_1998del ( 1997_1998delTG). 4. La variabilidad en microsatlites se designa contando la posicin de la primera repeticin. Si la secuencia del ejemplo anterior fuese polimrfica, se designara 1993(TG)3-22, para indicar que en posicin 1993 comienza un dinucletido TG que se encuentra en la poblacin repetido entre 3 y 22 veces. 5. En intrones (cuando no se conoce la secuencia genmica), se seala la posicin dentro del intrn con referencia al exn ms cercano (utilizando nmeros positivos comenzando con la G de la secuencia de ayuste GT donante, y nmeros negativos contando desde la G de la secuencia AG aceptora). Se puede usar tanto la sigla IVS como sinnimo de intrn, como la numeracin correspondiente a la secuencia del ADNc. Ejemplos: IVS3+1G>T c.621+1G>T (621 es el ltimo nucletido del exn 3, luego +1 es la G de la secuencia donante GT del intrn 3)

-http://www.unav.es/asignatura/genmolhumbq/

84 de 172

Gentica Molecular Humana (F.Ciencias)-

IVS6-5C>A c.1781-5C>A (1781 es el primer nucletido del exn 7, luego -1 es la G de la secuencia aceptora AG del intrn 6, -2 es la A, y as sucesivamente hasta llegar a -5). 6. Para describir substituciones de aminocidos, se indica el nmero del aminocido y el cambio operado, considerando la metionina iniciadora como +1. Se sigue el esquema general aminocido cambiado + rango + aminocido nuevo. Se recomienda usar el cdigo de aminocidos de una letra, aunque tambin puede utilizarse el de tres letras, empleando la letra X para indicar un codn de parada. Ejemplos: R117H (la Arg en posicin 117 pasa a His) G542X (la Gly 542 se convierte en codn de parada) T97del (delecin de la treonina 97) T97_C102del (delecin de los aminocidos 97 a 102) T97_W98insLK (insercin de leucina y lisina entre las posiciones 97 y 98, ocupadas por treonina y triptfano)

6.2. Potencial patognico de las mutaciones en el ADN codificante


Cuando las substituciones simples tienen lugar en ADN codificante, sus efectos pueden ser de varios tipos: a) substituciones silenciosas (llamadas sinnimas, sin cambio de sentido): no cambian ningn aminocido en la protena codificada, debido a que la mutacin cambia un codn por otro codn sinnimo. Como son biolgicamente neutras, no estn sujetas a seleccin y por tanto son relativamente frecuentes en ADN codificante. Habitualmente se producen por cambios en la tercera base de un triplete, ya que es habitualmente este nucletido el que vara entre codones sinnimos. b) substituciones no-sinnimas (el cambio de nucletidos origina un cambio en la capacidad codificante del ARNm). Segn el cambio introducido, podemos distinguir: Mutaciones con cambio de sentido (mis-sense, en ingls), cuando el cambio de nucletidos provoca un cambio de aminocidos. Se habla de cambio conservativo cuando ambos aminocidos (el original y el nuevo) pertenecen al mismo grupo bioqumico, o no conservativo cuando pertenecen a grupo distintos. Estos ltimos son —en general— ms graves, puesto que alteran la estructura de la protena en mayor grado. Tambin son importantes los cambios que afectan a Cistenas y Prolinas, que son aminocidos muy importantes en el mantenimiento de la estructura terciaria de la protena. Mutaciones sin sentido (non-sense), cuando un codn que codifica un aminocido se convierte en un codn de parada (UAA, UAG UGA). Estas mutaciones dan lugar a protenas truncadas en la regin C-terminal, adems de disminuir la estabilidad del ARNm. En general son muy graves, por lo que son menos frecuentes que las mutaciones con cambio de sentido. Figura 6.2 El video muestra distintos tipos de mutaciones puntuales y su efecto sobre la protena: mutaciones sinnimas, con cambio de sentido sin sentido. Mutaciones con ganancia de sentido, cuando la mutacin transforma un codn de parada en un codn codificante. Son casos infrecuentes, entre los que destaca el de una variante de la hemoglobina denominada "Hemoglobina Constant Spring" (variante allica HBA20001), originada por el -http://www.unav.es/asignatura/genmolhumbq/ 85 de 172

Gentica Molecular Humana (F.Ciencias)-

cambio de UAA (codn de parada) a CAA. Esto tiene como resultado la adicin de 30 aminocidos a la secuencia de la hemoglobina alfa-2, que se hace ms inestable y provoca una enfermedad de la sangre llamada alfa-talasemia debida a la presencia de cadenas anormales dehemoglobina.

Figura 6.3 Esquema de la mutacin que origina la hemoglobina Constant Spring. c) Deleciones e inserciones de uno de unos pocos nucletidos pueden introducir o eliminar aminocidos sin cambiar la pauta de lectura, siempre que se trate de inserciones o deleciones de tres nucletidos ( mltiplos de tres). Cuando se insertan o delecionan nucletidos en un nmero que no es mltiplo de tres, se produce un frameshift (desplazamiento del marco de lectura) con un cambio muy importante en la estructura proteica. Para comprender las mutaciones con cambio del marco de lectura, es importante repasar este concepto. Figura 6.4 Este video explica el concepto de marco de lectura y de cmo se puede buscar un marco de lectura abierto en una secuencia de ADN, dependiendo de la posicin de codones de iniciacin y parada. Este otro video muestra cmo las inserciones o deleciones de uno dos nucletidos pueden desplazar el marco de lectura (frameshift) y alterar gravemente la secuencia proteica. Al igual que las mutaciones sin sentido, las mutaciones con cambio del marco de lectura provocan alteraciones importantes del producto proteico y, por tanto, estn sometidas a mayor presin selectiva, por lo que suelen ser menos frecuentes en ADN codificante que las mutaciones sinnimas. Adems, los cambios del marco de lectura suelen introducir codones de parada prematuros, por lo que habitualmente se producen tambin protenas truncadas que ven muy comprometida su funcionalidad. Otro proceso por el que puede perderse o recuperarse el marco de lectura es la edicin del ARN, La edicin del ARN es un mecanismo de modificacin co- post-transcripcional mediante el cual se cambian uno varios nucletidos de un ARNm, con el resultado de que la secuencia del mensajero es ligeramente distinta de la que vena codificada en la secuencia genmica. Este fenmeno, bastante comn en otras especies pero ms raro en humanos, permite generar diversos ARNm a partir de un mismo gen. Por ejemplo, la apolipoprotena ApoB48, que se produce en el intestino para entrar a formar parte de los quilomicrones, se origina por efecto de un cambio CU en el que una citosina se des-amina para dar lugar a un uracilo; este cambio crea un codn de parada en el ARNm de la ApoB100 y se produce una protena ms corta de lo que sera esperado segn la secuencia inicial. Un mecanismo similar est implicado en el origen de -http://www.unav.es/asignatura/genmolhumbq/ 86 de 172

Gentica Molecular Humana (F.Ciencias)-

enfermedades como la neurofibromatosis tipo I el tumor de Wilms, debidas a alteraciones en los genes NF1 y WT1, respectivamente. El video de la Figura 6.5 muestra esquemticamente la edicin del ARN que da lugar a la ApoB48. Una variedad curiosa de edicin del ARN surge en unas ratas que tienen una delecin de un solo nucletido en el gen de la vasopresina, haciendo que desarrollen hipertensin arterial. Estas ratas mejoran espontneamente al envejecer, debido a un proceso de edicin del ARNm mediante el cual se pierde el dinucletido GA en un motivo GAGAG de ese mismo gen. La delecin de estos dos nucletidos, aadida a la delecin de un nucletido que ya tenan, hace que se recupere el marco de lectura original y que se produzcan mayores niveles de vasopresina funcional. Recientemente, se ha visto que algo similar sucede en humanos en el caso de la enfermedad de Alzheimer: un motivo GAGAGA en el gen de la protena precursora de amiloide-β (β-APP) sufre una edicin parecida, con delecin de dos bases en el ARNm y la interrupcin del marco de lectura que produce una protena truncada y es causa de algunos casos de enfermedad de Alzheimer.

6.3. El proceso de ayuste y su regulacin


Los ARN mensajeros de eucariotas tienen una caracterstica muy importante: no son codificantes en su totalidad, desde el principio al fin, sino que las regiones codificantes estn interrumpidas por otras regiones no-codificantes. Es decir, no todos los nucletidos del ARN mensajero son ledos para sintetizar protenas, sino que existen regiones codificantes llamada exones que alternan con otras regiones no-codificantes llamadas intrones. Debido a esta configuracin, el siguiente paso en la maduracin de un ARNm consiste en eliminar los intrones y pegar los exones para formar un mensajero maduro que pueda ser traducido desde el principio hasta el fin y sin interrupciones. Este proceso de corte y eliminacin de intrones con empalme de los exones se denomina en ingls splicing, trmino natico que corresponde al castellano ayuste: la unin de dos cabos por sus chicotes. El ayuste es un proceso complejo, porque hay que tener en cuenta que el nmero de exones e intrones de un gen puede ser muy grande, y requiere una maquinaria proteica bastante sofisticada. En primer lugar, es importante definir el punto exacto que delimita la frontera entre un exn y un intrn, para que la maquinaria encargada del ayuste pueda actuar. Estos puntos vienen determinados por secuencias especficas del ARNm. Por ejemplo, los intrones de eucariotas comienzan en la prctica totalidad de los casos por los nucletidos Guanina-Uracilo (secuencia 5' de ayuste, GU) y terminan en Adenina-Guanina (secuencia 3' de ayuste, AG). Estas secuencias se localizan dentro de unas regiones ms amplias que cumplen un consenso de secuencia concreto. Por ejemplo, la secuencia de ayuste 5' est formada por el consenso 5'-AG|GU[A/G]AGU-3' (la barra vertical indica el sitio de corte donde termina el exn precedente y comienza el intrn; [A/G] significa que en esa posicin puede haber una A una G). Por su parte, la secuencia de ayuste 3' se ajusta al consenso 5'-NCAG|G-3' (siendo N cualquier nucletido). Adems, es importante la presencia de una adenina 20-40 nucletidos por arriba (es decir, en direccin 5') de la secuencia 3' de ayuste. Esta adenina se encuentra en la secuencia consenso 5'-CU[A/G]A[C/U]-3' (es la adenina en negrita y subrayada), es decir, precedida por A G y seguida por C U, y se denomina punto de ramificacin (en ingls, "branch point"). Entre el punto de ramificacin y la secuencia de ayuste 3' se encuentra un tracto rico en pirimidinas, es decir, formado casi exclusivamente por timinas citosinas. Finalmente, se han identificado pequeos elementos de secuencia en exones en intrones que actan como potenciadores silenciadores del proceso de ayuste, y que tienen gran importancia en la modulacin y regulacin fina del proceso.

-http://www.unav.es/asignatura/genmolhumbq/

87 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 6.6 El video muestra esquemticamente las distintas secuencias que son importantes en el proceso de ayuste. En la imagen se ven los complejos proteicos que se unen a estas secuencias. El proceso de ayuste implica varias reacciones enzimticas que realizan cortes endonucleolticos y unin de extremos libres. El primer paso del proceso es el corte en el sitio de ayuste 5', justo por delante de la guanina del GU inicial del intrn. Este extremo libre se une a la Adenina del punto de ramificacin mediante un enlace fosfo-dister 5'-2', creando una estructura en lazo. Finalmente, se corta la secuencia de ayuste 3' por detrs de la guanina del sitio AG, lo que resulta en la liberacin del intrn; los extremos libres de los dos exones flanqueantes son entonces religados. Las molculas que llevan a cabo estos procesos son unas ribonucleoprotenas nucleares pequeas (RNPnp), formadas por un ARN nuclear pequeo (ARNnp) y varias subunidades proteicas, dando lugar a un complejo que en su conjunto se denomina ayusteosoma ( spliceosome en ingls). Aunque hay muchos tipos de ARNnp que participan en el proceso de ayuste, los principales se llaman U1, U2, U2AF, U4, U5 y U6, que dan su nombre a las correspondientes RNPnp. La RNPnp U1 se une a la secuencia de ayuste 5' por complementariedad de bases, ya que uno de sus extremos es complementario a la secuencia consenso que rodea a la GU del extremo 5' del intrn, y U2AF se une a la secuencia de ayuste 3 (complejo E). Cuando U2 se une al punto de ramificacin se forma el complejo A, que facilita la formacin del lazo. A continuacin, un complejo formado por la RNPnp U4/6 y la RNPnp U5 se une a la regin de ayuste 3' y estabiliza la formacin de todo el complejo ( complejo B). Diversos cambios en la configuracin (con la salida de U4), llevan a cabo el corte 3' ( complejo C) y la unin de los exones. Este enlace nos lleva a Virtual Cell Animation Collection, un sitio educativo creado por la National Science Foundation y el U.S. Department of Education. Haciendo click aqu, accedemos directamente al video que muestra el proceso de ayuste (splicing). Como se puede suponer, en un genoma eucariota hay miles de sitios que cumplen el consenso de secuencia necesario para funcionar como sitios de ayuste, pero sin embargo slo unos pocos participan en el procesamiento normal de los genes. De hecho, uno de los temas ms interesantes en la regulacin del ayuste es cmo se definen exactamente los lmites de exones e intrones, de modo que la maquinaria de ayuste los reconozca como tales. Aunque todava quedan incgnitas por resolver, hoy en da sabemos que hay otros elementos que cooperan para estabilizar el ayusteosoma y permitir que se lleve a cabo el proceso. Entre estos elementos destacan la protenas SR (llamadas as por ser ricas en los aminocidos Serina y Arginina), que interaccionan con distintos componentes del ayusteosoma y se unen a secuencias moduladoras como son los potenciadores exnicos del ayuste. Del mismo modo, algunos tipos de ribonucleoprotenas nucleares heterogneas (hnRNP) se unen a silenciadores del ayuste, tanto exnicos como intrnicos. Todas estas interacciones tienen lugar antes de la unin de las RNPnp U4/6 y RNPnp U5, y son muy importantes para definir los lmites de exones e intrones. Figura 6.7 Este video explica la forma en que se definen los exones e intrones, dependiendo de las secuencias presentes en el ARN.

-http://www.unav.es/asignatura/genmolhumbq/

88 de 172

Gentica Molecular Humana (F.Ciencias)-

Una ventaja del mecanismo de ayuste es que hace posible que distintas clulas utilicen distintas combinaciones de exones para dar lugar a mensajeros ligeramente diferentes, que se traducen en protenas distintas. Este fenmeno por el cual un mismo gen puede sufrir distintos patrones de ayuste dependiendo del tejido del tipo celular en que se lleva a cabo, se denomina ayuste alternativo. Es muy comn en mamferos, y aade un nivel ms de complejidad en la funcin del genoma. Por ejemplo, se estima que al menos el 90% de los ARN mensajeros humanos estn sujetos a ayuste alternativo, sobre todo entre distintos tejidos de una misma persona (la variacin inter-individual es mucho menor). Los principales tipos de ayuste alternativo son exones saltados (skipped), retencin de intrones, exones mutuamente excluyentes, sitios de ayuste (5 3) alternativos, primer exn ltimos exn alternativo, y regiones 3-UTR alternativas por utilizacin de seales de poliadenilacin diferentes (el evento ms frecuente de todos). Esto da una idea de la importancia de este proceso, y la necesidad de comprender bien cmo se regula. Figura 6.8 Este video ilustra el fenmeno del ayuste alternativo. Un primer nivel de regulacin del ayuste alternativo se da en los motivos de secuencia presentes en exones e intrones. Adems de los motivos generales que ya hemos visto, existen muchos otros que se unen a otros factores reguladores proteicos. Es precisamente la combinacin de stos, junto con las distancias a las que se encuentran de los lmites intrn/exn, lo que lleva a que distintos tejidos o tipos celulares generen diferentes transcritos alternativos. La idea es que los factores de ayuste que se unen a esos motivos de secuencia estn presentes en unos tejidos pero no en otros, y eso permite leer esas seales de distinta manera. Este codigo de ayuste ha sido revelado recientemente para el ratn, y constituye la primera pieza de la piedra Rosetta que permitir predecir los patrones de ayuste alternativo. Pero recientemente se ha observado que la generacin de transcritos alternativos a partir de un mismo gen no slo depende de este primer nivel de regulacin, sino que hay otros factores genmicos que tambin intervienen. En primer lugar, est la velocidad de transcripcin de un gen: si la polimerasa se enlentece durante la elongacin, esto crea una situacin que favorece la inclusin de exones dbiles en el transcrito maduro. En segundo lugar, se ha visto que la cromatina tambin interviene en el ayuste alternativo, principalmente de dos formas. Por un lado, la posicin de los nucleosomas parece ser importante, ya que constituyen una barrera al paso de la polimerasa y por tanto pueden enlentecer la elongacin de la transcripcin. Adems, algunas modificaciones epigenticas como la trimetilacin de la lisina 36 de la histona H3 (H3K36me3) pueden funcionar como sitios de unin a factores de ayuste, y favorecer as la inclusin de exones dbiles. En tercer lugar, en los ltimos aos se ha visto que la accin de los ARN no codificantes (ncRNAs) pueden ser importantes en la regulacin del ayuste alternativo. Por ejemplo, algunos microARN regulan la expresin de factores de ayuste durante el desarrollo embrionario, como sucede con el mir-124 y el factor de unin al tracto de polipirimidinas. Otra forma de actuacin est ejemplificada en el lncRNA MALAT-1, que acta secuestrando protenas SR en el ncleo: la ausencia de MALAT-1 hace que haya ms protenas SR disponibles y que cambien los patrones de ayuste de varios genes.

6.4. Potencial patognico de mutaciones que afectan a las secuencias consenso de


Las mutaciones simples que tienen lugar en ADN no codificante intragnico (es decir, en intrones y regiones no traducidas) son silenciosas, excepto cuando afectan a las secuencias de consenso para ayuste (splicing) de los extremos 5' y 3' de los intrones. En este caso, podemos encontrar: Mutaciones que destruyen una de las secuencias de consenso. Si esto tiene lugar en ausencia de secuencias de ayuste crpticas (escondidas) y en intrones pequeos, habitualmente se lee todo el intrn, que queda as incluido en el ARNm. Esto hace que se aadan aminocidos a la protena, aunque tambin es posible que se introduzca un cambio en el marco de lectura y se altere toda la secuencia de aminocidos a partir de ese punto.

-http://www.unav.es/asignatura/genmolhumbq/

89 de 172

Gentica Molecular Humana (F.Ciencias)-

Si la mutacin que destruye la secuencia de ayuste tiene lugar en presencia de una secuencia de ayuste crptica en ese mismo intrn, el exn vecino ser ms largo; por el contrario, si la secuencia crptica est en el exn cercano a la mutacin, dicho exn ser ms corto. En ocasiones, las mutaciones que destruyen una de las secuencias consenso de ayuste hacen que se "salte" el exn adyacente (lo que en ingls se denomina skipping del exn), dando lugar a una protena que ha perdido un cierto nmero de aminocidos, aunque tambin es posible que produzca un cambio en el marco de lectura. El exn afectado ser el 5 o el 3 a la mutacin, segn se destruya el GT el AG de un intrn, respectivamente. Figura 6.9 El video muestra el efecto de distintas mutaciones que afectan a las secuencias consenso de ayuste. Un caso especial de este tipo de mutaciones es la transicin AG en posicin +3 de la secuencia donante de ayuste, una alteracin que est asociada con desarrollo de enfermedades en −al menos− 8 genes humanos. Como se recordar, la secuencia donante de ayuste (la del extremo 5' del intrn) es complementaria a la secuencia del ARN nuclear pequeo U1 (U1snRNA), cuya presencia es necesaria para que se lleve a cabo el proceso de ayuste. Los dos primeros nucletidos del intrn son siempre GT (complementarios a CA en el U1snRNA), y el tercer nucletido de la secuencia de ayuste suele ser adenina (complementaria al uracilo correspondiente en el U1snRNA). En cambio, las posiciones +4 a +6 no siempre son perfectamente complementarias. De hecho, la adenina en posicin +3 dota de cierta flexibilidad a los nucletidos de las posiciones +4 a +6, que pueden ser discordantes de la secuencia del U1snRNA y an as son capaces de funcionar correctamente como secuencia donante de ayuste. En cambio, si alguna de las posiciones +4 a +6 no son complementarias a la secuencia del U1snRNA, una mutacin en la posicin +3 tiene como resultado la falta de funcionalidad de esta secuencia de ayuste, con lo que se salta el exon precedente. Figura 6.10 Este video ilustra el ejemplo del gen COLQ, en el que una mutacin en la posicin +3 del intrn 16 tiene el mismo efecto que una mutacin que destruya la secuencia de ayuste 5'. Esto se explica porque la secuencia que rodea a la secuencia de ayuste 5' no es totalmente complementaria a la secuencia del ARN nuclear pequeo U1, por lo que la mutacin de la posicin +3 (que habitualmente no debera tener ningn efecto) hace que la unin del ARNnp U1 sea ineficaz y el proceso de ayuste no se lleve a cabo correctamente. Finalmente, existen mutaciones que, sin afectar directamente a secuencias consenso de ayuste, pueden activar un lugar crptico en un intrn y producir un exn ms grande y posiblemente un cambio en el marco de lectura. Figura 6.11 Este video muestra el proceso por el que una mutacin puede activar una secuencia de ayuste crptica en un intrn. Si esta secuencia es ms fuerte que la secuencia de ayuste original, se puede alterar el patrn normal de ayuste de esa regin. Como regla general, podemos afirmar que las mutaciones que afectan al mecanismo de ayuste son ms raras que las substituciones, aunque algunos genes tienen una estructura exnica que les otorga una tendencia especial a sufrir mutaciones de este tipo: se trata, habitualmente, de genes con muchos intrones y con exones pequeos, como sucede con los genes que codifican cadenas del colgeno (COL7A1, por ejemplo, tiene 118 exones), o bien genes con muchos sitios crpticos de ayuste (como es el caso del gen de la beta-globina). Como hemos visto en el apartado anterior, los ESE ESS (potenciadores o silenciadores exnicos del ayuste) y los ISE ISS (potenciadores o silenciadores intrnicos) constituyen secuencias de unin para protenas SR (las que se unen a los potenciadores de ayuste) o para protenas hnRNP (las que se unen a los silenciadores). Por tanto, estas protenas regulan el proceso de ayuste y determinan si un exn va a estar -http://www.unav.es/asignatura/genmolhumbq/ 90 de 172

Gentica Molecular Humana (F.Ciencias)-

presente en el transcrito final o, por el contrario, se va a saltar. Es importante tener en cuenta que algunas mutaciones en estos motivos, aunque sean silenciosas porque no cambian el aminocido (o porque se localizan en intrones), pueden sin embargo tener efectos sobre el mensajero, haciendo que un exn se pierda y alterando as la estructura de la protena o rompiendo el marco de lectura. De hecho, en algunos genes (ATM, NF1) se ha estimado que el 50% de las mutaciones que originan enfermedades afectan a regiones que cambian el patrn de ayuste sin cambiar la secuencia de aminocidos. Un buen ejemplo para ilustrar esta situacin es una enfermedad llamada Atrofia Muscular Espinal, debida a deleciones y/o mutaciones del gen SMN1. Cerca de este gen hay un gen parlogo casi idntico llamado SMN2, en el que un cambio C -> T modifica el patrn de ayuste (sin cambiar la secuencia de aminocidos) y hace que el exn 7 se pierda, dando lugar a una protena truncada no funcional. De todas formas, un pequeo porcentaje de las molculas siguen un ayuste normal (con el exn 7) y producen protena normal a partir del gen SMN2. Por tanto, aunque no haya ninguna copia funcional de SMN1 (como sucede en enfermos con atrofia muscular espinal) la enfermedad tiene distinta gravedad segn el nmero de copias de SMN2 presentes. De hecho, se piensa que esta circunstancia podra utilizarse para corregir la sintomatologa de los pacientes con Atrofia Muscular Espinal. Figura 6.12 El video ilustra los distintos patrones de ayuste de los genes SMN1 y SMN2, debidos a un cambio nucleotdico que destruye un potenciador exnico de ayuste en el exn 7 del gen SMN2. Otro tipo de mutaciones del ADN no-codificante intragnico son las que afectan a la seal de poli-adenilacin, que se encuentra en la regin no traducida 3 de un gen. Estas mutaciones pueden originar protenas defectuosas llevar a la degradacin del ARNm. Por ejemplo, una mutacin en la seal de poliadenilacin del gen que codifica la hemoglobina alfa-2 (alelo HBA2 0024) convierte la seal AATAAA en AATGAA, con lo que el ARNm no se poli-adenila correctamente, el ARNm se degrada y se desarrolla la enfermedad alfa-talasemia por ausencia de cadenas de hemoglobina alfa-2. Finalmente, las substituciones en el ADN no codificante intergnico, sern silenciosas excepto cuando afectan a elementos reguladores de la expresin gnica (promotores, potenciadores, etc) o a otros elementos necesarios para el correcto procesamiento del ARNm. Por ejemplo, mutaciones que afectan a la Regin de Control del Locus de las alfa- y beta-globinas (un conjunto de potenciadores situados unas 40−60 kb en direccin 5' de los genes respectivos) provocan unas enfemedades denominadas talasemias, debidas a la sntesis deficiente de globinas.

Tema 7. Potencial patognico de repeticiones cortas


7.1. Mutaciones en secuencias que estn repetidas en tndem. 7.2. Enfermades causadas por expansin de trinucletidos: 7.2.1 Neuropatas por expansiones CAG. 7.2.2. Enfermedades por expansin de otros trinucletidos. 7.3. Otras enfermedades por expansin de secuencias repetidas cortas.

7.1. Mutaciones en secuencias que estn repetidas en tndem


Un tipo de mutacin que afecta con frecuencia a las repeticiones cortas en tndem de tipo microsatlite es la expansin o contraccin de la repeticin. Como ya vimos al estudiar los mecanismos de reparacin, este fenmeno se produce habitualmente por un mecanismo llamado "desemparejamiento por deslizamiento de cadenas" (slipped-strand mispairing en ingls). Dicho proceso puede tener lugar durante la replicacin del ADN que contiene la repeticin, si se da un deslizamiento hacia atrs hacia delante de la cadena que est siendo sintetizada sobre la cadena molde. -http://www.unav.es/asignatura/genmolhumbq/ 91 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 7.1 A continuacin se muestra un video que explica el mecanismo de deslizamiento de una cadena durante la replicacin de una regin que contiene una repeticin de microsatlites. Dicho deslizamiento tiene como resultado la expansin de uno de los alelos de esa repeticin. Este deslizamiento origina un bucle en una de las cadenas, cuyo resultado final es que la nueva cadena de ADN tendr una repeticin ms o una repeticin menos que la cadena original, segn el desplazamiento haya sido hacia atrs o hacia delante, respectivamente. Este mecanismo explica los polimorfismos de longitud de los microsatlites, que ya hemos estudiado al hablar de estos marcadores. Lo importante ahora es darse cuenta de que si la contraccin tiene lugar en la regin codificante de un gen que contiene repeticiones en tndem cortas, el resultado ser la aparicin de deleciones de aminocidos (si se delecionan 3 nucletidos) cambios en el marco de lectura (si se delecionan repeticiones de 1, 2, 4 5 nucletidos). Se presentan a continuacin dos ejemplos de lo dicho:

En el cuadro superior observamos, arriba, la secuencia nativa del gen CFTR (mutado en una enfermedad llamada "Fibrosis Qustica del pncreas"), que contiene una repeticin en tndem del nucletido Timina (hay 5 Timinas seguidas en los codones 142 y 143). La delecin de una T por el fenmeno que acabamos de describir provocar un cambio del marco de lectura, como se aprecia en la fila de debajo. En el cuadro inferior vemos un ejemplo de delecin de un trinucletido TTG en la regin codificante del Factor IX de la coagulacin: la secuencia nativa (fila superior) contiene dos repeticiones TTG en tndem, de modo que la delecin de una de ellas provoca la delecin de un aminocido sin alterar el marco de lectura (fila inferior). Lgicamente, lo mismo que se ha ilustrado aqu con deleciones puede decirse de las inserciones. Los microsatlites del tipo trinucleotdico pueden adems sufrir expansiones mayores, dando lugar a un grupo de enfermedades conocidas como "enfermedades por expansin de trinucletidos". Dada su importancia en patologa humana, las estudiamos con ms detalle en el siguiente apartado.

7.2. Enfermades causadas por expansin de trinucletidos


Hay un grupo de enfermedades debidas a la expansin de repeticiones de trinucletidos, que tienen una serie de rasgos en comn. El descubrimiento del mecanismo por el que se desencadenan estas enfermedades ayud a comprender un fenmeno clnico que se conoca con el nombre de anticipacin: la aparicin de la enfermedad a una edad cada vez ms temprana y de forma ms severa en sucesivas generaciones de una misma familia. Como veremos, la presencia de secuencias trinucleotdicas inestables, que aumentan de tamao en cada generacin, permiti explicar este fenmeno. Las enfermedades por expansin de trinucletidos pueden agruparse en dos grandes categoras: (1) enfermedades debidas a expansiones cortas (40 a 70 repeticiones) de un trinucletido CAG localizado en la regin codificante de un gen; y (2) enfermedades debidas a expansiones mayores (desde 50 hasta miles de -http://www.unav.es/asignatura/genmolhumbq/ 92 de 172

Gentica Molecular Humana (F.Ciencias)-

repeticiones) de trinucletidos situados en regiones no codificantes. Como ya hemos comentado, el mecanismo de expansin ms probable es el desemparejamiento por deslizamiento de cadenas, aunque las grandes expansiones son ms fciles de explicar mediante un mecanismo de reparacin por recombinacin homloga. De todas formas, todava no se explica bien por qu en estas secuencias se dan muchas ms expansiones que contracciones.

7.2.1 Neuropatas por expansiones CAG


Las enfermedades del primer grupo tienen como resultado la expansin de un tracto de poliglutaminas en la protena codificada por el gen respectivo, y constituyen un grupo de enfermedades neurodegenerativas de gran importancia. La siguiente tabla resume las caractersticas ms importantes de cada una de estas enfermedades:

Repeticin

Normal

Enfermedad

Localizacin

Efecto

Huntington

CAG

11-34

40-121

ORF (HD)

Ganancia

Smith (Haw-River) (DRPLA)

CAG

7-34

49-88

ORF (DRPLA)

Ganancia

Kennedy (SBMA)

CAG

9-36

38-62

ORF (AR)

Ganancia

SCA1

CAG

6-39

40-82

ORF (SCA1)

Ganancia

SCA2

CAG

15-24

32-200

ORF (SCA2)

Ganancia

SCA3/MJD

CAG

13-36

61-84

ORF (SCA3)

Ganancia

SCA6

CAG

4-20

20-29

ORF (CACNA1A)

Ganancia

SCA7

CAG

4-35

37-306

ORF (SCA7)

Ganancia

SCA17

CAG

25-42

47-63

ORF (TBP)

Ganancia

-http://www.unav.es/asignatura/genmolhumbq/

93 de 172

Gentica Molecular Humana (F.Ciencias)-

SCA12

CAG

7-45

55-78

5UTR? (PPP2R2B)

El modo de expansin, en general, es gradual. As, la inestabilidad va aumentando con el tamao de la expansin: por debajo de las 40 repeticiones, la frecuencia de expansiones es baja, pero al llegar a un rango de 40 a 100 repeticiones la inestabilidad ya es prcticamente del 100%. Adems, se observan diferencias si la transmisin es materna (las repeticiones de la descendencia se distribuyen normalmente alrededor de la media materna) o paterna (produce repeticiones con una media ms alta que la paterna, con tendencia a aumentar en funcin de la edad paterna). El mecanismo patognico en estas enfermedades se ha atribuido a la expansin de un tracto de glutaminas en las protenas implicadas, lo que llevara al mal plegamiento y/o formacin de agregados proteicos que alteran la funcin neuronal. En general, se piensa que la expansin produce una ganancia de funcin, ya que mutaciones y deleciones que anulan la funcin de esos mismos genes no dan lugar a la misma enfermedad que la expansin del trinucletido. Por ejemplo, la expansin de un trinucletido CAG en el gen del receptor de andrgenos da lugar a la Atrofia Muscular Espino-Bulbar (SBMA, Enfermedad de Kennedy), mientras que las mutaciones de ese mismo gen provocan el Sndrome de feminizacin testicular. Por otro lado, la longitud de la expansiones correlaciona con la gravedad de la sintomatologa, lo que hace pensar que estas enfermedades se deben a una ganancia de funcin con un efecto txico que aumenta con el nmero de glutaminas que lleva la protena, probablemente a partir de un umbral de 35-40 residuos. Tambin se ha demostrado que, para provocar degeneracin neuronal, las protenas mutantes deben entrar en el ncleo, ya que cuando se envan al citoplasma no se observa efecto patognico alguno. Esto sugiere que pueden interaccionar con factores de transcripcin ricos en glutamina y alterar la transcripcin de genes necesarios para la supervivencia neuronal. De hecho, se ha demostrado que la acetilasa de histonas CBP (co-activador transcripcional del que hemos hablado en el captulo 2) es secuestrada en presencia de protenas con tractos de poli-glutaminas, con lo que se altera la expresin de genes necesarios para la supervivencia neuronal. Dado que las protenas con tractos de poli-glutaminas pueden unirse entre s por interacciones protena-protena, otros factores de transcripcin con poli-glutaminas tambin podran quedar secuestrados en estas enfermedades. De hecho, se ha visto recientemente que el factor de transcripcin TAF II130, un componente de TFIID, interacciona con el factor de transcripcin Sp1 a travs de regiones con tractos de glutaminas; la presencia de una protena con tractos largos de poliglutaminas podra impedir esta interaccin y cancelar la expresin de los genes regulados por estos factores. En el caso concreto de la huntingtina (la protena codificada por el gen mutado en la Enfermedad de Hutington) se ha demostrado, por ejemplo, que la presencia de huntingtina con expansin de glutaminas impide la expresin del gen que codifica el receptor D2 de la dopamina, mediante un mecanismo como el descrito. Figura 7.2 Este video ilustra uno de los posibles mecanismos por los que la expansin de un tracto de glutaminas en la huntingtina afecta la expresin de genes importantes para el funcionamiento neuronal.

7.2.2. Enfermedades por expansin de otros trinucletidos


El segundo grupo de enfermedades por expansin de trinucletidos incluye enfermedades ms heterogneas, aunque tambin se caracterizan por afectar al sistema nervioso. Sus caractersticas se resumen en la siguiente tabla, donde se muestra que la inestabilidad propia del rango de 40-100 repeticiones (llamado en estos casos "premutacin") no causa la enfermedad, sino que favorece la aparicin de una expansin explosiva, llegando de golpe hasta varios miles de repeticiones ("mutacin completa"), que ya causa la enfermedad. Esta "explosividad" no se produce cuando la repeticin est interrumpida por un triplete distinto; por ejemplo, algunos alelos del gen FRAXA tienen repeticiones del trinucletido CGG que estn interrumpidas por el trinucletido AGG cada 10 repeticiones CGG, y esos alelos no sufren expansin.

-http://www.unav.es/asignatura/genmolhumbq/

94 de 172

Gentica Molecular Humana (F.Ciencias)-

Repeticin

Normal

Pre-mutacin

Mutacin

Localizacin

Distrofia Miotnica (DM1)

CTG

5-37

50-80?

80-2000+

3 UTR (DMPK)

X Frgil (FRAXA)

CGG

6-52

59-230

230-2000+

5 UTR (FMRP)

X Frgil (FRAXE)

GCC

4-35

(35-61)?

200-900

5' UTR (FMR2)

Ataxia Friedreich

GAA

6-32

(35-40)?

200-1700

Intron (FRDA)

SCA8

CTG

16-37

107-127

3 UTR (SCA8)

En estas enfermedades, como regla general, el efecto patognico es resultado de la prdida de funcin de la protena de la alteracin en la funcin del ARNm, ya que las expansiones estn en regiones no codificantes. En este grupo destacan: Sndrome del X frgil. Es la causa ms frecuente de retraso mental ligado al cromosoma X (un 40% de los casos) y la causa heredada ms frecuente de retraso mental aislado. Inicialmente, esta enfermedad se detectaba por el cariotipo, que muestra una rotura en Xq27.3 cuando las clulas se cultivan en presencia de metrotexato en ausencia de folato. Posteriormente, la identificacin en 1991 del gen FMR1 revel la existencia de un gen de 38 kb y 17 exones, con un trinucletido CGG en una isla CpG de la region promotora del gen. Fue el primer ejemplo de una enfermedad originada por la expansin de una repeticin de trinucletidos. Las mutaciones de la regin codificante son raras, pero tambin provocan la enfermedad cuando implican disminucin de la protena FMRP, lo que sugiere que la expansin del trinucletido provoca una prdida de funcin. La protena codificada por el gen es citoplasmtica y se expresa en cerebro (por igual en todos los tipos de neuronas, aunque no se expresa en clulas no-neuronales), as como en testculo (en clulas germinales pero no en clulas de Sertoli de Leydig). La protena posee dominios de unin al ARN y dominios de unin a otras protenas, y se ha comprobado que se une a su propio mensajero, a un 4% de todos los ARNm de cerebro fetal, y tambin a la subunidad 60S de los ribosomas. Podra por tanto entrar en el ncleo, capturar mensajeros y exportarlos al citoplasma como parte de la maquinaria traduccional, especficamente aquellos mensajeros que son cruciales para el desarrollo de las dendritas y para la funcin sinptica en las neuronas. Curiosamente, se ha visto que la mayor parte de los ARNm que se unen a FMRP forman estructuras secundarias llamadas cuartetos-G, debido a la presencia de Guaninas espaciadas regularmente; mediante estas estructuras, los mensajeros se unen al dominio RGG (arginina-glicina-glicina) de la FMRP. La expansin de un trinucletido en el gen FMR1 provoca la disminucin de la protena FMRP y la desregulacin del metabolismo de los ARN mensajeros que habitualmente se unen a ella. Tambin se ha visto que, en Drosophila, la protena FMRP forma parte del complejo de silenciamiento por interferencia de ARN (RISC), lo que abre la posibilidad de que dicho mecanismo tambin est implicado en la fisiopatologa del Sndrome del X

-http://www.unav.es/asignatura/genmolhumbq/

95 de 172

Gentica Molecular Humana (F.Ciencias)-

frgil. Aunque el hallazgo del gen y la elucidacin de la estructura de la protena todava no han permitido desvelar completamente el mecanismo fisiopatolgico de la enfermedad, s han servido para explicar el modo inusual de transmisin de la misma, que se ver en un captulo posterior.

Figura 7.3 Estructura de los "cuartetos G", presentes en los ARN mensajeros que se unen a la protena codificada por el gen FMR1 (mutado en el Sndrome del X Frgil). La figura de la izquierda muestra los cuartetos formados por cuatro guaninas espaciadas regularmente ycoordinadas por iones potasio; a la derecha se muestra un cuarteto visto desde arriba. La distrofia miotnica se puede producir por alteraciones en 2 loci. La forma ms frecuente es la DM1, debida a la expansin del trinucletido CTG en la regin no traducida-3 del gen DMPK, que codifica una proten-quinasa. Como la enfermedad se hereda de forma autosmica dominante, parece que el complejo fenotipo de esta enfermedad (que incluye miotona muscular, cataratas y arritmias cardacas) debe ser el resultado de la alteracin de algn proceso celular importante. De hecho, se ha comprobado que la expansin del trinucletido CTG en el gen DMPK inhibe la expresin de un gen vecino llamado SIX5. Se ha visto que los ratones knock-out para el gen DMPK tienen una arritmia similar a la que se ve en los pacientes con distrofia miotnica, mientras que los ratones knock-out para SIX5 sufren unas cataratas que recuerdan a las de los enfermos. La miopata se produce por la presencia de ARN con largas expansiones de repeticiones CUG (esto se ha comprobado tambin en ratones). La hiptesis ms aceptada es que la expansin da lugar a un ARN que es capaz de unirse a varias protenas de unin a ARN que regulan el fenmeno del ayuste, alterando su funcin. Como resultado, se altera el ayuste correcto de otros ARNm, y de hecho se han identificado ms de 10 genes cuyo ayuste y funcin est alterada en esta enfermedad. Estos genes incluyen un canal de cloro, el propio SIX5, el gen de la troponina T, el receptor de la insulina, genes con funciones neuronales, etc. En conjunto, se piensa que la sintomatologa de la enfermedad es el resultado conjunto de la desregulacin de todos estos genes por la presencia de un ARNm con la expansin de CTG. La ataxia de Friedreich, enfermedad autosmica recesiva que no muestra el fenmeno clnico de anticipacin, parece tambin un buen ejemplo de prdida de funcin debida a la expansin, ya que los sujetos enfermos deben ser homocigotos (tener ambos alelos con la expansin) o heterocigotos compuestos (un alelo con expansin y el otro alelo con una mutacin puntual). El trinucletido GAA -http://www.unav.es/asignatura/genmolhumbq/ 96 de 172

Gentica Molecular Humana (F.Ciencias)-

que sufre la expansin est localizado en una secuencia Alu del primer intrn del gen FRDA, que codifica una protena llamada frataxina. Los alelos normales estn interrumpidos por la secuencia (GAGGAA)5-9 y no tienen ms de 32 repeticiones GAA. La expansin impide la transcripcin del gen, al formar un intrn muy largo con estructuras de triple hlice en el ADN genmico. Los niveles bajos de frataxina alteran la funcin mitocondrial, ya que esta protena es importante en la homeostasis del hierro en la mitocondria, y dan lugar a una disminucin en la produccin de energa y a la formacin de especies reactivas de oxgeno.

7.3. Otras enfermedades por expansin de secuencias repetidas cortas


Recientemente se ha descrito un tipo de epilepsia mioclnica progresiva de herencia autosmica recesiva, debida a la expansin de una secuencia de 12 nucletidos (CCCCGCCCCGCG). Este es el primer ejemplo de enfermedad por expansin de un minisatlite, que en este caso se encuentra en la regin promotora del gen CSTB (cistatina B, un inhibidor de proteasas). Los alelos normales tienen hasta 3 repeticiones, mientras que sujetos con "premutacin" tienen 12 a 17 repeticiones y los enfermos tienen entre 30 y 75 copias (en total, un tamao de 360-900 nucletidos). No todos los pacientes con esta enfermedad muestran la expansin de esta repeticin, sino que alrededor de un 14% de los enfermos tienen mutaciones inactivantes en la regin codificante del gen. Por ello, se postula que el mecanismo patognico de la expansin debe ser por prdida de funcin, y de hecho se ha visto que la expansin conduce a la disminucin de los niveles de ARNm (probablemente debido a la desorganizacin del promotor del gen CSTB). Tambin se ha identificado un nuevo tipo de ataxia espino-cerebelosa (SCA10), de herencia autosmica dominante. La causa de esta enfermedad reside en la expansin de un pentanucletido (ATTCT) en el intrn 9 del gen SCA10. Los individuos normales tienen 10 a 22 repeticiones, mientras que los sujetos con esta enfermedad tienen alelos entre 500 y 4500 repeticiones. Posteriormente a este hallazgo, se identific la primera enfermedad debida a la expansin de un tetranucletido: la Distrofia Miotnica tipo 2. Los individuos normales tienen menos de 26 repeticiones CCTG en el intrn 1 del gen ZNF9, mientras que las expansiones en pacientes van desde 75 a 11.000 repeticiones.

Tema 8. Efectos fenotpicos de las mutaciones


8.1. Ganancia y Prdida de funcin de un gen. 8.2. Fenotipos recesivos y prdida de funcin. 8.3. Fenotipos dominantes por ganancia de funcin. 8.4. Haploinsuficiencia y efecto dominante-negativo. 8.5. Alteraciones de la impronta genmica.

8.1. Ganancia y Prdida de funcin de un gen


Cuando un gen est mutado por cualquiera de los mecanismos que hemos visto en el captulo anterior, pueden suceder fundamentalmente dos cosas: (a) que esa mutacin se silenciosa, no tenga ningn efecto pernicioso ni provoque ningn fenotipo anmalo; (b) que esa mutacin provoque la aparicin de un fenotipo aberrante que conduzca al desarrollo de una enfermedad. En este segundo caso, que es el que nos ocupa en esta asignatura, es importante darse cuenta de que la alteracin de un gen puede provocar un fenotipo anormal mediante dos mecanismos, fundamentalmente: la prdida de funcin la ganancia de funcin. La prdida de funcin de un gen equivale a su ausencia total, ya que el gen no codifica la protena respectiva. En general, esto da lugar a fenotipos que se heredan de manera recesiva, ya que es necesario que estn mutados los dos alelos para que se manifieste el fenotipo. Sin embargo, en aquellos casos en los que hay un efecto de dosis gnica, en los que se producen fenotipos dominantes por un fenmeno llamado -http://www.unav.es/asignatura/genmolhumbq/ 97 de 172

Gentica Molecular Humana (F.Ciencias)-

haploinsuficiencia, la prdida de funcin genera fenotipos de herencia dominante. En el caso de las mutaciones que provocan una ganancia de funcin, los fenotipos resultantes son generalmente de herencia dominante, porque la mutacin facilita que el gen escape a los mecanismos que regulan su expresin, o bien crea una nueva funcin que tiene un efecto dominante negativo. Como regla general, podemos decir que cuando las mutaciones puntuales en un gen producen el mismo fenotipo que las deleciones de todo el gen, lo ms probable es que esas mutaciones provoquen una prdida de funcin; en cambio, las mutaciones que operan a travs de una ganancia de funcin suelen provocar fenotipos distintos a los que genera la delecin o disrupcin de ese gen. A continuacin veremos un poco ms a fondo cada una de estas dos situaciones.

8.2. Fenotipos recesivos y prdida de funcin


Un gen puede perder su funcin de varias maneras: Mutaciones en el propio gen: cualquier tipo de mutacin que interrumpa la capacidad codificante del gen har que se pierda su funcin. Como hemos visto en el captulo precedente, puede tratarse de mutaciones puntuales, deleciones o inserciones que interrumpen el marco de lectura, as como alteraciones de las secuencias de ayuste (splicing). Tambin podemos incluir aquellas mutaciones que no afectan a la secuencia del transcrito (ARNm) sino a su estabilidad, de forma que el mensajero se degrada rpidamente y no llega a traducirse en la protena correspondiente. Mutaciones que afectan a los elementos que regulan la expresin gnica. Un gen puede dejar de expresarse por mutaciones que afectan al promotor, bien por mutaciones que alteran las secuencias de unin a factores de transcripcin o bien provocando su metilacin. Otro mecanismo que disminuye la expresin gnica es el que se conoce como efectos de posicin, es decir, una reordenacin cromosmica que mueve un gen de su posicin original a otra regin del genoma que est silenciada (una regin de heterocromatina, por ejemplo). En ocasiones, esto hace que el gen deje de expresarse. Hay varios ejemplos de enfermedades humanas producidas por este mecanismo, como la Aniridia (por alteraciones del gen PAX6) o la Displasia Campomlica (alteraciones del gen SOX9), enfermedades en las que muchas veces se observan translocaciones que no interrumpen directamente los genes respectivos, sino que los separan de su contexto genmico habitual y los colocan en una regin de cromatina silenciada.

8.3. Fenotipos dominantes por ganancia de funcin


Los mecanismos por los que las mutaciones pueden originar una ganancia de funcin que se manifieste en un fenotipo dominante son variados, pero podemos sealar tres: Una mutacin que altera la protena de forma que sta adquiere una nueva funcin. El mejor ejemplo es el alelo "Pittsburgh" de alfa-1 antitripsina, un enzima con actividad anti-elastasa. Habitualmente, los alelos mutantes de alfa-1 antitripsina producen una prdida de funcin, con la consiguiente disminucin de la actividad enzimtica y el desarrollo de una enfermedad denominada enfisema pulmonar. En cambio, el alelo "Pittsburgh" est debido a una mutacin que cambia la metionina en posicin 358 a una arginina (M358R). Esto hace que el enzima adquiera una actividad anti-trombina que antes no tena, dando lugar a un transtorno de la coagulacin en vez de provocar enfisema pulmonar. Las mutaciones con ganancia de funcin son muy frecuentes en cncer, siendo uno de los principales mecanismos de activacin de oncogenes. Por ejemplo, la fusin de los genes BCR y ABL, en pacientes con leucemia mieloide crnica, es el resultado de una translocacin (9;22) en la que el gen ABL —una tirosina-quinasa— pierde su regin reguladora y queda fusionado con la regin 5' del gen BCR, que se expresa en clulas progenitoras hematopoyticas. Esto

-http://www.unav.es/asignatura/genmolhumbq/

98 de 172

Gentica Molecular Humana (F.Ciencias)-

provoca un nuevo gen de fusin que conduce a una expresin constitutiva y des-regulada de la tirosina-kinasa ABL en clulas de la serie mieloide en la mdula sea, lo que lleva el desarrollo de la leucemia.

Figura 8.1 estructura de los genes BCR y ABL, indicando los exones y las regiones en las que se agrupan los puntos de rotura que originan la translocacin (9;22) que aparece en individuos con leucemia mieloide crnica. La translocacin da lugar a un cromosoma derivado llamado Cromosoma Philadelphia (Ph1), que contiene la parte 5' del gen BCR fusionada con la regin 3' del gen ABL (el diagrama inferior de la figura). Dicho cromosoma produce protenas de fusin en las que la actividad tirosina-quinasa de ABL est desregulada, ya que se expresa a partir del promotor del gen BCR. La imagen est tomada de la pgina Web del International Inmunogenetics Information System.

-http://www.unav.es/asignatura/genmolhumbq/

99 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 8.2 Ensayo de FISH: en las clulas que llevan la translocacin hay una fusin de la seal verde (del gen BCR) y la seal roja (del gen ABL), dando como resultado una seal amarilla que indica la presencia de la translocacin. En ambos ncleos (con fluorescencia azul debida a la tincin con DAPI), aparece una seal verde (correspondiente al cromosoma 22 normal), una seal roja (correspondiente al cromosoma 9 normal) y una seal amarilla que corresponde al cromosoma Philadelphia con la translocacin. Ganancia de funcin tambin por la sobre-expresin de un gen, como resultado de duplicaciones o amplificaciones gnicas: un segmento genmico que se copia varias veces, de forma que los genes contenidos en ese segmento estarn en un nmero de copias muy superior al normal. Este tambin es un mecanismo frecuente en distintos tipos de cncer. Por ejemplo, el oncogn C-MYC est amplificado en varios tumores (sobre todo en neuroblastomas), C-ERBB2 en tumores de mama, etc. Aunque estas amplificaciones pueden verse en un cariotipo convencional como regiones de tincin homognea (Homogenous Staining Regions, HSR), o tambin como "Dobles Diminutos" (cromosomas minsculos), la tcnica de FISH las detecta con mucha mayor sensibilidad y permite adems contar el nmero de veces que el gen se ha amplificado.

-http://www.unav.es/asignatura/genmolhumbq/

100 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 8.3 Ensayo de FISH para la deteccin del nmero de copias del gen ERBB2 en cortes de parafina de tumores de mama. Como se ve en esta imagen, algunos tumores tienen una amplificacin del gen (muchas seales verdes por cada ncleo). Esto tiene importancia clnica, porque los tumores de mama con amplificacin de ERBB2 responden a un frmaco llamado Herceptin, mientras que los tumores de mama sin amplificacin de ERBB2 no responden a este frmaco.

8.4. Haploinsuficiencia y efecto dominante-negativo


Aunque la prdida de funcin de un gen suele desencadenar fenotipos recesivos, a veces se obtienen fenotipos con herencia dominante. Esto sucede en aquellos casos en los que la disminucin de la dosis gnica al 50% de lo que es habitual ya es capaz de provocar el fenotipo patolgico. Como es sabido, los genes autosmicos y el cromosoma X en mujeres estn en doble dosis gnica (hay dos alelos para cada gen), lo que hace que en circunstancias normales se produzcan unos niveles determinados de producto proteico. Habitualmente, la prdida de uno de los alelos no tiene ningn efecto patolgico: aunque slo se produce la mitad de protena de lo que sera normal, la cantidad producida por el alelo normal es suficiente para realizar la funcin respectiva. Sin embargo, en algunos casos la simple disminucin de la dosis gnica a la mitad, por la inactivacin de uno de los alelos mediante cualquier mecanismo mutacional de los que se han estudiado, provoca el desarrollo del fenotipo patolgico. Cuando esto sucede, se habla de enfermedades causadas por haploinsuficiencia o insuficiencia haploide, que lgicamente se heredan con un patrn dominante.

-http://www.unav.es/asignatura/genmolhumbq/

101 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 8.4 Haploinsuficiencia. En condiciones normales, una mutacin con prdida de funcin slo produce efectos fenotpicos cuando ambos alelos estn mutados (genotipo aa, umbral inferior). En ocasiones, cuando el umbral necesario para la correcta funcionalidad de la protena es ms alto (umbral superior en la grfica de la derecha), la mutacin de un solo alelo (Aa) es suficiente para provocar la enfermedad. Aunque hay bastantes enfermedades humanas causadas por haploinsuficiencia, un buen ejemplo es el Sndrome de Turner (45,X0), en el que basta la prdida de una copia de los genes implicados para que se desarrollen las caractersticas fenotpicas propias de esta enfermedad. En concreto, se ha visto que uno los genes responsables de esta enfermedad (SHOX) se localiza en la regin pseudoautosmica del cromosoma X y habitualmente escapa a la inactivacin del cromosoma X, por lo que en condiciones normales est presente en doble dosis gnica. Cuando se pierde una copia de este gen (por la ausencia de uno de los cromosomas X), la nica copia que queda no es suficiente para llevar a cabo correctamente su funcin y esto parece ser la causa de la talla corta de las mujeres con Sndrome de Turner. Otro modo por el que mutaciones con prdida de funcin pueden dar lugar a fenotipos de herencia dominante es el efecto dominante-negativo. Consiste en que ciertos tipos de genes codifican molculas que funcionan como dmeros o forman parte de complejos multimricos, de modo que basta la mutacin en uno de los alelos del gen para que las molculas proteicas mutantes desestabilicen totalmente los complejos de los que forman parte. Hay dos ejemplos tpicos que ilustran muy bien este fenmeno: A. Enfermedades que afectan a los genes que codifican alguna de las cadenas de colgeno. La molcula de pro-colgeno es un trmero formado por distintos tipos de cadenas, cuya combinacin da lugar a los diferentes tipos de colgeno que existen. De modo general, una mutacin en el gen de una de las cadenas provocar la desestabilizacin de todo el complejo trimrico, por lo que basta la mutacin en un solo alelo para que se desarrolle la enfermedad. En estos casos, puede darse la circunstancia de que una mutacin puede tener distinta gravedad en funcin del nmero de molculas mutantes y nativas que se generan. Figura 8.5 El video ilustra la diferencia entre mutaciones con prdida de funcin y mutaciones con ganancia de funcin en un mismo gen, utilizando el ejemplo del procolgeno tipo I. Cada molcula de -http://www.unav.es/asignatura/genmolhumbq/ 102 de 172

Gentica Molecular Humana (F.Ciencias)-

colgeno tipo I es un trmero formado por dos cadenas alfa-1 (codificadas por el gen COL1A1) y por una cadena alfa-2 (codificada por el gen COL1A2). En circunstancias normales, se mantiene un equilibrio tal que el locus COL1A1 produce el doble de cadenas que el locus COL1A2, con lo que se forma el procolgeno I sin problemas. Una mutacin con ganancia de funcin en uno de los alelos del gen COL1A1 provocar que la mitad de las cadenas alfa-1 sean anormales, de manera que la mayora de los trmeros estarn alterados y la cantidad de procolgeno I normal ser muy baja (de hecho, muy inferior al 50%). Esto causa una enfermedad llamada Osteognesis Imperfecta tipo I. En cambio, una mutacin que anule uno de los alelos del gen COL1A1 (prdida de funcin) crear una situacin en la que el nmero total de cadenas alfa-1 ser la mitad del normal. El resultado final es la formacin de trmeros de procolgeno I normales, pero en nmero equivalente al 50% de las personas sanas. Esto provoca una osteognesis imperfecta mucho ms leve que en el caso anterior. B. Receptores de las vas de transduccin de seales: constituyen otro gran grupo de protenas que suelen dar lugar a fenotipos de herencia dominante, habitualmente por un efecto dominante negativo de las molculas mutadas. A continuacin se sealan dos de los ejemplos ms ilustrativos: Los genes que codifican receptores para el factor de crecimiento fibroblstico (FGF). Tras la unin del ligando extracelular al receptor, unin mediada por heparan-sulfato de la matriz extracelular, los receptores forman homo- o heterodmeros, se transfosforilan en el dominio quinasa intracelular y a continuacin fosforilan protenas intracelulares implicadas en diversas vas de transduccin de seales. Las mutaciones que afectan a los genes de estos receptores (FGFR1, FGFR2 y FGFR3) causan varios sndromes de craniosinostosis y estatura baja cuyas bases moleculares estn comenzando a comprenderse. Por ejemplo, la Acondroplasia (la causa ms frecuente de estatura baja) es una enfermedad de herencia autosmica dominante debida a mutaciones en el gen del receptor del Factor de Crecimiento Fibroblstico-3 (FGF3). Este receptor forma un homodmero que se activa en respuesta a su ligando natural. En cambio, en los pacientes con acondroplasia se encuentran mutaciones en uno de los alelos del gen, de forma que la molcula mutada conduce a la dimerizacin del receptor incluso en ausencia de ligando. Como resultado, se obtiene una activacin constitutiva de la cascada de seales iniciada por el receptor, que en ltimo trmino provoca el cierre prematuro del cartlago de crecimiento de los huesos largos y la baja talla caracterstica de esta enfermedad. La mutacin ms frecuente en casos de acondroplasia es la mutacin G380R del gen FGFR3, que afecta al dominio transmembrana del receptor. Curiosamente, mutaciones en otras regiones de este mismo gen causan fenotipos similares pero no idnticos, como por ejemplo la displasia tanatofrica (micromelia e hipoplasia de costillas con fallo respiratorio). Estas enfermedades son de herencia dominante por el efecto dominante negativo de estas mutaciones, que hace que con una sola molcula mutada ya que se produzca la activacin constitutiva del receptor en ausencia de ligando. Respecto a mutaciones en otros genes que codifican receptores de FGF (FGFR1 y FGFR2), tambin causan enfermedades con alteraciones de huesos y cartlagos, como el Sndrome de Crouzon (craniosinostosis, bien aislada o bien asociada con otros defectos esquelticos), el Sndrome de Pfeiffer (pulgares y primer dedo del pie anchos con anquilosis interfalngica), el Sndrome de Jackson-Weiss (lo anterior ms coalescencia tarso-metatarsiana) y el Sndrome de Apert (sindactilia severa). Mutaciones que afectan al gen RET. Este gen codifica un receptor tirosina-quinasa, cuyo ligando es el GDNF (Glial cell line-Derived Neurotrophic Factor). Las mutaciones de RET son muy interesantes, ya que muestran cmo un mismo gen puede sufrir mutaciones que provocan prdida o ganancia de funcin, dando lugar a fenotipos diferentes. En el caso concreto de RET, algunas mutaciones con cambio de sentido afectan a aminocidos del dominio extracelular o del dominio quinasa, y provocan la activacin del receptor de manera independiente de ligando. Estas mutaciones carcinoma medular de tiroides familiar u otros cuadros de cncer familiar denominados MEN2 (Multiple Endocrine Neoplasia), que son de herencia dominante porque un solo alelo mutado -http://www.unav.es/asignatura/genmolhumbq/ 103 de 172

Gentica Molecular Humana (F.Ciencias)-

desencadena la enfermedad por un efecto dominante negativo. Por el contrario, algunas mutaciones de RET que llevan a la prdida de funcin (mutaciones sin sentido, cambios del marco de lectura, deleciones, etc) provocan la ausencia de las molculas del receptor codificadas por el alelo mutado, con el resultado de que la intensidad de la sealizacin de esta va se ve disminuida. Esto provoca un dficit en la migracin de precursores neurales al tubo digestivo durante el desarrollo embrionario, lo que da lugar a la Enfermedad de Hirschsprung (megacolon aganglinico: ausencia congnita de los plexos submucosos y mientrico del colon distal). Esta enfermedad se hereda con un patrn dominante (probablemente por un efecto de haploinsuficiencia), aunque tambin se han identificado mutaciones en otros genes que causan la misma enfermedad con herencia recesiva, como el gen EDNRB del receptor para endotelina B (receptor de proteinas G) tambin el gen de su ligando EDN3 (endotelina 3). Figura 8.6 Este video muestra la familia dereceptores tirosina-quinasa, que ilustra los efectos de distintas mutaciones activadoras (con ganancia de funcin) e inactivadoras (con prdida de funcin) en un mismo gen, y el efecto dominante negativo de las mutaciones activadoras. Varios receptores de esta familia, como FGFR3 RET, dan lugar a fenotipos dominantes.

8.5. Alteraciones de la impronta genmica


El imprinting o impronta genmica es la marca epigentica que define una regin genmica como materna paterna en el cigoto. La existencia de este fenmeno se descubri al crear embriones de ratn por transferencia nuclear: cambiando un proncleo masculino por un segundo proncleo femenino se obtiene un ginogenonte; reemplazando el proncleo femenino por un segundo proncleo masculino se obtiene un androgenonte. En teora, estos embriones (excepto los androgenontes YY) deberan ser viables, pero en cambio se observ que estas modificaciones son letales en el periodo embrionario, y que esa letalidad tiene dos formas diferentes: los ginogenontes muestran un embrin normal con falta de desarrollo de tejidos extraembrionarios, mientras que los androgenontes muestran ms alteraciones en el embrin que en tejidos extraembrionarios. En humanos, las concepciones uniparentales androgenticas, que se originan raramente por la prdida de los cromosomas maternos poco despus de la fertilizacin, se manifiestan en una estructura que se conoce como mola hidatidiforme completa. Por el contrario, los oocitos que se dividen por partenognesis slo contienen material materno, y dan lugar a quistes dermoides. Estos hallazgos se explican actualmente por la existencia en el genoma de genes "improntados" (sometidos al fenmeno de la impronta), en los que de algn modo se reconoce el origen parental de cada alelo y se produce el silenciamiento selectivo de uno de ellos: en unos casos siempre se silencia el materno, en otros genes siempre se silencia el alelo paterno. Por tanto, cuando el ncleo del cigoto slo contiene material de uno de los progenitores, pero no una mezcla de ambos, los embriones resultantes son inviables. Esto sugiere la existencia de una asimetra de los genomas materno y paterno, en cuanto a que ambos genomas tienen silenciados distintos grupos de genes. Esta asimetra es necesaria para el correcto desarrollo embrionario. Dado que ambos alelos de los genes sometidos a imprinting son idnticos y capaces de interaccionar con los mismos factores de transcripcin, el mecanismo que silencia uno de ellos de manera estable y heredable debe ser un mecanismo epigentico, que haga posible que el imprinting pueda borrarse durante la gametognesis y re-establecerse tras la fecundacin. La metilacin, como mecanismo silenciador de la expresin gnica, cumple la mayor parte de estos requisitos, y hay bastantes lneas de evidencia que apoyan el papel de la metilacin en el fenmeno de imprinting: 1) todos los genes improntados descritos hasta el momento -excepto uno- muestran regiones con metilacin diferencial (abreviadas DMR en ingls, regiones que estn metiladas en uno de los alelos pero no en el otro), cuyos patrones de metilacin se establecen durante la gametognesis y se mantienen gracias a la metilacin especfica de ADN hemi-metilado; 2) los embriones de ratn dnmt1-/- (que carece de ADN-metiltransferasa-1) muestran expresin bi-allica de genes improntados, es decir, en ausencia de la metilasa de mantenimiento se re-expresa el alelo que estaba silenciado; 3) se ha descrito el caso de una mujer con mutaciones en el gen

-http://www.unav.es/asignatura/genmolhumbq/

104 de 172

Gentica Molecular Humana (F.Ciencias)-

DNMT3L (que codifica una metilasa) que tiene infertilidad porque los embriones fallecen al implantarse en el tero; y 4) no se ha encontrado un fenmeno similar al imprinting en especies incapaces de llevar a cabo metilacin. Igualmente, se ha comprobado que los genes sometidos a imprinting tambin se replican de manera asincrnica: por FISH se suelen ver dos seales de hibridacin correspondientes a las dos cromtides que se forman durante la fase S del ciclo celular, pero en genes improntados se ve un cromosoma con dos seales y el otro cromosoma homlogo con una sola seal. Esto sugiere que el alelo especficamente silenciado se replica ms tarde. Existen varios modelos para explicar cmo la metilacin diferencial da lugar a las diferencias de expresin entre alelos paterno y materno, y cmo se regulan genes vecinos que tienen patrones de imprinting opuestos. Parece claro que en algunos casos es muy importante la protena CTCF (CTC-binding factor) una protena que se une a la las regiones de metilacin diferencial (DMR) nicamente cuando stas no estn metiladas. Por ejemplo, se ha visto que la regulacin de los genes Igf2 y H19 en ratn (que tienen patrones de imprinting opuestos) se lleva a cabo por este mecanismo, ya que CTCF acta como aislador (insulator) del promotor de Igf2 de unos potenciadores lejanos.

-http://www.unav.es/asignatura/genmolhumbq/

105 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 8.7 Tres modelos de regulacin de los genes que estn sometidos a imprinting. En la figura superior vemos el caso ms sencillo en que una Regin de Metilacin Diferencial (DMR), representada como un rectngulo naranja, regula la expresin de un nico gen: si la DMR est metilada (crculo azul), el gen est silenciado y no se expresa. En el medio se representa otro modo de co-regulacin de dos genes: uno de ellos se expresa en un alelo pero est silenciado en el otro alelo (lnea terminada en punto). El otro gen del cluster tiene el patrn de expresin recproco, debido a la metilacin de una DMR en uno de los genes, cuya expresin interfiere con la expresin del otro ya que sus regiones codificantes se solapan: cuando el gen de la izquierda se transcribe, esto interfiere con la transcripcin del gen de la derecha, que queda por tanto silenciado. El tercer modo de co-regulacin de genes con impronta recproca se debe a la unin de "aisladores" elementos "frontera" a una DMR. Por ejemplo, en la figura inferior se representa uno de estos elementos (valo azul), que nicamente puede unirse a una DMR cuando no est metilada (alelo 1), de modo que el aislador bloquea la accin de un potenciador lejano (rectngulo azul) sobre el gen de la izquierda; por tanto este gen est silenciado, mientras que el gen de la derecha se expresa. En cambio, la metilacin de la DMR (alelo 2) silencia la expresin del gen de la derecha pero adems impide la unin del aislador; como consecuencia, el potenciado puede ahora actuar sobre el promotr del gen de la izquierda y hacer que ste se exprese. La importancia de la protena CTCF se ha puesto de manifiesto gracias a un hallazgo sorprendente, al conseguir ratones partenogenticos viables cuando se deleciona de su genoma el gen H19 y la regin de metilacin diferencial a la que se une CTCF. Inicialmente, un ratn partenogentico lleva dos copias del genoma materno, por lo que tendr expresin biallica del gen H19 y silenciamiento de ambos alelos de Igf2, de ah que sean inviables. La delecin de una de las copias del H19 reestablece la expresin monoallica de este gen, pero todava hay silenciamiento total de Igf2e inviabilidad embrionaria. En cambio, si adems se deleciona la regin de metilacin diferencial a la que se une CTCF, ahora los potenciadores pueden promover la expresin de Igf2 en este cromosoma, con lo que se reestablece la expresin monoallica de Igf2. El resultado final es la expresin monoallica de H19 de uno de los cromosomas y la expresin monoallica de Igf2 del cromosoma homlogo, que es la situacin normal. Esto ilustra la importancia que tiene la impronta genmica en el desarrollo embrionario, y sugiere que la ineficacia de los procesos de clonacin de mamferos probablemente se deba a que los ncleos somticos utilizados para la transferencia nuclear no tienen los patrones de imprinting necesarios para la viabilidad embrionaria. Figura 8.8 El video muestra la importancia del fenmeno del imprinting en el desarrollo embrionario. Los genes Igf2 y H19 forman un cluster de impronta recproca en ratn, de forma que Igf2 se expresa slo en el cromosoma paterno y H19 se expresa slo en el cromosoma materno. La regulacin de este cluster se lleva a cabo por un factor aislador llamado CTCF, que se une a una regin de metilacin diferencial (el ltimo modelo explicado en la figura anterior). Como muestra el video, ratones obtenidos por partenognesis, que llevan dos copias del genoma materno, son inviables porque Igf2 est silenciado en ambos cromosomas. En cambio, la delecin dela regin de metilacin diferencial en uno de los cromosomas hace que se recupere la expresin monoallica de ambos genes y que los embriones de estos ratones sean viables. En cada ciclo reproductivo, los patrones de imprinting han de establecerse de nuevo, puesto que lo que en una meiosis fue material de origen paterno (transmisin de un varn a su hija, por ejemplo) en la siguiente meiosis pasar a ser marcado como materno (cuando esa hija tenga descendencia). Para poder cambiar el imprinting es necesario borrar toda la informacin previa sobre cul de los alelos debe silenciarse. Como el genoma est muy desmetilado en los gametos, el cambio en los patrones de imprinting debe de tener lugar durante la gametognesis. Con los datos actuales, la hiptesis ms aceptada para explicar el borrado y re-establecimiento de los patrones de metilacin durante la gametognesis es la existencia de protenas capaces de unirse a las DMR no-metiladas (y as protegerlas de la metilacin), junto con otros factores que se unen a las DMR metiladas y ayudan a mantener el estado silenciado. Se piensa que slo una de las lneas germinales (masculina femenina) es capaz de producir los factores que protegen de la metilacin a las regiones no-metiladas. As, estas regiones se mantendrn des-metiladas en la lnea germinal que produzca estos factores. Por el contrario, estas regiones se metilarn y silenciarn en la lnea germinal que -http://www.unav.es/asignatura/genmolhumbq/ 106 de 172

Gentica Molecular Humana (F.Ciencias)-

no los produce. Por lo que respecta a la identidad de dichos factores, los candidatos ideales son las protenas que se unen especficamente a regiones metiladas (MeCP2, HDAC, etc) a regiones no metiladas (CTCF, factores de transcripcin que se unen a CpGs no metilados, etc). La impronta es, por tanto, un mecanismo fisiolgico normal. Sin embargo, algunas alteraciones genticas que afectan a regiones sometidas a imprinting pueden dar lugar a enfermedades. Este es el caso de la llamada disoma uniparental, situacin en la que ambas copias de de un cromosoma o de una regin cromosmica proceden del mismo progenitor. Si esa regin contiene genes improntados, el resultado puede ser la presencia de dos copias silenciadas de un gen, con lo que el efecto viene a ser similar a una delecin homocigtica de ese locus. Hoy en da conocemos una larga lista de enfermedades y tumores humanos debidos a disoma uniparental de loci sometidos a impronta. Adems, se han detectado regiones improntadas en los cromosomas 11, 15, 7 y 14, y actualmente se conocen unos 30 genes improntados en ratn y humanos. Los loci sometidos a impronta tienden a aparecer agrupados en determinadas regiones cromosmicas, de manera que —dentro de cada uno de estos grupos o clusters— unos genes muestran expresin materna y otros genes muestran expresin paterna. Esto se ilustra con el ejemplo de dos enfermedades llamadas Sndrome de Prader-Willi y Sndrome de Angelman, originados por alteraciones en el grupo de genes improntados que se encuentran en 15q11-q13. Todos los genes improntados en esta regin muestran expresin especfica del alelo paterno excepto el gen UBE3A, que muestra expresin materna en cerebro. Parece que la expresin de UBE3A depende de la expresin de un transcrito antisentido que comienza 6,5 kb en direccin 3 del codn de parada de UBE3A y que alcanza hasta la mitad 3 de UBE3A, de manera que en la mayora de los tejidos somticos este transcrito no se expresa y por tanto la expresin de UBE3A en estos tejidos es biallica. Por el contrario, el transcrito antisentido se expresa en clulas de Purkinje, neuronas del hipocampo y clulas mitrales olfatorias, silenciando el alelo paterno y originando el imprinting de UBE3A en estos tejidos. Por estudios en pacientes con microdeleciones, sabemos que el centro de imprinting de esta regin es bipartito y cubre en total unas 100 kb. Dentro de esta regin, el centro de imprinting para Angelman cubre 1,15 kb, mientras que el centro de imprinting Prader-Willi es ms distal y cubre unas 4,3 kb (incluyendo el promotor y el exn 1 del gen SNRPN). Se postula que durante la gametognesis estos centros fijan los patrones de expresin de toda esta regin, de forma que en la oognesis se activa el centro de imprinting AS —que, a su vez, bloquea la funcin del centro de imprinting PW. Como resultado, los gametos femeninos slo expresan el gen UBE3A. En cambio, en la espermatognesis el centro AS estara bloqueado, de manera que el centro de imprinting PW es ahora activo y promueve la expresin de todos los genes de expresin paterna, includo el gen antisentido que bloquea la expresin de UBE3A. De este modo se crean los epigenotipos paterno y materno que se mantendrn durante el desarrollo embrionario y en clulas somticas adultas.

-http://www.unav.es/asignatura/genmolhumbq/

107 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 8.9 se muestra un esquema de la organizacin de este cluster, con los genes de expresin paterna en rojo y los genes de expresin materna (UBE3A) en amarillo. El centro de imprinting, localizado en la regin 5' del gen SNRPN, se representa como dos valos verdes. En el cromosoma paterno, el centro de imprinting de Prader-Willi favorece la expresin de los genes en rojo, includo el gen "Antisense", cuya expresin impide la transcripcin de UBE3A. En el cromosoma materno, el centro de imprinting de Angelman inhibe la funcin del centro de imprinting de Prader-Willi, silenciando los genes en rojo y permitiendo la expresin de UBE3A. El Sndrome de Prader-Willi, cuya incidencia estimada es de 1/25.000, se caracteriza por disminucin de la actividad fetal, obesidad, hipotona muscular, retraso mental, hipogonadismo hipogonadotrfico, manos y pies pequeos, hipopigmentacin, baja estatura y rasgos dismrficos. Se debe a la falta de expresin de los genes especficos del cromosoma paterno dentro de esta regin. Por el contrario, el Sndrome de Angelman tiene una incidencia de 1/15.000 nacimientos y est caracterizado por un fenotipo distinto al de Prader-Willi: retraso mental severo, temblor, ataxia, marcha anormal, tendencia a la risa, transtornos del sueo y convulsiones. Est provocado por la falta de expresin del gen UBE3A, que se expresa especficamente en el cromosoma materno. Las alteraciones de la impronta de todos estos genes pueden tener lugar por varios mecanismos: 1) Deleciones grandes de la regin: producirn Sndrome de Prader-Willi (SPW) si la delecin afecta al cromosoma paterno, Sndrome de Angelman (AS) si la delecin afecta al cromosoma materno. Constituyen la principal causa de estas enfermedades (70% de todos los casos). 2) Disoma uniparental (UPD), debida a no-disyuncin durante una de las meiosis parentales. En efecto, la no-disyuncin puede originar gametos dismicos o nulismicos, que originan cigotos trismicos o monosmicos. En estas circunstancias, la disoma uniparental puede ser resultado tanto de la recuperacin de un cigoto trismico por prdida de uno de los cromosomas, como de la duplicacin completa de un cromosoma para recuperar un cigoto monosmico. En este ltimo caso vemos una isodisoma (ambos cromosomas provienen de la duplicacin de un mismo cromosoma parental), mientras que un 70% de los casos de reduccin de cigotos trismicos dan lugar a heterodisoma (presencia de los dos cromosomas del mismo progenitor). La presencia de dos cromosomas 15 paternos da lugar a un 2% de los casos de Sndrome de Angelman, mientras que el 25% de los casos de Sndrome de Prader-Willi se deben a la presencia de dos cromosomas 15 maternos. 3) Mutaciones puntuales en los genes responsables. En el Sndrome de Angelman se detectan mutaciones en el gen UBE3A (que codifica la E6 ubiquitin-ligasa) hasta en un 20% de los enfermos. En el caso del -http://www.unav.es/asignatura/genmolhumbq/ 108 de 172

Gentica Molecular Humana (F.Ciencias)-

Sndrome de Prader-Willi, en cambio, la bsqueda de un gen candidato no ha dado resultados, aunque el principal gen implicado es SNRPN. En el caso concreto de este gen (SNRPN), se ha visto que existe otra secuencia codificante en direccin 5 (SNURF por "SNRPN Upstream Reading Frame") de manera que, de hecho, ambos forman un nico gen bicistrnico: un solo transcrito del que se traducen dos protenas. Con los datos actuales, hay que considerar el Sndrome de Prader-Willi como un sndrome de microdelecin causado por la prdida de varios genes contiguos. 4) Mutaciones o microdeleciones que afectan a los centros de imprinting, de manera que no se podrn re-establecer los patrones durante la gametognesis en el caso de que haya transmisin de un sexo al opuesto (madre-hijo padre-hija). El resultado funcional en el cigoto es idntico a lo que sucede en la disoma uniparental: ambos alelos llevan el mismo patrn de imprinting. Este tipo de alteraciones son responsables de un 5% de los casos de Sndrome de Prader-Willi o de Sndrome de Angelman. El ejemplo tpico es el de la abuela paterna portadora de una mutacin en el centro de imprinting del cromosoma 15 que lleva marcado como materno. Al transmitir este cromosoma a un hijo varn, el cromosoma mutado pasar a su hijo marcado como materno, por lo que no es necesario reestablecer el imprinting y el hijo ser normal (llevar un cromosoma marcado como paterno y otro como materno). En la siguiente generacin, en cambio, este individuo varn deber pasar su cromosoma 15 marcado como paterno, por lo que la marca que lo identificaba como materno deber ser borrada durante la espermatognesis y sustituida por la marca que lo identifique como paterno. En este individuo dicho cambio ser imposible, debido a la mutacin en el centro de imprinting de su cromosoma 15 materno, por lo que su descendencia llevar dos cromosomas con epigenotipo materno y desarrollar Sndrome de Prader-Willi. Lo mismo puede suceder para el Sndrome de Angelman, cuando la mutacin del centro de imprinting afecta al cromosoma paterno.

-http://www.unav.es/asignatura/genmolhumbq/

109 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 8.9b Transmisin de un cromosoma con mutacin del centro de imprinting, para mostrar que no puede reestablecer el patrn de imprinting al cambiar de tipo de lnea germinal. El diagnstico gentico en estas dos enfermedades va dirigido a la deteccin de deleciones, de disoma uniparental o de alteraciones en el centro de imprinting, y se realiza por los siguentes procedimientos: Cariotipo convencional. Es insuficiente para detectar la microdelecin tpica, pero es til en el probando y en los padres para detectar posibles translocaciones, ya que un pequeo porcentaje de las deleciones son fruto de translocaciones no equilibradas (casi siempre de novo). Tambin detectar translocaciones equilibradas de novo o heredadas, aunque estos casos son excepcionales. FISH: detecta todas las deleciones, usando sondas frente al gen SNRPN en combinacin con una sonda centromrica del cromosoma 15. La mayora de las deleciones son intersticiales, siendo la ms frecuente una pequea delecin de unas 4 Mb de tamao.

Figura 8.10 Imagen de FISH para la deteccin de la microdelecin que causa el Sndrome de Prader-Willi. Deteccin de Disoma Uniparental: se usan microsatlites del cromosoma 15 para determinar el origen parental de cada cromosoma. Lgicamente, es necesario descartar primero la presencia de delecin, y adems este procedimiento viene limitado por la necesidad de obtener muestras del probando y de ambos progenitores, as como por la posible falsa paternidad.

-http://www.unav.es/asignatura/genmolhumbq/

110 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 8.11 Anlisis de microsatlites del cromosoma 15 para detectar disoma uniparental en el diagnstico del Sndrome de Prader-Willi. Anlisis de metilacin: puede hacerse bien por Southern blot tras digestin del ADN genmico con enzimas de restriccin sensibles a metilacin, o por PCR especfica de metilacin (MS-PCR). Si el exn 1 de SNRPN y el centro de imprinting adyacente estn metilados en los dinucletidos CpG, esto indica un patrn materno; si no estn metilados, podemos excluir el silenciamiento de SNRPN y los dems genes de expresin paterna. Es un anlisis que no requiere muestras de los progenitores, y permite confirmar la existencia de Sndrome de Prader-Willi cuando se observa slo el patrn de metilacin materno. Tiene la ventaja de que si el anlisis es normal (es decir, si se observan dos patrones distintos de metilacin, correspondientes a los cromosomas paterno y materno), esto automticamente excluye la presencia de delecin o de disoma uniparental. Cuando esta prueba es anormal (patrn nicamente materno) y no se detecta delecin ni disoma uniparental, esto sugiere la existencia de alteraciones en el centro de imprinting. En el caso concreto del Sndrome de Angelman tambin es necesario buscar mutaciones en UBE3A: aunque esto slo supone un 20% de los pacientes, su deteccin es de gran importancia por el aumento dramtico en el riesgo de recurrencia de la enfermedad en la misma familia. Se estima que hasta un tercio de los pacientes que tienen estudios de metilacin normales tienen mutaciones en UBE3A, por lo que la estrategia diagnstica recomendada es comenzar con estudios de metilacin y despus buscar mutaciones de UBE3A en aquellos sujetos con resultados de metilacin normales. Teniendo en cuenta lo anterior, se ha diseado un rbol de decisin para optimizar la estrategia diagnstica en el caso de los sndrome de Prader-Willi y Angelman, de manera que se diagnostique el mayor nmero de casos con el menor nmero de pruebas. En general, cuando los estudios de metilacin son anormales (patrn nicamente materno en el caso del Prader-Willi o patrn nicamente paterno en el caso del Angelman), podemos continuar investigando la causa de la enfermedad haciendo FISH para detectar la delecin caracterstica, ya que sta es la causa ms habitual de estas enfermedades. Si el FISH es normal, se pueden realizar estudios de microsatlites para confirmar la presencia de disoma uniparental.

-http://www.unav.es/asignatura/genmolhumbq/

111 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 8.12 La estrategia diagnstica ms aceptada para el estudio del Sndrome de Prader-Willi y del Sindrome de Angelman comienza con los estudios de metilacin de la regin correspondiente al centro de imprinting. Si se detecta un patrn de metilacin paterno y otro materno, esto automticamente descarta la delecin y la disoma uniparental. En el caso del Prader-Willi, esto supone que no hay que realizar ms estudios, mientras que en el caso del Angelman habra que buscar mutaciones en el gen UBE3A, que causan la enfermedad en un 20% de los casos. En el Sndrome de Prader-Willi el riesgo de recurrencia (un segundo individuo enfermo en la misma familia) es prcticamente cero en los casos de delecin y de disoma uniparental que no estn asociados a reordenaciones cromosmicas. De todas formas, a efectos de consejo gentico se considera un riesgo de recurrencia del 1%, ya que en una muestra amplia de pacientes se detect un riesgo de recurrencia en hermanos de probandos del 1,6% (aunque esto inclua todas las posibles causas). El mayor riesgo de recurrencia se produce en los casos familiares que estn debidos a alteraciones en el centro de imprinting. En estos casos, el riesgo de recurrencia es del 50% ya que volver a suceder siempre que el padre transmita el cromosoma 15 que lleva la mutacin. En el Sndrome de Angelman, el riesgo de recurrencia tambin se considera habitualmente del 1%, excepto en los casos de mutaciones del centro de imprinting y de mutaciones en UBE3A, en las que el riesgo de heredar el cromosoma materno mutado es del 50% (si el cromosoma mutado se hereda del padre no hay enfermedad porque en ese cromosoma el gen UBE3A no se expresara en cualquier caso).

Tema 9. Bases genticas del desarrollo embrionario


9.1. Temas centrales de la Gentica del desarrollo. 9.2. El desarrollo embrionario inicial en mamferos. 9.3. Mutaciones que afectan a la morfognesis en humanos.

9.1. Temas centrales de la Gentica del desarrollo


La vida de un ser multicelular comienza a partir de una clula, resultado de la fecundacin de un oocito por un espermatozoide, y a partir de esa primera clula se construye un organismo completo. Este proceso se denomina desarrollo, y lleva consigo el aumento del nmero de clulas, el aumento de complejidad -http://www.unav.es/asignatura/genmolhumbq/ 112 de 172

Gentica Molecular Humana (F.Ciencias)-

(distintas clulas adquieren caractersticas y funciones diferentes, mediante un proceso denominado diferenciacin) y la auto-organizacin como un ser vivo que se desarrolla de modo unitario. Tradicionalmente, el desarrollo animal se divide en una etapa embrionaria (en la que se forman las estructuras de ese ser vivo) y una etapa post-embrionaria o fetal (en la que slo hay crecimiento y refinamiento de esas estructuras), y se considera completo cuando el organismo alcanza la madurez sexual. De todas formas, desde una perspectiva ms amplia podra considerarse el desarrollo como un proceso continuo que va desde la fecundacin hasta la muerte de ese ser vivo, incluyendo el envejecimiento como parte del mismo. El hecho de que una sola clula (el cigoto) contenga toda la capacidad (potencialidad) de construir un ser vivo completo con trillones de clulas especializadas y organizadas en tejidos, rganos y aparatos que funcionan como un todo unitario, significa que esa clula inicial lleva en su genoma todas las instrucciones necesarias para completar esa tarea. Una consecuencia lgica de esto es que cada una de las clulas del organismo adulto, con un genoma idntico al del cigoto, debera poseer tambin esta capacidad (es decir, debera ser totipotente). Experimentos realizados en 1950 demostraron que en algunas plantas se retiene esta capacidad, de modo que es posible clonar una planta entera a partir de una sola clula del floema de la raz. En los aos 60, los experimentos de John Gurdon en anfibios confirmaron que algunas clulas adultas retienen la totipotencialidad tambin en vertebrados, y la clonacin de la oveja Dolly en 1996 demostr que las clulas adultas de mamferos pueden recuperar la totipotencialidad de modo excepcional, mediante la reprogramacin de su ncleo por mecanismos todava poco claros. La conclusin de estos trabajos es que las diferencias estructurales y funcionales que muestran los distintos tipos de clulas deben ser resultado de la diferente expresin gnica, ya que todas comparten un genoma bsicamente idntico. Es decir, durante el proceso de desarrollo tiene lugar el apagado y encendido selectivo de ciertos genes en los grupos de clulas que darn lugar a linajes celulares distintos. Estas diferencias de expresin gnica, a su vez, son provocadas por distintos factores de transcripcin en respuesta a la activacin de vas de sealizacin que tiene lugar durante la comunicacin entre clulas, y habitualmente se fijan en un linaje celular mediante modificaciones epigenticas de la cromatina. Teniendo presente esta visin general del desarrollo embrionario, podemos esquematizar los principales procesos implicados en el mismo, distinguiendo tres niveles: 1. A nivel celular, los procesos que gobiernan el desarrollo son la proliferacin y la diferenciacin. Como hemos dicho, el paso desde una clula hasta un organismo adulto requiere la divisin continua de la clula original y de sus clulas hijas. Este aumento del nmero de clulas es muy rpido al principio y despus se frena, en algunos rganos ms que en otros, llegando a un equilibrio con los procesos de muerte celular. La diferenciacin celular consiste en la especializacin estructural y funcional que van adquiriendo diferentes grupos celulares durante el desarrollo, para cumplir funciones muy distintas que permiten el funcionamiento unitario del organismo. Esto lleva consigo una serie de toma de decisiones por las que una clula se va comprometiendo hacia un linaje concreto. Dicho compromiso va asociado, lgicamente, a una prdida de potencialidad: as, si el cigoto es totipotente, las clulas de la mrula o del blastocisto son pluripotentes (no pueden generar un organismo completo, pero s cualquier linaje celular del embrin), las clulas de cada una de las tres capas germinales del embrin son multipotentes (slo pueden dar lugar a clulas de uno de esos tres linajes), y las clulas progenitoras de cada tejido con unipotentes. Sin embargo, experimentos realizados en los ltimos aos han demostrado que las clulas diferenciadas pueden ser reprogramadas a un estado pluripotencial (clulas iPS) o incluso pueden ser trans-diferenciadas a tipos celulares distintos.

-http://www.unav.es/asignatura/genmolhumbq/

113 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 9.1 El video resume las primeras etapas del desarrollo humano, mostrando la importancia de la proliferacin y la diferenciacin celular. 2. A nivel del organismo (es decir, cmo se va construyendo el nuevo ser vivo), se pueden considerar tambin dos procesos fundamentales: la formacin de patrones corporales y la morfognesis. La formacin de patrones corporales comienza a organizar las clulas del embrin inicial segn un plan corporal concreto, comenzando por la especificacin de los tres ejes corporales fundamentales: el eje anteroposterior (crneo-caudal, cabeza-cola), el eje izquierda-derecha y el eje dorso-ventral. En vertebrados, las clulas van disponindose a lo largo de estos tres ejes de modo asimtrico (aunque el eje izquierda-derecha tiene simetra superficial), creando segmentos que van adquiriendo una identidad concreta. La morfognesis es el proceso dinmico por el cual el embrin se va reorganizando para dar lugar a estructuras y formas concretas. Esta reorganizacin implica a menudo movimientos de grupos de clulas, con cambios en la forma y en el tamao celular, cambios en la afinidad de ciertas clulas por molculas de adhesin, destruccin de grupos celulares mediante apoptosis, etc. 3. A nivel molecular, todos los procesos descritos hasta el momento se llevan a cabo bsicamente mediante tres mecanismos: expresin gnica diferencial y formacin de gradientes de molculas sealizadoras. a. Ya hemos comentado que el principal mecanismo molecular que dirige el desarrollo embrionario es la expresin de determinados genes en unas regiones y en unos momentos concretos, mientras que otros genes deben permanecer apagados. A menudo, esta fina regulacin se logra por la accin de factores de transcripcin especficos, que a su vez se activan en respuesta al contacto clula-clula, clula-matriz extracelular, etc. La fijacin de silenciamiento gnico, transmitida a las clulas hijas, a menudo se lleva a cabo mediante modificaciones epigenticas de la cromatina (metilacin de ADN y metilacin(desacetilacin de histonas). -http://www.unav.es/asignatura/genmolhumbq/ 114 de 172

Gentica Molecular Humana (F.Ciencias)-

b. En otras ocasiones, el linaje celular se establece por la posicin que ocupa una clula a lo largo de los tres ejes del embrin. Esto implica la existencia de un mecanismo para establecer las coordenadas a lo largo de esos ejes; dicho mecanismo suele ser la presencia de un gradiente de concentracin de molculas llamadas morfgenos, debido a que el morfgeno es producido en un punto donde alcanza mxima concentracin y difunde a lo largo del embrin. Estas molculas inducen la diferenciacin de las clulas vecinas de modo diferente segn sea la concentracin local del morfgeno en cada punto, dependiendo de la afinidad del morfgeno por sitios de unin en el ADN que actan como potenciadores de la expresin gnica. c. Finalmente, un proceso muy utilizado a nivel molecular para conseguir diferenciacin celular es la divisin celular asimtrica. Algunos ARN mensajeros y/o protenas pueden acumularse en determinados polos de una clula, transportados a travs del citoesqueleto. Al dividirse esa clula (dependiendo del plano de la divisin), las clulas hijas llevarn distinta concentracin de esos ARN mensajeros o protenas, lo que provocar la adquisicin de distintas caractersticas morfolgicas y funcionales.

9.2. El desarrollo embrionario inicial en mamferos


Por motivos histricos, el desarrollo embrionario se ha estudiado con bastante detalle en plantas e invertebrados, en algunos vertebrados y en pocos mamferos. La conservacin evolutiva de los procesos celulares y moleculares hace que algunos modelos, especialmente los de vertebrados y de mamferos, sean de gran utilidad para conocer el desarrollo humano, aunque cada uno de estos modelos tiene sus ventajas e inconvenientes. El desarrollo del pollo (Gallus gallus), por ejemplo, puede estudiarse con facilidad (a travs del huevo) y ha sido til para esclarecer aspectos del desarrollo de las extremidades de vertebrados. Otro vertebrado, el pez cebra (Danio rerio) es muy utilizado por la facilidad de manipulacin y observacin, y por el buen conocimiento que tenemos de su genoma. Aunque el plan corporal es distinto al de vertebrados, la mosca Drosophila melanogaster es el organismo cuyo desarrollo embrionario ha sido estudiado con mayor detalle, adems de que su genoma es tambin perfectamente conocido y de la disponibilidad de gran cantidad de mutantes. Sin embargo, las fases iniciales del desarrollo embrionario de Drosophila son muy diferentes a las de mamferos, por lo que no se vern aqu con detalle. En cualquier caso, es interesante conocer que los principales ejes del embrin se especifican gracias a la diferente distribucin de algunos mRNA y protenas en el oocito y en el embrin inicial, dando lugar a gradientes de morfgenos que originan diferencias de expresin gnica a lo largo de estos ejes. En el caso del eje dorso-ventral, los genes implicados son dorsal, cactus y toll; en el caso del eje antero-posterior, los genes implicados son bicoid y nanos. Una vez establecidos los principales ejes corporales, otros genes se encargan de segmentar el embrin: los genes gap (hiato o hueco) definen regiones ms o menos grandes del embrin, que incluyen varios segmentos; los genes de la regla del par (pair-rule) se encargan de definir cules segmentos van en grupos (por ejemplo, segmentos pares e impares); finalmente, los genes de polaridad de los segmentos definen cul es la parte anterior y posterior de cada segmento. Tras la formacin del nmero adecuado de segmentos, el siguiente paso del desarrollo embrionario es establecer la identidad de cada segmento, es decir, definir si se trata de un segmento que dar lugar a estructuras de la cabeza, del trax o del abdomen. Esta funcin la llevan a cabo los genes hometicos, que en Drosophila son ocho: labial (lab), proboscidea (pb), deformed (Dfd), sex-combs-reduced (Scr), Antennapedia (Antp), Ultrabithorax (Ubx), abdominalA (abdA) y AbdominalB (AbdB). Los cinco primeros forman un complejo llamado Antennapedia y los tres ltimos el complejo bithorax; en conjunto forman el complejo hometico (HOM-C), que se dispone linealmente a lo largo del mismo cromosoma. Estos genes se expresan en el embrin de modo diferencial en sentido antero-posterior, es decir, los primeros genes se expresan solo en los segmentos anteriores (y dan lugar a estructuras de la cabeza y el -http://www.unav.es/asignatura/genmolhumbq/ 115 de 172

Gentica Molecular Humana (F.Ciencias)-

trax anterior) y los ltimos genes se expresan en los segmentos posteriores (dando lugar a estructuras abdominales). Por tanto, mutaciones en estos genes (mutaciones hometicas), dan lugar a cambios hometicos, como por ejemplo la aparicin de una estructura abdominal (como la pata) en un segmento correspondiente a la cabeza. La activacin de los genes hometicos depende de la funcin de los genes de segmentacin, y son muy sensibles a la concentracin de los morfgenos codificados por stos. Las protenas codificadas por los genes hometicos comparten una caja de 60 aminocidos (caja hometica, homeobox) que acta como dominio de unin al ADN, ya que estas protenas son factores de transcripcin. Figura 9.2 El video resume el desarrollo embrionario de Drosophila. Las fases iniciales del desarrollo embrionario de mamferos se caracterizan por la divisin celular del cigoto para dar sucesivamente un embrin de 2, 4 y 8 clulas, que se denomina mrula (cada clula de la mrula se denomina blastmero). La segunda divisin es asimtrica, ya que una clula se divide segn un plano horizontal (ecuatorial) y la otra segn un plano vertical (meridional). La clula que se divide ecuatorialmente origina un blastmero animal y un blastmero vegetal. Esta segunda divisin, en la especie humana, va seguida de la activacin del genoma del cigoto (en ratn, la activacin tiene lugar tras la primera divisin). En la mrula de 8 clulas, los blastmeros se unen entre s mediante uniones estrechas gracias a la expresin de cadherina E, en un proceso que se denomina compactacin. En la mrula de 16 clulas ya es posible distinguir un alto grado de polarizacin, de modo que los blastmeros externos constituirn el trofectodermo (que dar lugar a los tejidos extraembrionarios de apoyo para la nutricin del embrin y del feto), mientras que los blastmeros internos darn lugar a la masa celular interna. En la fase de 32 clulas se forma el blastocisto: una esfera formada por el trofoblasto en el exterior, una cavidad interna (blastocele) y las clulas la masa celular interna divididas en epiblasto (que continuar con el desarrollo del embrin propiamente dicho) y endodermo primitivo (que formar la pared de clulas que separa el epiblasto del blastocele). En torno al da 5 del desarrollo embrionario humano, el blastocisto sale de la envoltura que lo recubra (llamada zona pellucida) y se implanta en la pared del tero, para continuar con el desarrollo del embrin y la formacin de varias capas celulares que se reorganizan en un proceso morfogentico llamado gastrulacin. Figura 9.3 El video muestra los cinco primeros das del desarrollo embrionario humano. El establecimiento de los principales ejes corporales en el desarrollo embrionario de vertebrados es diferente al de invertebrados, y mucho menos conocido. Aunque tradicionalmente se pensaba que estos ejes no se establecan hasta el momento de la gastrulacin, estudios realizados en los ltimos aos han demostrado que ya se pueden reconocer en el embrin inicial. Por ejemplo, recientemente se ha visto que el punto de entrada del espermatozoide se asocia con el surco de la primera divisin celular, que discurre desde el polo animal (donde se sita el segundo corpsculo polar) hasta el polo vegetal. Esta primera divisin, a su vez, define cul ser el polo embrionario y el polo abembrionario del blastocisto, que determinarn el futuro eje dorsoventral del embrin: En los ltimos aos se ha demostrado que ya en los momentos iniciales del desarrollo los blastmeros sufren un cierto grado de especializacin, de modo que ya en la fase de cuatro clulas estn polarizados y parcialmente comprometidos a originar uno de los tres linajes celulares principales del blastocisto: trofectodermo, epiblasto y endodermo primitivo. En efecto, en el embrin inicial hay dos decisiones fundamentales. La primera es la que distingue el trofectodermo de la masa celular interna y se produce en el estadio de 8-16 clulas. Como las clulas estn polarizadas, una divisin celular simtrica dar lugar a dos clulas iguales (como sucede con las clulas ms externas), mientras que las divisiones asimtricas formarn clulas diferentes en las capas externas e internas. Las clulas externas formarn el trofectodermo , mientras que las clulas internas retienen la pluripotencialidad y forman la masa celular interna. Despus, -http://www.unav.es/asignatura/genmolhumbq/ 116 de 172

Gentica Molecular Humana (F.Ciencias)-

a partir del estadio de 16-32 clulas, las divisiones asimtricas de las clulas externas origina una segunda ola de clulas internalizadas, que darn lugar al otro linaje extraembrionario (endodermo primitivo). Las clulas que fueron internalizadas en las primeras divisiones retienen la pluripotencialidad y darn lugar al epiblasto, tal y como se muestra en el siguiente esquema. Todos estos procesos tienen un correlato molecular que est comenzando a conocerse con cierto detalle. Por ejemplo, OCT4, NANOG y SOX2 son factores de transcripcin que mantienen el estado pluripotencial en clulas de la masa celular interna y del epiblasto. A su vez, el factor de transcripcin CDX2 promueve la formacin de clulas del trofectodermo e inhibe la pluripotencialidad. Inicialmente, CDX2 est presente en todas las clulas ya que proviene del citoplasma del oocito, pero ya est polarizado en el embrin de 8 clulas (se acumula en la regin apical de los blastmeros) y por eso es ms abundante en las clulas externas que resultan de divisiones asimtricas. Adems, el factor de transcripcin TEAD4 hace que se exprese CDX2 embrionario slo en los blastmeros externos del embrin de 8-16 clulas. Para la diferenciacin del endodermo primitivo, se ha comprobado que es muy importante la accin del factor de transcripcin SOX17, que sera el responsable de inhibir la expresin de NANOG y aumentar la expresin de GATA6 en estas clulas. Adems de la regulacin mediante factores de transcripcin, tambin se estn estudiando los cambios epigenticos implicados en la asimetra entre clulas del embrin inicial. Por ejemplo, las clulas de la masa celular interna tienen mayor metilacin global del ADN que las clulas del trofectodermo, y tambin algunas modificaciones de histonas (H3K9me3 y H3K27me3, por ejemplo) son ms altas en la masa celular interna que en el trofectodermo. No est claro si estas asimetras epigenticas son la consecuencia o la causa de la distinta identidad de las clulas del embrin inicial. Algunas de estas diferencias pueden observarse ya en el embrin de 4 clulas, como sucede con la dimetilacin de la arginina 26 de la histona 3 (H3R26me2). Dicha marca es muy baja en el blastmero vegetal. De hecho, al sobre-expresar la metilasa responsable de esta marca en blastmeros individuales, se ha comprobado que el aumento de H3R26me2 va asociado con la expresin de NANOG y SOX2, de forma que esas clulas forman parte de la masa celular interna. Como se ha comentado, los genes homeobox especifican la identidad de los segmentos del embrin. El complejo HOM-C de Drosophila se encuentra tambin en mamferos, pero con la peculiaridad de que se ha duplicado dos veces respecto al genoma de la mosca. Esto significa que hay cuatro grupos de paraloga, cada uno de ellos formado por entre 9 y 12 genes (de un total de 13 posibles genes) dispuestos longitudinalmente en un mismo cromosoma. Cada grupo se denomina por una letra de la A a la D, y dentro de un grupo cada gen se designa con un nmero del 1 al 13 en direccin 3 a 5. Al igual que en Drosophila, los genes 3 se expresan nicamente en las regiones anteriores del embrin, y los genes 5 en los segmentos posteriores. As, los parlogos 1 a 4 determinan regiones craneales y cervicales, los parlogos 5 a 8 regiones torcicas y los parlogos 9 a 13 las regiones abdominales.

-http://www.unav.es/asignatura/genmolhumbq/

117 de 172

Gentica Molecular Humana (F.Ciencias)-

La Figura 9.4 muestra un esquema de los genes homeobox humanos.

9.3. Mutaciones que afectan a la morfognesis en humanos


El estudio comparativo del desarrollo embrionario en humanos, ratn y Drosophila ha permitido identificar los mecanismos genticos por los que se generan varias enfermedades congnitas de la morfognesis. Muchas de estas mutaciones afectan a genes que codifican factores de transcripcin. Entre los sndromes malformativos debidos a alteraciones en factores de transcripcin encontramos varios tipos: Malformaciones de las extremidades. Las extremidades se organizan en torno a 3 ejes (Antero-Posterior, Dorso-Ventral y Proximal-Distal), y se desarrollan a partir de un brote en el que hay una intensa actividad mittica en la llamada zona de progresin, actividad que es inducida por un grupo de clulas que forman el repliegue apical ectodrmico. Esta actividad mittica est en equilibrio con los procesos de apoptosis de clulas del mesnquima, que da lugar a los espacios interdigitales e interseos. El desarrollo de las extremidades tiene una fase inicial en la que es importante la expresin de genes homeobox. Por ejemplo, se ha descrito un tipo de sin-polidactilia en pacientes que tienen un aumento de 7-14 alaninas en el gen HOXD13, expansin que provoca una ganancia de funcin de dicho gen. Tambin se han encontrado mutaciones en HOXA13 en pacientes con Sndrome mano-pie-genital, caracterizado por hipoplasia del quinto dedo de manos y pies y malformaciones genitourinarias (hipospadias o tero bicorne). En una segunda fase de formacin del eje antero-posterior de los miembros interviene la va de sealizacin intracelular de las protenas Hedgehog, integrada por Sonic Hedgehog (SHH), los factores de transcripcin GLI1, GLI2 y GLI3, y los receptores Patched (PTCH) y Smoothened (SMO). El gen SHH se expresa en la Zona de Actividad Polarizante, que es la regin que determina la posterioridad de un miembro, y de hecho se ha visto en embriones de pollo que si se transplanta la ZPA (o bolas empapadas en la protena SHH) a la parte anterior del esbozo, se desarrolla una mano en espejo.

-http://www.unav.es/asignatura/genmolhumbq/

118 de 172

Gentica Molecular Humana (F.Ciencias)-

La Figura 9.5 muestra la organizacin axial de los esbozos de los miembros superiores y los genes implicados en su desarrollo. La disregulacin de la va Sonic Hedgehog en humanos provoca sindactilia (fusin de dos ms dedos) y/o polidactilia, (aparicin de uno ms dedos extra) que tienden afectar a los dedos cercanos al pulgar (preaxiales) en casos de sobre-expresin de SHH, o bien afectan a los dedos cercanos al meique (centrales/postaxiales) en casos de represin de este gen. Sin embargo, no se han encontrado mutaciones de SHH en malformaciones de miembros, pero s en pacientes con holoprosencefalia autosmica dominante. Esta enfermedad se origina por el desarrollo defectuoso del cerebro anterior y de la cara, con unas manifestaciones muy variables que van desde un incisivo nico hasta individuos con un solo ojo (cclopes), pero es genticamente heterognea ya que mutaciones en otros genes como ZIC2, SIX3, TGIF y PATCHED tambin la causan. Por otro lado, las mutaciones del gen PTCH (localizado en 9q22.3) causan el Sndrome de Gorlin autosmico dominante (carcinoma nevoide de clulas basales), que adems cursa frecuentemente con polidactilia pre- o postaxial, o bien sindactilia del 3 y 4 dedos del pie. Finalmente, los factores de transcripcin GLI comparten el dedo de zinc de la protena codificada por el gen cubitus interruptus de Drosophila, y actan como activadores o represores de la va de transduccin de seales de SHH. Por ejemplo, el Sndrome de cefalopolisindactilia de Greig (polidactilia postaxial de manos, preaxial de pies, macrocefalia, frente prominente con hipertelorismo leve), de herencia autosmica dominante, se debe a haploinsuficiencia de GLI3 por mutaciones que destruyen el dedo de zinc de este gen, de manera que se produce activacin ectpica preaxial de SHH (GLI3 normalmente inhibe la actividad de la va SHH). En cambio, GLI3 tambin parece implicado en el Sndrome de Pallister-Hall (hamartomas hipotalmicos con malformaciones de extremidades), por mutaciones que respetan el dedo de zinc y por tanto mantienen constitutivamente la actividad represora sobre SHH. Un mecanismo similar parece implicado en la Polidactilia postaxial tipo A (en la que se ha identificado una mutacin de GLI3 que respeta el dedo de zinc). Por su parte, el Sndrome de Rubinstein-Taybi (retraso psicomotor y del crecimiento, dismorfismo facial, anomalas de los pulgares y, raramente, polidactilia preaxial de los pies) se debe a mutaciones en CBP: como GLI se transactiva a travs de un dominio de unin a CBP, la ausencia de ste factor provoca una expresin baja de GLI, que lleva a una expresin anormalmente elevada de SHH. -http://www.unav.es/asignatura/genmolhumbq/ 119 de 172

Gentica Molecular Humana (F.Ciencias)-

La Figura 9.6 ilustra la diferencia entre polidactilia post-axial (b) y pre-axial (c). Malformaciones del ojo. Los genes de la familia Pax codifican factores de transcripcin que contienen un dominio de unin al ADN de 128 aa con dos regiones de hlice-vuelta-hlice, llamado "paired domain" porque originalmente se encontr en el gen "paired" de Drosophila. Adems, los factores Pax3, Pax4, Pax6 y Pax7 tambin contienen un homeodominio. Las mutaciones en el dominio paired de PAX6 causan anomalas oculares (aniridia, anomala de Peters, distrofia corneal, catarata congnita e hipoplasia de la fovea). En estos casos, la aniridia (o, a veces, anoftalmia) parece depender de la dosis del gen PAX6, ya que los heterocigotos para la mutacin slo tienen aniridia pero en cambio los homocigotos padecen anoftalmia. Las mutaciones en PAX6 tambin son responsables de la aniridia del Sndrome WAGR, causado por una por una microdelecin en 11p13 que deleciona todo el gen PAX6 junto con WT1. Por lo que respecta al gen PAX3, algunas mutaciones en el mismo producen el Sndrome de Waardenburg tipo 1 (distopia cantorum, pigmentacin anormal y sordera sensorioneural), mientras que otras mutaciones en este mismo gen dan lugar al Sndrome de Klein-Waardenburg (lo anterior ms camptodactilia y malformaciones de las extremidades). Otro miembro de esta familia, el gen PAX8, est mutado en casos familiares de disgenesia tiroidea. Por su parte, las mutaciones que afectan al gen PAX2 causan una condicin autosmica dominante que incluye colobomas del nervio ptico, anomalas renales y reflujo vesico-ureteral. Inversin del sexo. El gen SRY controla el desarrollo de la gnada masculina y, lgicamente, se localiza en el cromosoma Y. La protena codificada por SRY contiene una caja HMG (High Mobility Group), que es un motivo de 79 aas por el que la protena se une al ADN y lo dobla hasta 130 grados, con lo que favorece la activacin de genes cercanos. Las mutaciones en SRY son causa de la aparicin de individuos con cariotipo XY que fenotpicamente se desarrollan como mujeres. Otros genes relacionados con SRY son los genes de la familia SOX; por ejemplo, SOX9 est mutado en una enfermedad autosmica dominante llamada Displasia campomlica (inversin de sexo en varones, arqueamiento congnito de huesos largos, paladar hendido, ausencia costillas y trax pequeo). Se piensa que las malformaciones esquelticas de la displasia campomlica se deben a que SOX9 es un factor de transcripcin que transactiva secuencias reguladoras que se encuentran en el primer intrn del gen COL2A1, que da lugar al colgeno tipo II. Por tanto, la falta de SOX9 lleva consigo una produccin insuficiente de cadenas alfa-1 del colgeno tipo 2, con las consiguientes malformaciones en huesos y cartlagos.

Tema 10. Diagnstico de enfermedades genticas


10.1. Estrategias generales de diagnstico de enfermedades genticas. 10.2. Mtodos de deteccin de mutaciones. 10.3. El proceso de diagnstico indirecto de enfermedades genticas. 10.4. Gentica forense. -http://www.unav.es/asignatura/genmolhumbq/ 120 de 172

Gentica Molecular Humana (F.Ciencias)-

10.1. Estrategias generales de diagnstico de enfermedades genticas


Como en cualquier otro tipo de patologas, el diagnstico de enfermedades genticas se realiza mediante la identificacin clnica de los sntomas y signos que caracterizan cada sndrome concreto, apoyado en datos de laboratorio. Con los avances del Proyecto Genoma Humano, hoy en da es posible, en muchos casos, analizar directamente la alteracin causal a nivel del ADN. De todas formas, en el entorno clnico nos encontramos varios problemas que pueden dificultar el diagnstico correcto. En primer lugar, la posible presencia de heterogeneidad gentica: varios genes pueden ser los responsables de una nica enfermedad. Esta circunstancia hace muy laborioso el estudio mutacional, ya que multiplica el nmero de exones que hay que analizar. Incluso en aquellos casos en los que se sabe con exactitud cul gen est alterado, puede suceder que las mutaciones responsables del cuadro clnico se distribuyan por todo el gen (fenmeno que algunos autores denominan heterogeneidad allica), de manera que sera necesario analizar toda la regin codificante antes de poder descartar o confirmar que el gen en cuestin est mutado. Lgicamente, si se trata de un gen de gran tamao, el anlisis se hace extremadamente laborioso. La situacin opuesta vendra dada por aquellas enfermedades genticas que estn causadas, en la gran mayora de familias, por una misma mutacin, de manera que podemos centrarnos en el estudio de esa mutacin concreta para confirmar o descartar el defecto molecular que provoca esa enfermedad. Por tanto, hemos de sopesar todas las circunstancias mencionadas para decidir si nos inclinamos por realizar lo que se denomina diagnstico directo (anlisis de un individuo para ver si es portador de la mutacin concreta que causa la enfermedad en esa familia), o si por el contrario aplicaremos el denominado diagnstico indirecto (anlisis de marcadores genticos en la familia para ver si el consultando ha heredado el cromosoma que lleva la mutacin). A continuacin discutiremos las ventajas e inconvenientes de cada una de estas aproximaciones diagnsticas, as como los mtodos ms habitualmente empleados. El video de la Figura 10.1 explica las dos estrategias diagnsticas para detectar alteraciones genticas en enfermedades humanas.

10.2. Mtodos de deteccin de mutaciones


Como hemos dicho, el diagnstico directo consiste en el estudio de un gen —cuya implicacin en el desarrollo de una enfermedad ya ha sido demostrada— para detectar la presencia de posibles mutaciones en el mismo. En aquellos casos en que las mutaciones patognicas pueden estar localizadas a lo largo de toda la secuencia codificante del gen (heterogeneidad allica fuerte), se deben utilizar mtodos "de barrido", que examinan cada exn por separado para detectar simplemente si existe una mutacin o no. Estos mtodos no identifican el tipo de mutacin, pero nos permiten descartar rpidamente todos aquellos exones normales, para centrarnos en el estudio de los exones mutados. En cambio, cuando queremos detectar una mutacin concreta, porque ya sabemos que es sta mutacin la que origina la enfermedad en esta familia, utilizaremos mtodos dirigidos a identificar nicamente esa mutacin (mtodos "de confirmacin"). stos ltimos son quizs los mtodos ms utilizados en el contexto de un laboratorio diagnstico, especialmente en aquellas enfermedades que tienen una heterogeneidad allica limitada, es decir, enfermedades en las que un pequeo nmero de mutaciones causan la inmensa mayora de los casos. Los ejemplos ms notorios son la mutacin C282Y (que causa la mayora de los casos de Hemocromatosis Hereditaria en europeos); la mutacin F508del, responsable de hasta el 80% de los casos de Fibrosis Qustica en individuos nor-europeos; la inversin de los exones 1-22 del gen del Factor VIII de la coagulacin (responsable de un 50% de los casos de hemofilia A); la mutacin G380R del gen FGFR3 (que causa la mayora de los casos de Acondroplasia), las mutaciones N370S y L444P (que detectan la mayora de los casos de Enfermedad de Gaucher), o las enfermedades por expansin de trinucletidos (Enfermedad de Huntington, Sndrome del X Frgil, etc). A continuacin analizaremos algunos de los mtodos ms utilizados en el diagnstico directo, tanto mtodos de barrido como de confirmacin.

-http://www.unav.es/asignatura/genmolhumbq/

121 de 172

Gentica Molecular Humana (F.Ciencias)-

1. MTODOS DE BARRIDO para la deteccin rpida de mutaciones (sin identificar el tipo concreto de mutacin). Excepto en el primero (SSCP) estos mtodos se basan en la deteccin de heteroduplexes, que se forman por la reasociacin lenta de las cadenas tras la desnaturalizacin del fragmento de ADN. Cuando el fragmento contiene una mutacin y se mezcla con un ADN normal, la desnaturalizacin-reasociacin da lugar a molculas heteroduplex portadoras de un desemparejamiento (mismatch) precisamente en el nucletido donde est la mutacin. SSCP (Single Strand Conformation Polymorphism, Polimorfismo de la Conformacin de Cadenas Sencillas). Un cambio en la secuencia provoca cambios conformacionales cuando el ADN se desnaturaliza (se separan las dos cadenas) y se deja que cada cadena se repliegue por separado. Estos cambios conformacionales se detectan porque alteran la migracin electrofortica en geles de poliacrilamida no-desnaturalizantes. En el ejemplo tpico, se amplifica un exn mediante PCR, se desnaturaliza el producto de PCR por calor, se cargan los productos desnaturalizados en un gel de acrilamida, se realiza la electroforesis y se tie el gel mediante una tincin especfica para el ADN (tincin de plata, por ejemplo). Si no hay mutaciones, se detectarn nicamente las bandas correspondientes al homodplex (resultado de la reasociacin parcial de las dos cadenas complementarias durante la electroforesis) y las bandas correspondientes a cada una de las cadenas sencillas que se han replegado adoptando una conformacin determinada. En cambio, la presencia de una mutacin dar lugar a nuevas bandas debidas al patrn de plegamiento de las cadenas sencillas mutantes, que ser diferente al de las cadenas nativas. Como hemos comentado, este anlisis no nos dice de qu tipo de mutacin se trata: para eso es necesario secuenciar este producto de PCR y compararlo con la secuencia normal. La ventaja es que nos permite descartar la presencia de mutaciones rpidamente, lo que ahorra tiempo y recursos. Figura 10.2 Video que explica grficamente la tcnica de SSCP. DGGE (Denaturing Gradient Gel Electrophoresis, Electroforesis en Gel con Gradiente Desnaturalizante) y sus variantes, entre las que destaca TGGE (Temperatura Gradient Gel Electrophoresis). Esta tcnica se basa en someter una muestra de ADN a una electroforesis en geles de acrilamida con un gradiente desnaturalizante qumico o trmico, de manera que la muestra se encuentra con condiciones cada vez ms desnaturalizantes a medida que avanza por el gel. Las muestras de ADN son productos de PCR (exones, habitualmente) en cuyo extremo hay una regin corta muy rica en citosinas y guaninas (regin llamada "clamp" o "pinza" GC), de forma que la temperatura de desnaturalizacin de esta pequea regin es mayor que la del resto del fragmento. Por tanto, cuando el fragmento va avanzando por el gel, llegar un momento en que se desnaturaliza todo excepto la regin del clamp-GC. El resultado es que el fragmento se frena y deja de avanzar por el gel. Cuando la muestra de ADN es un heteroduplex que contiene un desemparejamiento, su punto de desnaturalizacin ser distinto al del fragmento nativo, y por tanto se parar en un punto distinto del gel. Esto se reflejar en la aparicin de una banda con distinta migracin electrofortica. La Figura 10.3 ilustra mediante un video el fundamento de las tcnicas que detectan la presencia de heterodplex, con ejemplos de DGGE y TGGE. DHPLC (Denaturing HPLC) es una tcnica en la que los heteroduplex y homoduplex son separados en un aparato de HPLC (High Performance Liquid Chromatography) utilizando un gradiente desnaturalizante de acetonitrilo y variando la temperatura de la columna. La muestra se injecta en una columna de cromatografa y el ADN se une a la matriz. El acetonitrilo deshace estas interacciones y el ADN eluido se detecta a la salida de la columna midiendo la absorbancia a 260 nm, originando un pico a un tiempo de elucin caracterstico. En temperaturas bajas, no desnaturalizantes, la concentracin de acetonitrilo necesaria para eluir un fragmento depende del tamao y la secuencia del mismo, por lo que cada fragmento da lugar a un pico de elucin caracterstico. Al aumentar la temperatura de la columna, la elucin tiene lugar a concentraciones menores de acetonitrilo, a medida que el fragmento comienza a desnaturalizarse. Como los heteroduplex se desnaturalizan a -http://www.unav.es/asignatura/genmolhumbq/ 122 de 172

Gentica Molecular Humana (F.Ciencias)-

temperaturas distintas a los homoduplex, generan picos a tiempos de elucin diferentes. De este modo es posible detectar mutaciones puntuales. La gran ventaja del DHPLC es su rapidez, ya que los tiempos de elucin tpicos estn en torno a los 5 minutos y una muestra se puede analizar en 10 minutos. Por tanto, conserva la gran sensibilidad de los mtodos de deteccin de heteroduplex que utilizan un gradiente desnaturalizante (temperatura, en este caso), pero tiene una procesividad mucho mayor y es fcilmente automatizable.

La figura 10.4 presenta ejemplos del anlisis mediante DHPLC. En la imagen se puede ver el anlisis de dos muestras (una muestra normal y una muestra con una mutacin) del exn 12 del gen JAK2, analizadas a dos temperaturas distintas. Tanto a 56C como a 56,4C se puede distinguir la muestra normal de la muestra que lleva la mutacin, que presenta dos pequeos picos antes del pico principal. Los picos pequeos corresponden a los heterodplex, y slo aparecen si en el ADN original hay una mutacin. Rotura de Desemparejamientos (Mismatch Cleavage). Es un mtodo basado en el hecho de que determinados tratamientos qumicos o enzimticos son capaces de romper un fragmento de ADN especficamente en el punto donde existe un desemparejamiento. Como hemos dicho, los heteroduplexes son portadores de un desemparejamiento (mismatch) precisamente en el nucletido donde est la mutacin. Por tanto, el tratamiento con determinadas sustancias romper el fragmento slo en el caso de que existan desemparejamientos, de forma que una electroforesis en gel ser suficiente para comprobar la presencia de una mutacin. PTT (Protein Truncation Test, Prueba de truncamiento de protenas). Es un mtodo especialmente dirigido a la deteccin de mutaciones que crean un codn de parada prematuro y provocan el truncamiento de la protena. Para llevar a cabo esta prueba, se prepara ADNc mediante RT-PCR (PCR tras transcripcin reversa del ARN del paciente) utilizando un cebador que contiene la secuencia del promotor del fago T7 y la secuencia consenso de inicio de la traduccin (secuencia de Kozak). Esta construccin permite realizar la transcripcin y traduccin in vitro, a partir del producto de la RT-PCR. El anlisis en un gel de acrilamida de los fragmentos proteicos que resultan de la transcripcin/traduccin revelar la presencia de una banda correspondiente al tamao esperado para la secuencia nativa, o bien otras bandas de menor tamao correspondientes a todas las posibles mutaciones que provoquen un truncamiento del producto proteico (mutaciones sin sentido, los cambios del marco de lectura y las mutaciones que afectan a las secuencias de ayuste). El video de la Figura 10.5 ilustra el fundamento de la tcnica de PTT. Secuenciacin. Hoy en da, con la aparicin de equipos fluorescentes automatizados y con bajo coste por reaccin, la secuenciacin directa de productos de PCR (exones, o incluso la secuenciacin directa de un ADNc obtenido por RT-PCR) es un mtodo cada vez ms popular de deteccin de mutaciones. Tiene la ventaja de que identifica el tipo de mutacin, y de hecho es un paso obligado para identificar -http://www.unav.es/asignatura/genmolhumbq/ 123 de 172

Gentica Molecular Humana (F.Ciencias)-

las mutaciones detectadas por los mtodos de barrido que acabamos de explicar. Sin embargo, slo es realmente fiable cuando el ADN mutado est en una proporcin superior al 15-20% del total de ADN presente en la muestra. Aunque esto se cumple en las enfermedades hereditarias, no es as cuando se trabaja con muestras procedentes de tumores, en las que con frecuencia la cantidad de clulas tumorales es baja y no todas son portadoras de una mutacin concreta (por lo que el nmero de molculas mutadas puede ser inferior al 15% del total).

La figura 10.6 muestra una mutacin detectada mediante secuenciacin en el nucletido 97 de este fragmento, cuya secuencia normal se representa en el electroferograma superior. Debajo de l vemos la secuenciacin de una muestra de un paciente, con dos picos (correspondientes a timina y citosina) en esa posicin. La herramienta informtica detecta automticamente este tipo de alteraciones y nos alerta sobre la presencia de una posible mutacin (figura inferior). Cada uno de los mtodos de barrido que hemos visto tiene sus ventajas e inconvenientes, sobre todo en lo referente a la sensibilidad (porcentaje de mutaciones que son capaces de detectar), coste, complejidad tcnica, capacidad de especificar la posicin de la mutacin, etc. Aunque las caractersticas de cada mtodo se presentan resumidas en la siguiente tabla, la eleccin de un mtodo u otro depender de las peculiaridades de cada laboratorio, del gen que se quiera estudiar, los medios disponibles y la experiencia previa con cada uno de los mtodos.

MTODO

VENTAJAS

INCONVENIENTES

Secuenciacin

Detecta todas y especifica la posicin.

Excesiva informacin, coste alto, laboriosa.

Sencillo. SSCP Buena sensibilidad.

Secuencias <400bp. No especifica posicin.

-http://www.unav.es/asignatura/genmolhumbq/

124 de 172

Gentica Molecular Humana (F.Ciencias)-

Cierta complejidad. DGGE y DHPLC Muy alta sensibilidad. No especifica posicin.

Rotura de Desemparejamientos

Muy alta sensibilidad. Puede especificar posicin.

Gran dificultad tcnica. Toxicidad OsO4.

Alta sensibilidad. PTT Especifica la posicin.

No todos los tipos de mutaciones. Complejidad tcnica, coste.

2. MTODOS DE COMPROBACIN para detectar de la existencia de una mutacin especfica: PCR-Digestin. El fundamento de esta tcnica reside en el hecho de que la mutacin crea o destruye una diana de restriccin, de modo que la simple digestin del producto de PCR con el enzima de restriccin permite determinar, en un gel de agarosa, el patrn de digestin indicativo de la presencia o ausencia de la mutacin. Es un mtodo que, por su sencillez y rapidez, es uno de los ms utilizados en laboratorios clnicos. La principal limitacin, lgicamente, es que no todas las mutaciones alteran una diana de restriccin. Figura 10.7 El video explica el proceso de deteccin de una mutacin especfica mediante la digestin de un producto de PCR con enzimas de restriccin. ASO (Allele Specific Oligonucleotide, Oligonucletido Especifico de Alelo). Una tcnica bastante utilizada en los primeros aos del diagnstico molecular, aunque hoy en da ha cado en cierto desuso. Se basa en el diseo de sondas especficas para el alelo mutado y para el alelo nativo, utilizando oligonucletidos. El tamao de las sondas hace que su Tm (temperatura de desnaturalizacin) sea lo suficientemente distinta para que &mdash;en determinadas condiciones de hibridacin&mdash; la sonda especfica del alelo normal hibride solamente con ADN normal, y la sonda especfica del alelo mutado hibride especficamente con ADN genmico que contiene la mutacin. El ADN de los pacientes (puede ser tanto ADN genmico como un exn amplificado mediante PCR) se deposita en membranas de nylon haciendo un "dot-blot", y esas membranas se hibridan con cada una de las sondas (oligonucletidos marcados con radioactividad o con fluorescencia). El anlisis de la hibridacin de cada sonda permite identificar si la muestra contiene un solo alelo mutado (heterocigoto), dos alelos mutados (homocigoto para la mutacin), o ninguno (homocigoto sano). ARMS (Amplification Refractory Mutation System, Sistema de Mutacin Resistente a la Amplificacin) est basada en el mismo principio que ASO, es decir, la utilizacin de oligonucletidos especficos para la secuencia normal y para la secuencia mutada. La diferencia estriba en que, en el caso del ARMS, estos oligonucletidos son cebadores de PCR. Se disean, por tanto, dos reacciones de PCR que comparten un mismo cebador comn pero se diferencian en los cebadores especficos para cada alelo: un cebador amplificar slo el alelo normal, el otro cebador amplificar slo el alelo mutado. Dada la rapidez y sencillez de la PCR, esta tcnica est desplazando cada vez ms a la tcnica de ASO. OLA (Oligonucleotide Ligation Assay, Ensayo de Ligacin de Oligonucletidos). Se trata de un mtodo algo ms laborioso, pero que &mdash;una vez optimizado&mdash; permite analizar gran nmero de muestras con rapidez y fiabilidad. Se basa en la ligacin de dos oligonucletidos, uno de los cuales est marcado con biotina y el otro con una molcula radioactiva o fluorescente. El punto crucial es el diseo de ambos oligonucletidos a ambos lados de la base mutada. Por ejemplo, un diseo habitual es que ambos oligos hibriden sobre la secuencia normal, de modo que la mutacin -http://www.unav.es/asignatura/genmolhumbq/ 125 de 172

Gentica Molecular Humana (F.Ciencias)-

impida la hibridacin de uno de ellos. Como consecuencia, la reaccin de ligacin slo ser efectiva en presencia de una secuencia normal. Cuando se separan las sondas y se unen por los residuos de biotina a un soporte que contiene estreptavidinas, slo las molculas completas (fruto de la ligacin de los dos oligos) emitirn la seal correspondiente al marcador (radioactividad o fluorescencia). Por el contrario, el ADN de un sujeto homocigoto para la mutacin no dar ninguna seal. En principio, este mtodo tambin permite detectar los individuos heterocigotos para la mutacin, ya que la intensidad de la seal emitida ser la mitad de la de un individuo homocigoto normal. El mtodo de OLA permite la automatizacin y la cuantificacin de la seal cuando se utilizan marcadores fluorescentes, lo que le convierte en un buen mtodo para el anlisis de gran cantidad de muestras. MLPA (Multiplex Ligation-dependent Probe Amplification) es una modificacin del OLA que permite determinar el nmero de copias de hasta 45 genes en un solo ensayo, pudiendo discriminar secuencias que difieren en un solo nucletido. MLPA utiliza, para cada gen, dos sondas: una de ellas es complementaria a la secuencia que se quiere estudiar (21-30 nucletidos), a la que se aade la secuencia de un cebador universal en el extremo 5'; la otra sonda de la pareja tiene otra secuencia complementaria a la diana, un ADN de relleno &#8213;que puede ser de distintos tamaos&#8213; y la secuencia de otro cebador universal en el extremo 3'. Ambas sondas hibridan a ambos lados de la secuencia diana, y son ligadas por una ligasa termoestable. Con un solo cebador se pueden amplificar las sondas que se han ligado correctamente. Utilizando secuencias de relleno de distintos tamaos para cada gen, podemos amplificar en una misma reaccin muchos fragmentos distintos, lo que ahorra mucho tiempo y reactivos. Adems, como las condiciones de reaccin son las mismas, la cantidad final de producto es proporcional a la cantidad inicial de ADN, por lo que los resultados de MLPA pueden ser cuantificados. Por tanto, MLPA permite detectar deleciones y amplificaciones, adems de detectar mutaciones. La figura 10.8 resume, en un video, los principios generales de varios mtodos para la deteccin de mutaciones especficas, basados en la utilizacin de oligonucletidos especficos. Un comentario final a todas estas tcnicas de anlisis directo es que pueden aplicarse a ADN procedente de distintos tipos de muestra, ya que trabajan con secuencias amplificadas mediante PCR. Por tanto, es posible detectar la presencia de mutaciones no slo en ADN de sangre perifrica, sino tambin en raspados bucales, vellosidades coriales, cabello, biopsias, material incluido en bloques de parafina o incluso de tarjetas impregnadas con manchas de sangre (tarjetas de Guthrie, por ejemplo).

10.3. El proceso de diagnstico indirecto de enfermedades genticas


Como ya se ha mencionado al principio de este captulo, hay ocasiones en las que no es posible, o resulta muy poco prctico, llevar a cabo diagnstico directo. Esto sucede en aquellos casos en los que no se conoce la secuencia del gen causante de una enfermedad, o cuando ste es excesivamente grande y complejo (compuesto por muchos exones, por ejemplo). En estos casos todava podemos predecir si un individuo ha heredado la enfermedad, estudiando marcadores especficos que nos permitan identificar cul cromosoma de los progenitores es el que lleva la mutacin. Una vez identificado, simplemente hemos de ver qu cromosomas han heredado los hijos, para predecir la probabilidad de que tambin hayan heredado la mutacin. Como no estudiamos directamente el gen, sino marcadores genticos que nos ayudan a identificar los cromosomas, se denomina a este proceso "Diagnstico Indirecto". Para comprender el diagnstico indirecto es necesario repasar los conceptos generales de ligamiento gentico y su aplicacin a familias humanas que han sido expuestos en el Captulo 4. A veces nos enfrentamos con una enfermedad gentica cuyo gen causal no ha sido todava identificado, lo que obviamente impide realizar diagnstico directo. En otras ocasiones, an conociendo el gen que debe estar mutado, resulta impracticable realizar estudios de diagnstico directo en la rutina de un laboratorio clnico, por la gran heterogeneidad allica que muestra esa enfermedad (un gran nmero de posibles mutaciones pueden ser las responsables del cuadro clnico), o en genes con una estructura exnica muy compleja. Un ejemplo bastante claro es la Distrofia Muscular de Duchenne (DMD), debida a mutaciones en el gen de la distrofina. Este gen es muy grande (ARNm de 14 kb) y tiene 79 exones distribuidos a lo largo -http://www.unav.es/asignatura/genmolhumbq/ 126 de 172

Gentica Molecular Humana (F.Ciencias)-

de 2,3 Megabases de ADN genmico, por lo que el estudio mutacional de cada exn sera excesivamente laborioso. En este tipo de situaciones, una alternativa muy utilizada es la de establecer si el probando ha heredado el cromosoma o los cromosomas parentales que llevan el gen mutado, o si por el contrario ha heredado los cromosomas parentales normales. Para hacer esto se sigue un proceso denominado "gene tracking", algo as como "seguir la pista" a los alelos enfermos en una familia concreta. Esto se hace utilizando marcadores polimrficos situados muy cerca o incluso dentro del gen en cuestin, escogiendo aquellos marcadores que sean informativos en cada familia concreta. Los marcadores son del mismo tipo que los utilizados en el anlisis de ligamiento (RFLP, microsatlites). Utilizando esta estrategia podemos saber si un individuo ha heredado una mutacin de su progenitor enfermo simplemente determinando si ha heredado el cromosoma mutado de ese progenitor. Lgicamente, esta estrategia es vlida siempre que no haya habido ninguna recombinacin entre el locus de la enfermedad y el locus del marcador, de ah que utilicemos marcadores tan cercanos al gen que la frecuencia de recombinacin sea prcticamente cero. De hecho, la metodologa empleada es la misma que en los estudios de ligamiento, pero vara la manera de utilizar la informacin obtenida: mientras en los estudios de ligamiento queremos determinar la distancia entre dos loci, en el anlisis indirecto ya sabemos cul es esa distancia (y conocemos por tanto la frecuencia de recombinacin) y simplemente utilizamos esa informacin para determinar cul cromosoma ha sido transmitido por cada progenitor a un individuo concreto de la descendencia. El proceso general que se sigue en el diagnstico indirecto es el siguiente: a) distinguir los dos cromosomas en cada uno de los progenitores: para esto es imprescindible encontrar un marcador para el que ambos progenitores sean heterocigotos (a poder ser no idnticos), de manera que esta familia sea totalmente informativa. b) resolver la fase de ligamiento en el individuo transmisor: esto supone ser capaces de determinar cul de los alelos del marcador segrega con el alelo de la enfermedad (y "viaja", por tanto, en el mismo cromosoma). Para esto hay que estudiar a los progenitores del individuo transmisor o a su descendencia y deducir la fase de ligamiento entre el marcador y el gen. Nuevamente, una recombinacin entre ambos loci (enfermedad y marcador) llevara a resultados errneos, de ah la importancia de usar marcadores cercanos al gen (o intragnicos) de modo que la frecuencia de recombinacin entre ambos sea despreciable. c) Determinar el alelo del marcador que ha sido transmitido al probando. Esto nos dir (con una fiabilidad mayor o menor dependiendo de la fraccin de recombinacin entre el marcador y el gen) si se ha transmitido el cromosoma con el alelo mutado o el alelo normal. Aqu se hace evidente la enorme utilidad del diagnstico indirecto: permite establecer si un individuo ha heredado la mutacin sin necesidad de detectar directamente la presencia de la misma. Como hemos comentado, su gran limitacin viene dada porque en ocasiones los marcadores estn a cierta distancia del locus de la enfermedad y las predicciones no son fiables al 100%. Por ejemplo, si la distancia entre el marcador y el locus de la enfermedad fuese de 5 cM (lo que supone una frecuencia de recombinacin del 5%), la fiabilidad del anlisis slo sera del 95%, ya que en un 5% de los casos podra haberse dado un sobrecruzamiento entre ambos loci que hubiese trasladado el alelo mutado al cromosoma homlogo. En la prctica, solventamos esta limitacin mediante el uso de varios marcadores, preferiblemente situados a ambos extremos del locus de la enfermedad. De esta forma, la nica posibilidad de error sera un doble sobrecruzamiento entre el locus de la enfermedad con cada uno de los marcadores, pero la probabilidad de que esto suceda es prcticamente despreciable. Lgicamente, a mayor nmero de marcadores, mayor fiabilidad de los resultados, sobre todo si adems se incluyen marcadores situados dentro del propio gen de la enfermedad. La figura 10.9 explica, mediante un video, el proceso general del diagnstico indirecto utilizando marcadores polimrficos en ligamiento con el gen responsable de una enfermedad gentica.

10.4. Gentica forense


Los polimorfismos del ADN que se han estudiado en el Tema 1 tienen una aplicacin prctica muy concreta: como son nicos para cada persona, pueden utilizarse para identificar un muestra biolgica como -http://www.unav.es/asignatura/genmolhumbq/ 127 de 172

Gentica Molecular Humana (F.Ciencias)-

perteneciente a un individuo concreto. Desde que Alec Jeffreys desarroll el concepto de huella dactilar gentica (genetic fingerprint), el anlisis de polimorfismos se ha convertido en una herramienta esencial en medicina legal y forense: pruebas de paternidad, identificacin del culpable de un crimen, identificacin de restos humanos, etc. En 1985, Alec Jeffreys descubri sondas de ADN que hibridaban con minisatlites distribuidos en varios loci por el genoma humano (conocidos tambin como VNTR: Variable Number of Tandem Repeats). Aunque utilizaba un sonda frente a un VNTR del gen de la mioglobina que no es polimrfico, al hibridar mediante Southern blot en condiciones poco restrictivas la sonda se una a otros minisatlites que s son polimrficos en la secuencia GGAGGTGGGCAGGARG. Esto llev al desarrollo de sondas multilocus, que dan patrones de bandas complejos y nicos para cada individuo. El problema del Southern blot es que requiere grandes cantidades de ADN, por lo que no puede utilizarse en algunos escenarios forenses en los que slo se cuenta con una pequea muestra (un pelo, saliva, etc). La llegada y popularizacin de la tcnica de PCR a finales de los aos 80 hizo posible estudiar pequeas cantidades de ADN, pero no es aplicable a los minisatlites debido a su gran tamao. Por ello, se introdujo el anlisis de otro tipo de polimorfismos, los microsatlites (tambin llamados STR: Short Tandem Repeats ). Se trata de marcadores de un solo locus, pero la combinacin de un nmero relativamente bajo de microsatlites (entre 10 y 15) permite llegar a niveles de confianza muy altos cuando se comparan dos muestras de ADN.

Figura 10.12 Anlisis de VNTR en muestras de ADN de una mancha de sangre y de varios sospechosos. El mdulo Human Identification de esta animacin muestra todo el proceso de anlisis de microsatlites utilizado en medicina legal y forense. Es muy importante comprender cmo se establece la fiabilidad de esta tecnologa. En primer lugar, la comparacin de perfiles de ADN permite excluir que dos muestras sean idnticas, y por tanto se puede decir con total certeza que un individuo no ha dado lugar a la muestra obtenida en la escena del crimen, por ejemplo. En cambio, nunca se puede decir con total certeza que el sospechoso sea culpable aunque los perfiles genticos de ambas muestras sean idnticos, porque existe la posibilidad de que otra persona (en el -http://www.unav.es/asignatura/genmolhumbq/ 128 de 172

Gentica Molecular Humana (F.Ciencias)-

mundo, o en ese pas) tenga ese mismo perfil gentico. Por tanto, esto debe expresarse siembre como la probabilidad de encontrar otra persona (distinta del sospechoso) con ese mismo perfil gentico. Es decir, lo que se trata de establecer es la probabilidad de que el acusado sea inocente a pesar de que su perfil gentico coincida con el obtenido en la escena del crimen. Es muy importante comprender que no se trata de establecer la probabilidad de que el perfil gentico del sospechoso coincida con la muestra, si es inocente. Esta confusin, conocida como la falacia del fiscal ya que puede confundir a un jurado, puede explicarse con el siguiente ejemplo. Un determinado perfil gentico (una combinacin de varios microsatlites) tiene una determinada probabilidad en una poblacin concreta, dependiendo de las frecuencias allicas de esos polimorfismos en esa poblacin. Esa probabilidad se calcula como se ha explicado en la Figura 10.12. Suponiendo que dicha probabilidad es 1 en 106, un fiscal podra intentar convencer al jurado de que un sospechoso con ese perfil gentico tiene una probabilidad de una en un milln de ser inocente, pero esto no es as. Si en esa poblacin hay, por ejemplo, 20 millones de posibles culpables, resulta que podramos encontrar por azar 20 individuos con ese mismo perfil gentico, de los cuales obviamente slo uno puede ser el culpable. Por tanto, la probabilidad real de que el sospechoso sea culpable es de 1 por cada 20 incluso cuando su perfil gentico coincide con la muestra obtenida en la escena del crimen. Dicho de otro modo, tiene una probabilidad de 19 sobre 20 de ser inocente aunque su perfil gentico coincida con el obtenido en la escena del crimen. En cualquier caso, hoy en da se obtienen perfiles con probabilidades de aparicin por azar muy bajas (en torno a 10-15), por lo que resultan muy fiables. Los perfiles genticos tambin pueden utilizarse para la identificacin de restos humanos y establecer su parentesco con otros restos o con personas vivas. En estos casos suelen utilizarse polimorfismos del cromosoma Y o del ADN mitocondrial, por la razn de que se heredan exclusivamente por va paterna (el cromosoma Y) o materna (el ADN mitocondrial). El caso ms conocido es el estudio de los restos de la familia real rusa que aparecieron en una fosa en Siberia, y el juicio que se desarroll en Alemania en torno a la identidad de una mujer que deca ser Anastasia, la hija perdida del zar asesinado. Aos despus, el estudio de los restos seos, comparando su ADN mitocondrial con el de miembros vivos de otra casa real que compartan un ancestro femenino, demostr que esa mujer no poda haber sido la hija de Nicols II. Figura 10.13 El mdulo Recovering the Romanovs de esta animacin muestra cmo se utiliz el ADN mitocondrial para establecer la identidad de los restos de la familia real rusa. Como se ha estudiado en el Tema 1, actualmente disponemos de un catlogo amplsimo de otro tipo de marcador gentico, los SNP. Hoy en da estos marcadores tambin se utilizan en gentica forense, ya que algunos de ellos estn fuertemente asociados con ciertos rasgos fenotpicos (color de los ojos, color del pelo, estatura, etc.) o con la procedencia geogrfica. Por ejemplo, estudiando unos pocos SNPs de una muestra annima se puede decir con bastante fiabilidad el origen geogrfico o el color de los ojos de esa persona, y esto a veces ayuda en el terreno legal o forense. Los avances realizados en gentica forense han llevado a los gobiernos de distintos pases a poner en marcha bases de datos con perfiles genticos de segmentos de la poblacin ms o menos amplios, lo cual tiene implicaciones tica, legales y sociales de cierta envergadura. En Estados Unidos, el FBI comenz en 1998 una base de datos llamada CODIS (Combined DNA Index System), con ms de dos millones de perfiles de 13 microsatlites, procedentes de individuos que han sido condenados por algn delito o de escenas criminales. En el Reino Unido, el National DNA Database (NDNAD) puede incluir el perfil gentico (10 microsatlites) de cualquier ciudadano que sea arrestado por algn delito, aunque despus sea declarado inocente. Segn la polica britnica, esta informacin ha ayudado a esclarecer ms de 300.000 crmenes desde su creacin en 1998.

Tema 11. Gentica Clnica


11.1. Gentica clnica y consejo gentico. 11.2. Enfermedades de herencia autosmica. -http://www.unav.es/asignatura/genmolhumbq/ 129 de 172

Gentica Molecular Humana (F.Ciencias)-

11.3. Estructura de los cromosomas sexuales humanos. 11.4. Inactivacin del cromosoma X. 11.5. Enfermedades de herencia ligada al X. 11.6. Enfermedades por alteracin del ADN mitocondrial. 11.7. Aplicacin del teorema de Bayes al clculo de riesgos genticos. 11.8 Diagnstico prenatal.

11.1. Gentica clnica y consejo gentico


La gentica clnica se ocupa del diagnstico y atencin de las personas y familias en las que aparece una enfermedad gentica. Incluye varios aspectos, algunos de ellos algo diferentes de la prctica mdica habitual: Diagnstico correcto de la enfermedad, de lo contrario el clculo de riesgos genticos no tiene sentido. Para ello, adems de los mtodos clsicos de diagnstico, es importante realizar bien el diagnstico molecular y reconstruir la historia familiar detallada. La aplicacin de los principios de la gentica mendeliana permite calcular el riesgo de recurrencia de la enfermedad en la misma familia y establecer el pronstico, lo cual lleva a iniciar medidas de diagnstico precoz y de prevencin en individuos de riesgo (antes de la aparicin de los sntomas). Por todo esto, la gentica clnica es un pilar bsico de la medicina predictiva" del futuro. Un elemento fundamental es el consejo gentico, que, segn la definicin de la Sociedad Americana de Gentica Humana (1975) "es un proceso de comunicacin que trata de los problemas humanos asociados con la ocurrencia, o riesgo de ocurrencia, de un transtorno gentico en una familia. Este proceso requiere que una o ms personas adiestradas de forma apropiada ayuden al individuo o familia a: 1) comprender los hechos mdicos, incluyendo el diagnstico, la evolucin probable del transtorno y el tratamiento disponible; 2) apreciar el modo en que la herencia contribuye al transtorno y el riesgo de recurrencia en parientes concretos; 3) comprender las alternativas para enfrentarse al riesgo de recurrencia; 4) escoger un curso de accin que les parezca apropiado a la vista de su riesgo, sus objetivos familiares y sus normas ticas y religiosas, y actuar de acuerdo con la decisin tomada, y 5) procurar la mejor adaptacin posible a la enfermedad en un miembro afectado de la familia y/o al riesgo de esta enfermedad". En contraste con el mtodo mdico tradicional, en el que el facultativo prescribe al paciente lo que debe hacer, entre profesionales de la Gentica Clnica existe un amplio consenso a favor de que el consejo gentico sea un proceso no-directivo, es decir, que sea el propio paciente o la familia los que decidan qu accin tomar en funcin de la informacin proporcionada por el facultativo. En este sentido, es importante comprender que la carga de una enfermedad gentica para el paciente y para la familia puede ser valorada de modo muy distinto de unos casos a otros, dependiendo de circunstancias diversas. Es importante explicar bien las posibilidades de modificar la carga gentica o el riesgo gentico, y poner a las familias afectadas en contacto con servicios sociales de apoyo, organizaciones de afectados por esa enfermedad, etc. Las dos herramientas bsicas de la gentica clnica son la realizacin de la historia familiar y la estimacin de riesgos genticos. La historia familiar intenta reconstruir el rbol familiar para identificar otros miembros del mismo que puedan estar afectados por la enfermedad. Adems, permite deducir el tipo de herencia y el riesgo de recurrencia. Se utilizan las reglas generales de construccin de rboles familiares, y adems es importante: Preguntar acerca de nacidos muertos abortos espontneos. Indagar la existencia de posible consanguinidad. -http://www.unav.es/asignatura/genmolhumbq/ 130 de 172

Gentica Molecular Humana (F.Ciencias)-

Tener en cuenta posibles casos de falsa paternidad. Recoger tambin informacin bsica de las ramas del rbol que parezcan no estar afectadas. Siempre es mejor registrar la fecha de nacimiento que la edad. Tener en cuenta que el diagnstico puede no ser acertado, sobre todo en el caso de individuos ya fallecidos. Por tanto, es importante examinar directamente, siempre que sea posible, a los individuos afectados; examinar a los presumiblemente sanos, para excluir que en realidad tengan una forma poco severa de la enfermedad; tratar de obtener toda la informacin posible de otros parientes ms lejanos. Por lo que respecta a la estimacin del riesgo gentico, se expresa siempre como una probabilidad, es decir en modo fraccional o en porcentaje (un riesgo de es igual a un riesgo del 50%). El riesgo gentico no es ms que la probabilidad de padecer la enfermedad que tiene un individuo concreto de la familia, probabilidad estimada a partir de los datos del rbol familiar que nos permiten deducir el tipo de herencia y aplicar las leyes mendelianas. Los patrones hereditarios tpicos se pueden reconocer al analizar el rbol genealgico de la familia en la que hay individuos enfermos, ya que cada tipo de herencia produce rboles familiares con unas caractersticas propias. Para la construccin de rboles familiares, llamados tambin "genealogas" "pedigrs" (por influencia del trmino ingls pedigree), se utilizan unos smbolos aceptados por convenio, y se construyen siguiendo unas reglas que hay que conocer.

La Figura 11.1 muestra los principales smbolos utilizados en la creacin de rboles genealgicos (genealogas o pedigrs). En estos rboles, una generacin se representa situando los miembros de la misma en horizontal, y cada nueva generacin se sita debajo de la anterior numerando las generaciones con nmeros romanos, tal y como se representa en la genealoga de la Figura 11.1. Como siempre, los cuadrados indican sexo masculino y los crculos sexo femenino, los smbolos vacos indican individuos sanos y los smbolos llenos corresponden a individuos enfermos. Ntense tambin los smbolos utilizados para indicar individuos fallecidos (smbolo cruzado por un lnea) o uniones consanguneas (doble lnea). La flecha indica el individuo que inicia el estudio gentico (el probando). Cuando no se quiere especificar el sexo de un individuo o de un colectivo, se representa mediante un rombo.

11.2. Enfermedades de herencia autosmica


Las enfermedades autosmicas dominantes suelen tener una frecuencia gnica muy baja (la prevalencia de estas enfermedades es habitualmente inferior a 1 por cada 1000 individuos), y por tanto los homocigotos -http://www.unav.es/asignatura/genmolhumbq/ 131 de 172

Gentica Molecular Humana (F.Ciencias)-

son extremadamente infrecuentes; de hecho, la homocigosidad para estas enfermedades es muchas veces letal y provoca abortos espontneos. El rbol tpico de una enfermedad autosmica dominante muestra individuos enfermos en todas las generaciones, afectando ambos sexos por igual. Cuando se ve una transmisin de padre enfermo a hijo varn, podemos descartar la presencia de una enfermedad ligada al cromosoma X. Para calcular el riesgo de padecer la enfermedad en la descendencia, se utilizan los cuadrados de Punnet, como se muestra en la siguiente figura para el caso de la unin entre un individuo heterocigoto enfermo (Aa) y un individuo sano (AA), pues este es el tipo de unin ms frecuente en estas enfermedades. Mediante el uso de estos diagramas es fcil concluir que la mitad de la descendencia sern heterocigotos enfermos (Aa), y la otra mitad homocigotos sanos (AA). Dos individuos sanos, si efectivamente son homocigotos (veremos alguna excepcin ms adelante), no pueden tener descendencia con la enfermedad.

En la Figura 11.2 se muestra el cuadrado de Punnet en enfermedades de herencia autonmica dominante, en la que el tipo de matrimonio ms frecuente es el de un individuo enfermo heterocigoto (un solo alelo mutado, representado por la letra minscula) con un individuo sano (homocigoto con dos alelos A normales). El 50% de la descendencia (cuadrados rojos) pueden ser homocigotos sanos, y el otro 50% (cuadrados verdes) sern heterocigotos enfermos. Por tanto, cualquier hijo o hija de una matrimonio de este tipo tiene una probabilidad del 1/2 de padecer la enfermedad y una probabilidad de 1/2 de ser sano. Ya se ha mencionado antes que es muy poco frecuente encontrar enfermos homocigotos (dos alelos mutados), pues esto exigira la unin de dos heterocigotos enfermos. Sin embargo, hay algunas enfermedades autosmicas dominantes en la que esto sucede con mayor frecuencia de lo habitual, debido a que tienen una frecuencia gnica ms alta de lo habitual (no son letales, sino de comienzo tardo, por lo que permiten llegar a la edad frtil, tener descendencia y propagar la mutacin). Un buen ejemplo de lo dicho es la Hipercolesterolemia familiar, una enfermedad autosmica dominante debida a mutaciones en el receptor de las LDL (lipoprotenas de baja densidad) que cursa con niveles altos de colesterol total y colesterol LDL, xantomas tendinosos, xantelasmas y aterosclerosis precoz. La enfermedad afecta a 1 de cada 500 individuos de la poblacin, y es causa del 5% de los infartos de miocardio que se producen antes de los 60 aos de edad. Como es una enfermedad que no altera la fertilidad, la frecuencia allica es alta (en torno a 1 de cada 1000 alelos presentes en la poblacin estn mutados) y no es raro encontrar individuos homocigotos (en torno a 1 por milln). Los homocigotos estn afectados con ms gravedad que los heterocigotos, mostrando niveles ms altos de colesterol y mayor riesgo de enfermedad coronaria. El anlisis molecular de los individuos enfermos y de los miembros de su familia permite predecir la gravedad de la enfermedad, establecer el riesgo en la descendencia y comenzar el tratamiento preventivo con dieta o frmacos hipolipemiantes. Tambin se pueden encontrar individuos homocigotos en enfermedades autosmicas -http://www.unav.es/asignatura/genmolhumbq/ 132 de 172

Gentica Molecular Humana (F.Ciencias)-

dominantes en las que existe una cierta predisposicin a las uniones entre individuos enfermos. Esto ltimo sucede, por ejemplo, en una enfermedad llamada acondroplasia. Los individuos que sufren esta enfermedad, dada su baja estatura, tienden a formar matrimonios entre ellos, lo que eleva la probabilidad de que aparezcan sujetos homocigotos. Las enfermedades autosmicas recesivas requieren, por definicin, que los individuos afectados sean homocigotos (dos alelos mutados) y, por tanto, sus progenitores son habitualmente portadores sanos heterocigotos. El rbol tpico de un patrn autosmico recesivo muestra generaciones con algn miembro afectado, separadas por generaciones en las que no hay ningn individuo enfermo, patrn muy poco probable en transtornos dominantes. Se encuentran individuos enfermos de ambos sexos, y es muy frecuente la presencia de uniones con-sanguneas (entre individuos que comparten un ancestro comn, como primos, primos segundos, etc).

Figura 11.3 En el caso de las enfermedades de herencia autosmica recesiva, es necesario que ambos progenitores sean al menos heterocigotos. En la descendencia, existe una probabilidad del 25% de ser homocigoto sano (cuadrado rojo), el 50% de ser heterocigoto (portador sano, cuadrados azules) y un 25% de ser homocigoto enfermo (cuadrado verde). Un buen ejemplo de enfermedad autosmica recesiva es la Fibrosis Qustica del Pncreas, enfermedad debida a mutaciones en el gen CFTR (Cystic Fibrosis Transmembrane Regulator), localizado en 7q31. La enfermedad afecta a 1 de cada 2.500 nacidos vivos de raza caucsica, lo que significa una frecuencia allica del 0,02 (2% de los alelos presentes en la poblacin estn mutados) y una frecuencia de portadores del 0,04 (1 de cada 25 individuos de la poblacin general son heterocigotos). La enfermedad surge por el mal funcionamiento de un canal de cloro, lo que provoca una mucoviscidosis (secreciones mucosas muy viscosas) que poco a poco conduce a la destruccin del tejido pulmonar y pancretico, adems de provocar obstruccin intestinal en algunos neonatos. Se conocen alrededor de 400 mutaciones diferentes en el gen CFTR, pero en poblaciones europeas un 70% de los casos se deben a la delecin F508del, que deleciona 3 bases sin cambiar el marco de lectura:
SECUENCIA NORMAL GAA AAT ATC ATC TTT GGT GTT Glu Asn Ile Ile Phe Gly Val F508del

-http://www.unav.es/asignatura/genmolhumbq/

133 de 172

Gentica Molecular Humana (F.Ciencias)-

GAA AAT ATC AT- --T GGT GTT Glu Asn Ile Ile Gly Val

Adems de F508del, hay otras mutaciones que causan Fibrosis Qustica y que se encuentran con frecuencia allica mayor a 1%, de modo que el anlisis de 8 mutaciones (incluyendo F508del) puede detectar hasta un 85-90% de los casos en poblaciones de origen europeo.

La Figura 11.4 muestra los rboles genealgicos tpicos de las enfermedades con herencia autonmica dominante y autonmica recesiva. El pedigr superior muestra una enfermedad con herencia autosmica dominante: todas las generaciones tienen individuos enfermos, afecta a ambos sexos por igual, y el porcentaje de enfermos es aproximadamente el 50% de la descendencia. El rbol inferior muestra una enfermedad de herencia autosmica recesiva: pocos individuos enfermos, saltando generaciones en las que no hay ninguno; el porcentaje medio de afectados es del 25%. Obsrvese la presencia de consanguinidad (matrimonio entre III-1 y III-2), tpico de estas enfermedades. -http://www.unav.es/asignatura/genmolhumbq/ 134 de 172

Gentica Molecular Humana (F.Ciencias)-

Hay una serie de fenmenos &mdash;muchos de los cuales ya se han mencionado&mdash; que complican la evaluacin de los rboles de enfermedades autosmicas dominantes y recesivas, y hacen que el clculo de los riesgos en la descendencia sea menos fiable. A continuacin se sealan los problemas ms frecuentes: Heterogeneidad gentica de locus. Ya se ha mencionado que muchas enfermedades hereditarias pueden estar causadas por mutaciones en genes distintos, y se han visto algunos ejemplos. Esto se manifiesta, habitualmente, en la aparicin de distintos patrones de herencia en familias diferentes. As, por ejemplo, hemos visto un tipo de enfermedad de Charcot-Marie-Tooth que sigue un patrn autosmico dominante (por duplicaciones del gen PMP22), pero tambin existen familias en las que esta enfermedad sigue un patrn ligado al sexo (por mutaciones en otro gen situado en el cromosoma X). Otro ejemplo notable es el Sndrome de Ehlers-Danlos, que puede estar causado por mutaciones en al menos 8 loci diferentes, dando lugar a familias con patrn autosmico dominante, autosmico recesivo o ligado al sexo recesivo, dependiendo del gen implicado en cada caso. Lgicamente, la identificacin del tipo de herencia en una familia concreta nos ayudar a predecir el gen afectado (y buscar mutaciones en el mismo, si es posible) y a estimar el riesgo de padecer la enfermedad en la descendencia. Penetrancia incompleta. Hasta ahora hemos dado por supuesto que siempre que un gen est mutado se desarrollar la enfermedad correspondiente. Por desgracia para el profesional de la Medicina (pero por suerte para los pacientes), esto no se cumple en el 100% de los casos. De hecho, no es infrecuente encontrar rboles en los que un individuo ha transmitido una enfermedad dominante sin haber estado l mismo afectado por dicha enfermedad. En la figura puede observarse una familia afectada por una enfermedad autosmica dominante en la que el individuo II-4 (sealado por la flecha) ha heredado y transmitido la mutacin, pero no ha llegado a desarrollar la enfermedad. Descartando la posibilidad de que se trate de una nueva mutacin que ha surgido en ese individuo, ya que esa misma enfermedad estaba ya presente en los progenitores, hemos de concluir que este individuo es portador de la mutacin pero no expresa la enfermedad. Este fenmeno se denomina "penetrancia incompleta", y es caracterstico de algunas enfermedades dominantes, como por ejemplo el Retinoblastoma hereditario. Expresividad variable. Muchas enfermedades hereditarias tienen manifestaciones clnicas complejas, con signos y sntomas que se pueden presentar en distintas combinaciones y con distinto grado de severidad. Se dice entonces que estas enfermedades tienen expresividad clnica variable. En algunos casos, como por ejemplo la Neurofibromatosis tipo 1, distintos miembros de una misma familia (todos con la misma mutacin), pueden tener manifestaciones clnicas de la enfermedad muy dispares. No tenemos hoy en da una explicacin clara para el fenmeno de la distinta expresividad de una misma mutacin, pero es probable que est originado por factores ambientales que influyen en el desarrollo de la enfermedad o por diferencias inter-individuales en otros genes que modifican la expresin del fenotipo.

-http://www.unav.es/asignatura/genmolhumbq/

135 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 11.5 En el rbol superior es evidente que la penetrancia de esta enfermedad no es del 100%, ya que el individuo II-2 ha transmitido la enfermedad (que haba recibido de su madre) pero no manifiesta la enfermedad. El pedigr inferior tiene smbolos partidos en cuadrantes, y sirve para ilustrar el concepto de expresividad variable. En una enfermedad con sintomatologa compleja, se puede indicar en cada cuadrante del smbolo el tipo de afectacin que sufre cada individuo. Por ejemplo, un cuadrante puede indicar afectacin renal, otro cuadrante indica afectacin neurolgica, etc. En este pedigr se observa que distintos individuos de la misma familia (que llevan, por tanto, la misma mutacin) expresan la enfermedad de modos diversos, indicados por los distintos cuadrantes de sus smbolos. Por lo que respecta al clculo de riesgos, podemos resumir: Las enfermedades de herencia autosmica dominante tienen, en general, frecuencias allicas muy bajas (<0,001) y por eso los individuos homocigotos (ambos alelos mutados) son muy raros. Lo normal es encontrar cruces entre un heterocigoto y un homocigoto sano, por lo que el riesgo en la descendencia es de 50% heterocigotos enfermos y 50% homocigotos sanos. Por eso, para cada hijo el -http://www.unav.es/asignatura/genmolhumbq/ 136 de 172

Gentica Molecular Humana (F.Ciencias)-

riesgo de recurrencia es del 50%, aunque siempre hay que tener en cuenta los factores que pueden modificar estos riesgos (penetrancia incompleta, expresividad variable, tasa de nuevas mutaciones). En enfermedades de herencia autosmica recesiva, ambos progenitores tienen que ser al menos portadores, por lo que en la descendencia habr 25% de enfermos (homocigotos con mutacin), 25% de sanos (homocigotos sin mutacin) y 50% de portadores sanos (heterocigotos). Por tanto, el riesgo de recurrencia es inicialmente (25%). Es importante recordar que la presencia de consanguinidad es un hecho muy frecuente en estas enfermedades. Ms raramente hay matrimonios entre un portador sano y un enfermo homocigoto, en cuyo caso se produce un patrn de herencia cuasi-dominante con 50% de enfermos y 50% de portadores sanos en la descendencia. Una causa frecuente de consulta en el caso de enfermedades de herencia autosmica recesiva es el matrimonio entre un portador y un individuo de otra familia distinta en la que no existe la enfermedad. Lgicamente, el riesgo final para la descendencia depender fundamentalmente de la probabilidad que tenga este individuo de ser portador, lo cual, a su vez, depende de la tasa de portadores en la poblacin general. Como se recordar, la ley de Hardy-Weinberg permite estimar esta tasa en funcin de la prevalencia de la enfermedad en esa poblacin. Figura 11.6 El video explica, con un ejemplo prctico, la herencia autosmica dominante que resulta del matrimonio entre un homocigoto enfermo y un portador heterocigoto sano de una enfermedad de herencia autosmica recesiva.

11.3. Estructura de los cromosomas sexuales humanos


Lo que ahora conocemos como cromosomas X e Y, formaban una pareja de autosomas hace aproximadamente 300 millones de aos. Los datos ms recientes apoyan la llamada "ley de Ohno" (formulada por Susumu Ohno en 1967), que dice que el primer paso en el proceso de creacin del dimorfismo de los cromosomas sexuales en mamferos fue la fijacin del gen responsable del desarrollo del sexo masculino en uno de los cromosomas (el que se convertira en el futuro cromosoma Y) y su prdida en el otro cromosoma del par (el futuro X). Despus, la limitacin progresiva de recombinacin entre ambos cromosomas condujo a una evolucin separada: el Y perdi material rpidamente por la falta de recombinacin, sufri varias duplicaciones y se qued con pocos genes, de los cuales un gran porcentaje tienen homlogos en el X. El cromosoma X, en cambio, se conserv mejor gracias a la existencia de recombinacin entre las dos copias presentes en mujeres, y fue evolucionando progresivamente desde metaterios (mamferos sin placenta, como los marsupiales) a euterios (mamferos con placenta). Al final, el cromosoma X actual conserva una regin del autosoma ancestral de prototerios (mamferos que ponen huevos), adems de otra regin aadida despus de la separacin de los metaterios. Actualmente, ambos cromosomas sexuales slo se recombinan entre ellos en las dos pequeas regiones pseudoautosmicas que estn en los extremos de cada brazo. La secuenciacin completa del cromosoma X en el ao 2005 ha aclarado la estructura de los cromosomas X e Y: En el cromosoma X se pueden distinguir: Dos regiones pseudoautosmicas PAR1 y PAR2, por las que se recombinan los cromosomas X e Y (al menos una recombinacin en PAR1 es necesaria en la meiosis masculina). PAR1 (en Xp e Yp) tiene un tamao de 2,7 Mb, mientras que PAR2 (en el extremo del brazo largo de ambos cromosomas) mide 330 kb. Una gran regin conservada (XCR, "X-conserved region") que ocupa la mayor parte del brazo largo del cromosoma X. Esta es la secuencia ms antigua y representa los restos del autosoma original de prototerios del que se originaron los cromosomas X e Y actuales. Una pequea porcin de sta regin se encuentra transpuesta al cromosoma Y (XTR, "X-transposed region"), calculndose que dicha transposicin tuvo lugar hace 5 millones de aos, despus de la separacin de humanos y chimpancs. Una regin "aadida" (XAR, "X-added region") ms joven que XCR, al parecer incorporada al cromosoma X a partir de otro autosoma hace unos 100 millones de aos en mamferos placentarios (euterios). Esta regin representa la mayor parte del brazo corto del cromosoma X actual. Algunos -http://www.unav.es/asignatura/genmolhumbq/ 137 de 172

Gentica Molecular Humana (F.Ciencias)-

fragmentos de la porcin ms distal de este brazo, cercanos a la PAR1, estn tambin presentes en el cromosoma Y, distinguindose hasta 12 bloques de homologa entre ambos cromosomas. De los aproximadamente 1.000 genes que hay en el cromosoma X, 54 tienen un homlogo funcional en el Y: 24 de ellos estn en PAR1, 5 en PAR2 y 25 en las regiones no-recombinantes de ambos cromosomas. De stos 25, 15 estn en la XAR y 3 en XTR; los 7 genes restantes se localizan en la XCR y por eso se piensa que descienden del autosoma ancestral.

La Figura 11.7 muestra la estructura de los cromosomas X e Y humanos. Los cromosomas X e Y conservan regiones de homologa, especialmente en el brazo corto. Esta Figura muestra ambos cromosomas, sealando la regin conservada (XCR) y la regin aadida (XAR) en el cromosoma X. Adems, se observa la regin que se transpuso desde el brazo largo del X (XTR, en verde) al brazo corto del Y. La figura tambin muestra las dos regiones pseudoautosmicas (PAR, en morado). A la izquierda se muestra la posicin de los genes que escapan a la inactivacin (puntos rojos). La mayor parte de stos reside en el brazo corto del X, y muchos de ellos tienen un homlogo en el Y. Esto se muestra con ms detalle a la derecha, donde se observan los bloques de homologa entre el X y el Y (en distintos colores). El cromosoma Y es el ms peculiar de todos los cromosomas humanos, ya que slo 23 Megabases (de un total estimado de 50 Mb) estn formadas por eucromatina. Por ello, este cromosoma es tambin el ms pobre en genes. La peculiar estructura del cromosoma Y actual se debe a su comportamiento durante la meiosis: lgicamente, no puede quedar sin emparejar durante la meiosis, y de hecho se empareja con el cromosoma X a travs de las dos regiones pseudoatosmicas que contiene en los extremos del brazo corto y del brazo largo, respectivamente. El resto del cromosoma Y no se recombina nunca, y por esto ha ido acumulando mutaciones y degenerando con el tiempo. La regin eucromtica del Y comprende unas 22 Mb (el resto del cromosoma es heterocromatina) y est constituida por 3 tipos de secuencias: i) un bloque de 3,4 Mb fruto de una transposicin procedente del X (XTR, regin transpuesta desde el X); ii) un total de 8,6 Mb de secuencias derivadas del cromosoma X, que representan las regiones derivadas del cromosoma ancestral; y iii) un total de 10,2 Mb de regiones palindrmicas, distribuidas en 7 bloques. En total, en el -http://www.unav.es/asignatura/genmolhumbq/ 138 de 172

Gentica Molecular Humana (F.Ciencias)-

cromosoma Y slo se han encontrado 158 unidades transcripcionales, entre las que destacan 27 genes que tienen homlogos claros en el cromosoma X. De stos, 13 estn degenerados y se han convertido en pseudogenes; los 14 restantes son autnticos genes que se expresan en varios tejidos, con la excepcin de SRY (que slo se expresa en clulas germinales masculinas). Todos estos genes se localizan fundamentalmente en las regiones derivadas del X. Por el contrario, en las regiones palindrmicas hay unos 60 genes, agrupados en 9 familias, que slo se expresan en el tejido testicular y que no tienen un homlogo claro en el cromosoma X: estos genes parecen codificar protenas necesarias para la fertilidad masculina. Por lo que respecta al papel de las regiones palindrmicas, parecen tener una importancia clave en el mantenimiento de la secuencia y estructura del cromosoma Y: la recombinacin entre los brazos de cada palndromo y la conversin de secuencias entre ellos evita la rpida degeneracin que tendra lugar por la ausencia de recombinacin entre los cromosomas X e Y en esta regin.

Figura 11.8 Se observa la estructura del cromosoma Y (la heterocromatina en gris), especialmente la regin eucromtica que se muestra ampliada a la derecha. En sta se distinguen fundamentalmente los tres tipos de secuencias que se indican con distintos colores.

11.4. Inactivacin del cromosoma X


La distinta dotacin cromosmica de ambos sexos supone que las mujeres (XX) tienen doble dosis de los genes presentes en el cromosoma X, en comparacin con los varones XY. El distinto nmero de cromosomas X que lleva cada tipo de gameto (uno en el gameto femenino y ninguno en el masculino), plantea una cuestin fundamental: cmo es posible que la distinta dosis de los genes contenidos en el cromosoma X no provoque grandes problemas fenotpicos en varones? De hecho, mujeres con un solo cromosoma X (cariotipo 45,X0) desarrollan el Sndrome de Turner. Por qu no sucede esto en varones, que tienen un solo cromosoma X? Murray Barr describi en 1949 que las clulas femeninas se podan distinguir por la presencia en su ncleo de un corpsculo de cromatina, pegado a la pared interna del ncleo, que pas a conocerse como corpsculo de Barr. Posteriormente, se comprob que el corpsculo de Barr se ajusta a la llamada "regla (n&#8213;1)", segn la cual el nmero de corpsculos de Barr de una clula es igual al nmero de cromosomas X que posee esa clula (n) menos 1. Estas observaciones se completaron cuando Susumu Ohno demostr en 1959 que el corpsculo de Barr corresponde a un cromosoma X -http://www.unav.es/asignatura/genmolhumbq/ 139 de 172

Gentica Molecular Humana (F.Ciencias)-

condensado en forma de heterocromatina y propuso que uno de los dos cromosomas X est inactivo en clulas somticas, de manera que slo se expresan los genes del cromosoma X que permanece activo. En 1961 Mary Lyon formul la hiptesis de que dicha inactivacin se lleva a cabo al azar en fases precoces del periodo embrionario, y queda fijada una vez que se establece. Segn esta hiptesis, todas las clulas hijas procedentes de una clula en la que se ha producido la inactivacin tendrn el mismo patrn de inactivacin que la clula original. Esta hiptesis permita explicar la expresin de algunos rasgos ligados al cromosoma X, tales como el color del pelaje en los gatos, en el que las gatas (que se conocen como gatas calico) muestran a veces manchas o bandas de color negro, naranja y blanco, mientras los gatos macho son de color totalmente negro o totalmente naranja. El proceso de inactivacin tambin explicara el patrn en mosaico de algunas enfermedades dermatolgicas causadas por genes que estn en el cromosoma X, como la displasia ectodrmica anhidrtica (fenmeno ya descrito por Darwin en 1840). El estudio de las isoformas de glucosa-6-fosfato deshidrogenasa en fibroblastos aislados de mujeres permiti confirmar la hiptesis de Lyon, al observarse la presencia de una sola isoforma en las clulas de mujeres heterocigotas (que deberan tener dos isoformas distintas). Hoy en da, el fenmeno de inactivacin temprana y aleatoria de un cromosoma X en mujeres es universalmente aceptado, y se conoce tambin con el nombre de "Lyonizacin" en honor a Mary Lyon. Mediante este mecanismo, las clulas somticas femeninas tienen uno de sus cromosomas X en estado inactivado, es decir, transcripcionalmente silenciado y altamente compactado en forma de heterocromatina. La inactivacin del X se realiza al azar mediante un mecanismo de recuento que determina el cociente entre el nmero de cromosomas X y el nmero de autosomas. Si se detecta ms de un cromosoma X, el proceso contina con la inactivacin, inicialmente temporal e inestable, de todos los cromosomas X menos uno. Finalmente, el proceso termina con el silenciamiento estable y definitivo de esos cromosomas, que se mantendr durante la divisin celular. Aunque los mecanismos moleculares que regulan estos procesos no se entienden completamente, se conocen las regiones cromosmicas implicadas y los genes ms importantes en el proceso de inactivacin, como se describe a continuacin. Las clulas del embrin inicial tienen la capacidad de calcular el cociente entre el nmero de cromosomas X y el nmero de autosomas (contaje), de permitir la inactivacin cuando hay ms de un cromosoma X (competencia) y de seleccionar un cromosoma X para su inactivacin (eleccin). Los procesos de inactivacin se ejecutan gracias un locus multifuncional denominado XIC, que est localizado en Xq13 y que contiene los elementos necesarios para el recuento del nmero de cromosomas X, para la eleccin del X que ser silenciado y para el propio mecanismo de silenciamiento. Este locus incluye el gen XIST, un gen de 32 kb que se transcribe en un ARN no codificante de 19 kb, es procesado y poliadenilado pero no se traduce. XIST es necesario para iniciar el silenciamiento del cromosoma X, pero no para los mecanismos de contaje, eleccin ni para el posterior mantenimiento del estado silenciado. En XIC tambin se encuentra el mecanismo de contaje y posiblemente un mecanismo de eleccin, que dependen del locus XCE.

La Figura 11.9 muestra esquema del locus XIC de ratn. Todos estos procesos comienzan en los estadios iniciales del desarrollo embrionario. As, en la mrula de 4-8 clulas se detecta expresin de XIST a bajo nivel en ambos cromosomas X, tanto en el de origen paterno (Xp) como en el de origen materno (Xm). Parece que algunos factores responsables de pluripotencialidad (NANOG, OCT4) en estas clulas embrionarias son los que mantienen este bajo nivel de -http://www.unav.es/asignatura/genmolhumbq/ 140 de 172

Gentica Molecular Humana (F.Ciencias)-

expresin. A partir de ese momento, XIST deja de expresarse en uno de los cromosomas X (o en el nico cromosoma X en embriones XY) y su expresin aumenta en el otro cromosoma. Por tanto, la expresin inicial de XIST es transitoria y slo se estabiliza en torno a la fase de blastocisto en uno de los dos cromosomas X (en aqul que quedar finalmente inactivado). Este aumento de expresin de XIST en un cromosoma es la base de la propiedad que hemos llamado competencia, y en los ltimos aos se han identificado algunos mecanismos implicados en la misma. Por un lado, se ha visto en clulas madre embrionarias de ratn que este aumento de expresin de XIST slo se da si los dos cromosomas X interaccionan fsicamente dentro del ncleo. Esta interaccin se produce porque los XIC de ambos cromosomas X se asocian durante un breve tiempo, justo antes de iniciarse la inactivacin definitiva de uno de los dos cromosomas. Utilizando diversas sondas de FISH, se ha podido identificar una regin dentro del XIC que es responsable de esta interaccin, a la que se ha denominado Xpr (X-pairing region). Segn este modelo, la interaccin entre los Xpr de ambos XIC genera una seal que provoca la expresin de bajo nivel del gen XIST en ambos cromosomas X. A continuacin, los genes Tsix y Xite de los dos cromosomas entran en contacto, lo cual produce el otra seal que "apaga" la expresin de XIST en uno de los cromosomas (al azar), y la estabilizacin de la expresin de XIST en el otro cromosoma, que ser el futuro X inactivo. Este modelo explica tambin como se producira la inactivacin de varios cromosomas X, para que se cumpla la regla "n-1" en aquellos casos en los que hay ms de dos cromosomas X presentes. La interaccin de los XIC de dos cromosomas producir la inactivacin de uno de ellos; a continuacin, el proceso se repetira hasta que slo quede un cromosoma activo, en cuyo caso el proceso se detiene.

-http://www.unav.es/asignatura/genmolhumbq/

141 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 11.10 La figura muestra el XIC, con los loci Xpr (crculos rojos), Xist (crculos amarillos) y Tsix/Xite (crculos azules). Los puntos amarillos pequeos representan la expresin del gen Xist. Finalmente, el cromosoma X inactivo se representa en gris. Adems, el aumento de expresin de XIST tambin requiere de elementos genticos que estn a cierta distancia del mismo, dentro del XIC. Uno de ellos es un gen llamado RNF12, situado a unas 500 kb en direccin 5 de XIST, que codifica para una protena con actividad ubiquitina-ligasa y que activa XIST (presumiblemente porque favorece la degradacin de un inhibidor). Otro elemento implicado en la activacin de XIST es el gen JPX (ver Figura 11.8), que tambin codifica un ARN no codificante pero se desconoce su modo de accin. Entre los elementos necesarios para mantener la expresin de XIST en uno solo de los dos cromosomas X, es importante un gen antisentido denominado TSIX, cuyo transcrito se solapa parcialmente con el ARN codificado por XIST. Curiosamente, TSIX sigue un patrn de expresin similar a XIST: inicialmente se expresan ambos alelos, pero al comienzo de la inactivacin nicamente se expresa el alelo del cromosoma X que permanecer activo. Esto sugiere que la expresin de TSIX juega un papel importante en la expresin transitoria de XIST y en la eleccin del cromosoma que finalmente ser inactivado. Esto lleva directamente a la pregunta de cmo se regula la expresin de TSIX. En este proceso participa el factor CTCF, que se une a una regin de metilacin diferencial llamada DXPas34 slo cuando esa regin est des-metilada. Dicha unin tiene dos posibles efectos: o bien impide la accin de un enhancer sobre XIST (porque CTCF es un elemento aislador insulator); bien estimula la transcripcin de TSIX, con el consiguiente silenciamiento de XIST. En cualquier caso, en humanos no se da la transcripcin antisentido de TSIX sobre XIST, por lo que los mecanismos que regulan la expresin monoallica de XIST todava permanecen oscuros. Tras la eleccin, tiene lugar el proceso de iniciacin del silenciamiento, seguida de otros cambios que permiten mantener el estado silenciado. En este proceso, el ARN codificado por XIST recubre todo el cromosoma y desencadena los cambios que caracterizarn al cromosoma X inactivo: metilacin de las islas CpG, desacetilacin de las histonas, replicacin tarda en la fase S, presencia de una histona especial ( macroH2A) en vez de H2A. Recientemente tambin se ha visto que la lisina 27 de la histona H3 est metilada en el cromosoma X inactivo. En cambio, el ARN codificado por XIST no llega a estabilizarse en el X que permanecer activo, y finalmente el propio gen XIST se silencia y deja de expresarse. Lgicamente, en un embrin XY slo hay expresin baja y transitoria de XIST en el cromosoma X de origen materno, que nunca se inactiva porque el mecanismo de contaje detecta la presencia de un solo cromosoma X. Figura 11.11 Este video sirve para ilustrar el proceso de inactivacin del cromosoma X. La inactivacin comienza con la expresin del gen XIST, cuyo ARNm recubre el cromosoma y desencadena una serie de cambios que conducen a la heterocromatinizacin de todo el cromosoma. Slo unos pocos genes concretos escapan a la inactivacin. Mary Lyon tambin ha propuesto que la propagacin del estado inactivado a partir del XIC se ve facilitada por la presencia de elementos distribuidos a lo largo de todo el cromosoma X y que actuaran como "estaciones repetidoras" del proceso de inactivacin. Unos elementos que podran cumplir esta funcin son los LINE, que son especialmente abundantes en el cromosoma X respecto a los autosomas (forman un 30% de la secuencia de este cromosoma). Adems, al estudiar pacientes con translocaciones entre el cromosoma X y un autosoma, se ha comprobado que la inactivacin del X se propaga a los autosomas pero slo parcialmente, y que esta propagacin es directamente proporcional a la riqueza en LINEs de cada autosoma. La secuenciacin del cromosoma X apoya esta hiptesis, ya que se ha comprobado que los LINE se distribuyen a lo largo del X de manera coherente con la inactivacin: son especialmente abundantes en las zonas que flanquean el XIC y disminuyen en abundancia en las regiones ms distales del brazo corto, precisamente la regin donde la inactivacin es ms dbil.

-http://www.unav.es/asignatura/genmolhumbq/

142 de 172

Gentica Molecular Humana (F.Ciencias)-

Es muy importante tener claro que la inactivacin del cromosoma X no es completa, es decir, no afecta a todos los genes del cromosoma. De hecho, se estima que slo un 65% de los genes presentes en el cromosoma X se inactivan; un 20% de los genes se inactivan slo parcialmente (es decir, no estn inactivados en todas las clulas) y un 15% escapan totalmente al proceso de inactivacin. Esto quiere decir que, para esos genes, existen dos copias funcionales en mujeres XX pero slo existe una copia en varones XY. Para evitar las diferencias de dosis gnica en estos casos, algunos de estos genes que escapan a la inactivacin tienen un gen homlogo funcional en el cromosoma Y, lo que hace que ambos sexos tengan la misma dosis gnica funcional. Se piensa que el fenotipo de mujeres X0 con Sndrome de Turner se debe precisamente a la disminucin de dosis de todos o algunos de los genes que escapan la inactivacin, ya que estas pacientes slo tienen una dosis funcional de estos genes (cuando deberan tener dos).

11.5. Enfermedades de herencia ligada al X


Al igual que las enfermedades autosmicas, las enfermedades ligadas al sexo pueden ser recesivas o dominantes. Lo ms habitual es encontrar enfermedades de herencia ligada al sexo recesivas, en las que las mujeres portadoras son sanas. El rbol tpico muestra nicamente varones enfermos, habitualmente sin transmisin de la enfermedad de un padre a sus hijos varones. Se pueden dar 3 situaciones, cuyos cuadrados de Punnet se presentan a continuacin. En primer lugar, la unin entre una mujer portadora (Aa) y un varn sano (A&mdash;) dar lugar a un 50% de hijas homocigotas sanas y un 50% de heterocigotas portadoras, mientras que el 50% de los hijos varones sern sanos y el otro 50% sern enfermos. En el caso de uniones entre una mujer portadora sana (Aa) y un varn enfermo (a&mdash;), los hijos varones tendrn los mismos riesgos que en el caso anterior (la mitad sanos y la mitad enfermos), pero las hijas sern homocigotas (enfermas, por tanto) en el 50% de los casos y portadoras sanas en el otro 50%. Por ltimo, las uniones entre un varn enfermo (a&mdash;) y una mujer homocigota sana (AA) dan lugar a una descendencia en la que todos los hijos son sanos y todas las hijas son portadoras sanas. Como puede apreciarse, es importante distinguir las mujeres sanas que son homocigotas de aquellas que son heterocigotas portadoras. Ya hemos comentado que la inactivacin del cromosoma X se realiza al azar en clulas somticas, de forma que toda mujer es, en el fondo, un mosaico con poblaciones celulares en las que se ha inactivado un cromosoma X y poblaciones celulares en las que se ha inactivado el otro. Sin embargo, en algunas circunstancias la inactivacin puede ser preferencial, inactivndose el mismo cromosoma X en todas las clulas. Esto sucede, por ejemplo, en casos de anomalas estructurales (deleciones o duplicaciones) que afectan a uno de los cromosomas X, en cuyo caso suele inactivarse el cromosoma anormal. En cambio, en individuos con translocaciones equilibradas entre el cromosoma X y un autosoma se inactiva preferencialmente el cromosoma normal, ya que de lo contrario se producira a una monosoma parcial del autosoma implicado en la translocacin. Tambin se ha visto inactivacin sesgada en algunas familias con deleciones que afectan a XIST o a TSIX, as como en familias con mutaciones que afectan al promotor de XIST. En algunos casos raros de enfermedades ligadas al sexo recesivas, la inactivacin preferencial del cromosoma X normal en mujeres portadoras (que deberan ser fenotpicamente sanas) puede dar a lugar a la aparicin de la enfermedad, aunque habitualmente con unas manifestaciones ms leves. La Distrofia Muscular de Duchenne (DMD) es quizs uno de los mejores ejemplos de enfermedad ligada al sexo recesiva. Esta causada por mutaciones en el gen de la distrofina, localizado en Xp21, y afecta a 1 de cada 3.300 varones en todos los grupos tnicos. La ausencia de distrofina provoca la desestructuracin del Complejo Asociado a la Distrofina (DAC) del sarcolema y conduce a la aparicin de una degeneracin muscular progresiva que suele terminar con la vida del paciente alrededor de la tercera dcada de la vida. Como se recordar, el gen DMD es uno de los de mayor tamao conocido, lo que condiciona una alta tasa de nuevas mutaciones (en torno a 10&mdash;4 nuevas mutaciones por generacin). Alrededor del 60% de las mutaciones son deleciones (con tamaos que van desde varias kilobases hasta una megabase), con un "punto caliente" (hot spot) de aparicin de deleciones en el exn 7. El resto de las mutaciones son deleciones pequeas y mutaciones puntuales que alteran el marco de lectura. La distrofia muscular de Becker es un -http://www.unav.es/asignatura/genmolhumbq/ 143 de 172

Gentica Molecular Humana (F.Ciencias)-

fenotipo ms leve causado por mutaciones en el mismo gen, pero en este caso las mutaciones NO rompen el marco de lectura (deleciones pequeas y mutaciones puntuales con cambio de sentido). Unaenfermedad humana que muestra herencia recesiva ligada al cromosoma X es la hemofilia, especialmente conocida por afectar a las familias reales europeas emparentadas con la reina Victoria de Inglaterra, que era portadora sana de la enfermedad. En la primera parte de esta animacin del DNA Learning Center se ilustra el rbol genealgico de la Reina Victoria, identificando los varones enfermos y las mujeres portadoras. El rbol tpico de las enfermedades con herencia ligada al sexo dominante muestra una estructura similar al de las enfermedades autosmicas dominantes, con la peculiaridad de que nunca hay transmisin padre-hijo, pero en cambio todas las hijas de los varones enfermos son heterocigotas enfermas. Por el contrario, desarrollar la enfermedad el 50% de los hijos y el 50% de las hijas de una mujer portadora y un varn normal. En general, los rboles suelen mostrar la presencia del doble de mujeres enfermas que de varones enfermos, excepto en aquellos casos en que la enfermedad es letal en varones. De todas formas, las mujeres suelen desarrollar formas ms leves de la enfermedad, debido a que el 50% de sus clulas habrn inactivado el cromosoma X portador de la mutacin y expresarn el alelo normal del gen implicado. Algunos ejemplos de estas enfermedades son el Sndrome de Rett, el Raquitismo Hipofosfatasmico, o la Incontinencia Pigmentaria tipo 1 (enfermedad en la que slo se ven mujeres afectadas, probablemente por letalidad embrionaria en varones).

-http://www.unav.es/asignatura/genmolhumbq/

144 de 172

Gentica Molecular Humana (F.Ciencias)-

En la Figura 11.12 se muestran los pedigrs tpicos de enfermedades ligadas al sexo recesivas y dominantes. El pedigr tpico de las enfermedades de herencia recesiva ligada al cromosoma X muestra pocos individuos enfermos (todos varones) y un nmero elevado de mujeres portadoras (heterocigotas, smbolos con el punto dentro). Por el contrario, las enfermedades de herencia dominante ligada al cromosoma X (familia inferior) muestran un patrn tpico de enfermedad dominante y se distingue por la ausencia de transmisin padre-hijo (por ejemplo, los enfermos II-5 y III-2). Por lo que respecta al clculo de riesgos en la herencia ligada al sexo recesiva, es til analizar los cuadrados de Punnet que se generan en diversos tipos de matrimonios, como se explica en este video. Un patrn hereditario anmalo, dentro de las enfermedades ligadas al cromosoma X, es el que presentan las familias con Sndrome del X Frgil. El estudio del rbol de una familia con esta enfermedad pone de manifiesto un patrn de herencia dominante con penetrancia reducida en mujeres, adems de otros hechos que constituyen lo que se conoce como "paradoja de Sherman": 1) el riesgo de transmisin de la enfermedad aumenta en sucesivas generaciones, y 2) se encuentran varones normales que transmiten la enfermedad a todas sus hijas, que sern por tanto portadoras sanas. Como hemos comentado en otro Captulo, hoy en da sabemos que esta enfermedad est causada por la expansin de un trinucletido en el gen FMR1, con alelos que varan en el nmero de veces que est repetido el trinucletido. La presencia de premutacin (rango de 50 a 230 repeticiones) no provoca manifestaciones fenotpicas en los portadores (tanto varones como mujeres). La expansin de estos alelos premutados slo se produce por va materna, y la probabilidad de que esto suceda depende de la longitud del alelo premutado.

-http://www.unav.es/asignatura/genmolhumbq/

145 de 172

Gentica Molecular Humana (F.Ciencias)-

La Figura 11.13 ilustra la paradoja de Sherman, mostrando en un rbol los riresgos de expansin a mutacin completa dependiendo del tamao de la premutacin y del sexo. En este pedigr ideal podemos ver los distintos riesgos de padecer Sndrome del X frgil, dependiendo del tamao de la repeticin en la madre portadora que transmite la enfermedad. Por ejemplo, en la genealoga de la Figura 11.12 se parte de una mujer sana con 50-55 repeticiones que sufre una pequea expansin a premutacin en su hija (60-70 repeticiones), se puede estimar el riesgo que tiene la descendencia de sta ltima de sufrir expansin completa. As, el 9% de los hijos varones sufrirn expansin completa y por tanto tendrn la enfermedad, mientras que esto sucede slo en el 5% de las hijas. En el resto de las hijas la repeticin se expande un poco dentro del rango de premutacin (de 60-70 a 70-90 repeticiones). Ahora, la riesgo de tener hijos enfermos es mayor, ya que una premutacin de 70-90 tienen mayor riesgo de sufrir expansin completa. En efecto, vemos que en este caso el 40% de los hijos varones y el 16% de las hijas sufrirn la enfermedad. Si la repeticin sigue expandindose dentro del rango de premutacin (por encima de 90 repeticiones), ahora el riesgo de expansin completa es todava mayor (50% para hijos y 20% para hijas). En la rama izquierda del rbol se observa tambin un hecho interesante: la presencia de un varn sano que transmite la enfermedad. Estos se denominan Varones Transmisores Normales (NTM = Normal Transmitting Male), y se explican porque reciben un alelo con premutacin que transmiten a su descendencia. En este caso, el NTM ha recibido de su madre un cromosoma X con 70-90 repeticiones, por una pequea expansin en su madre. Este varn transmite su cromosoma X a sus

-http://www.unav.es/asignatura/genmolhumbq/

146 de 172

Gentica Molecular Humana (F.Ciencias)-

hijas sin sufrir ninguna expansin, por lo que ninguno de sus hijos ni hijas pueden padecer la enfermedad. Sus hijas, en cambio, s que pueden sufrir expansiones completas al transmitirlo, siendo el riesgo de que esto suceda dependiente del tamao de la repeticin. En general podemos afirmar que la expansin de pre-mutacin a mutacin completa tiene lugar en menos del 20% de los alelos <70 repeticiones y en ms del 70% de los alelos >90 repeticiones. Como se recordar, la expansin a mutacin completa va acompaada de hipermetilacin del promotor del gen FMR1, lo que provoca la ausencia de la protena. Aunque la mutacin provoca una prdida de funcin del gen, el fenotipo es dominante (basta un alelo con la mutacin completa para desarrollar la enfermedad). De hecho, la presencia de un cromosoma con mutacin completa e hipermetilacin se asocia con retraso mental en todos los varones y en el 50-70% de las mujeres (por la inactivacin del X, muchas clulas habrn inactivado el cromosoma X mutado). Las mujeres que llevan un alelo con pre-mutacin no suelen desarrollar la enfermedad, pero tienen riesgo de sufrir expansin en su descendencia. Por el contrario, los varones con pre-mutacin &mdash;denominados Varones Transmisores Normales (NTM, Normal Transmitting Male)&mdash; transmiten el alelo premutado, sin sufrir expansin, a todas sus hijas (que sern portadoras sanas), y &mdash;como es lgico&mdash; no lo transmiten a ninguno de sus hijos. Recientemente se ha encontrado que estos varones desarrollan una enfermedad neurolgica llamada FXTAS (sndrome de temblor/ataxia asociado con el X-frgil) en las ltimas dcadas de la vida. Estos individuos muestran inclusiones cerebrales con aumento del mRNA y de la protena FMRP, adems de otras protenas como laminina A/C. Esta enfermedad es un bello ejemplo de cmo la identificacin del mecanismo molecular gentico ha permitido explicar una serie de fenmenos clnicos y hereditarios de difcil comprensin. El clculo de riesgos en las enfermedades de herencia recesiva ligada al cromosoma X, por tanto, debe hacerse teniendo en cuenta que las mujeres portadoras (heterocigotas) son sanas pero los varones hemicigotos (con una mutacin en su nico cromosoma X) son enfermos. En el caso de mujeres portadoras, la mitad de sus hijos varones sern enfermos y la otra mitad sanos; de sus hijas, la mitad sern portadoras y la otra mitad homocigotas sanas. Es caracterstico que nunca hay transmisin de padre enfermo a hijos varones, lo cual es muy importante para el consejo gentico. En cambio, todas de las hijas de un varn enfermo sern portadoras (sanas), pero ninguna ser enferma. La excepcin a esta regla general es el matrimonio de un varn enfermo con una mujer portadora, lo cual sucede a veces en casos de consanguinidad. En estos casos puede haber mujeres enfermas (heredan dos mutaciones) e incluso transmisin de padre enfermo a hijo varn (aunque, en realidad, el hijo hereda la enfermedad de su madre). Por lo que respecta a la herencia ligada al X dominante, el matrimonio entre una mujer enferma (heterocigota) y un varn normal produce una descendencia con riesgo de recurrencia en el 50% de los hijos y en el 50% de las hijas. En cambio, el matrimonio entre un varn afectado y una mujer normal da lugar a un riesgo del 100% de recurrencia en las hijas (todas heredan el cromosoma X paterno, que transmite la mutacin), pero todos los hijos varones sern sanos.

11.6. Enfermedades por alteracin del ADN mitocondrial


El ADNmt presenta una serie de caractersticas genticas que lo diferencian claramente del ADN nuclear: Alta tasa de mutacin: La tasa de mutacin espontnea del ADNmt es unas 10 veces superior a la del ADN nuclear. Por tanto, hay una gran variacin de secuencias entre especies e incluso entre individuos de una misma especie. En el hombre se ha calculado que dos individuos escogidos al azar tienen como promedio 50-70 nucletidos diferentes en su genoma mitocondrial. Adems de estas diferencias, en un individuo determinado se est produciendo continuamente, a lo largo de la vida, una heterogeneidad en el ADNmt como consecuencia de las mutaciones que se estn dando en las clulas somticas. Se ha propuesto que una acumulacin de este dao mitocondrial pudiera ser la causa de la disminucin en la capacidad respiratoria de los tejidos que tiene lugar durante el envejecimiento. Poliplasmia y Segregacin mittica: En cada clula hay cientos o miles de molculas de ADNmt. En principio, todas las clulas de un individuo normal tienen molculas idnticas de ADNmt, situacin que se denomina homoplasmia. Si en una clula aparecen dos poblaciones de ADNmt, una normal y otra mutada, se dice que estamos en una situacin de heteroplasmia. Durante la divisin celular, las -http://www.unav.es/asignatura/genmolhumbq/ 147 de 172

Gentica Molecular Humana (F.Ciencias)-

mitocondrias &mdash;y, por tanto, las molculas de ADNmt&mdash; se distribuyen al azar entre las clulas hijas. Efecto umbral: El fenotipo de una clula en heteroplasmia depender del porcentaje de ADN daado que exista en la clula; es decir, del grado de heteroplasmia de una mutacin. Cuando el nmero de molculas de ADNmt mutadas es pequeo, el ADNmt normal es capaz de mantener la funcin mitocondrial. Sin embargo, cuando el nmero de copias de ADNmt mutado sobrepasa un umbral determinado, la produccin de ATP puede llegar a estar por debajo de los mnimos necesarios para el funcionamiento de los tejidos, llevando al desarrollo de patologa mitocondrial. Es importante tener en cuenta que los distintos tejidos pueden variar en el grado de homoplasmia o heteroplasmia para un ADNmt mutado, lo que origina una gran variabilidad en la expresividad clnica de las enfermedades mitocondriales. Por otra parte, los tejidos tienen distintas necesidades energticas, y el nmero de orgnulos y de molculas de ADNmt es tambin diferente en cada tejido. Por tanto, los rganos preferentemente afectados en las enfermedades mitocondriales son aquellos que dependen en mayor grado de la produccin de energa para su correcto funcionamiento. Herencia materna: El ADNmt se hereda exclusivamente por va materna. La pequea cantidad de genoma mitocondrial contenido en el espermatozoide raramente entra en el vulo fecundado, y cuando lo hace es eliminado activamente. El tipo de herencia matrilineal es bastante fcil de reconocer al examinar un rbol genealgico, y tiene importantes consecuencias en el consejo gentico (ver ms adelante). Por lo que respecta a las enfermedades humanas debidas a mutaciones del ADNmt, podemos dividirlas en dos grandes grupos: enfermedades asociadas a mutaciones puntuales y enfermedades debidas a alteraciones estructurales del ADNmt. Las enfermedades asociadas a mutaciones puntuales son frecuentes, debido a la alta tasa de mutacin del ADNmt. Actualmente se han descrito ms de 50 mutaciones puntuales, que se localizan en los tres tipos de genes codificados en el ADNmt (ARNr, ARNt y polipptidos del OXPHOS). Segn su efecto patognico, distinguimos las mutaciones que originan el cambio de un aminocido por otro, afectando a alguno de los 13 genes codificantes de protenas, y las mutaciones que afectan a los genes de los ARNr ARNt, que tienen efectos globales en la sntesis de las protenas mitocondriales. Las enfermedades asociadas a alteraciones estructurales del ADNmt pueden ser tanto deleciones ms o menos grandes como, menos frecuentemente, inserciones y/o duplicaciones. Hasta el momento se han descrito varios cientos de reordenaciones del ADNmt, que &mdash;al contrario que las mutaciones puntuales&mdash; suelen ser espordicas. Como regla prctica, podemos decir que en aquellos casos que muestran herencia matrilineal ha de sospecharse la presencia de mutaciones puntuales del ADNmt; en casos espordicos, en cambio, son ms frecuentes las deleciones y/o duplicaciones. Si, por el contrario, se confirma un patrn de herencia autosmico dominante, el estudio debe ir dirigido hacia la bsqueda de deleciones mltiples; si fuese autosmico recesivo, deben buscarse depleciones del ADNmt. La siguiente tabla muestra algunas de las mutaciones puntuales ms frecuentes en el ADN mitocondrial, incluyendo tambin una pequea delecin. Se indican, de izquierda a derecha, el tipo de mutacin, el cambio de aminocido (cuando existe) y el gen afectado por la mutacin. Son especialmente frecuentes las mutaciones que afectan a los nucletidos 11.778 y 14.484 (Neuropata ptica hereditaria de Leber), al 8.993 (Sndrome de Leigh), al 3.243 (MELAS) y al 8.344 (MERRF). La deteccin de mutaciones puntuales se realiza habitualmente por digestin de fragmentos de PCR con enzimas de restriccin sensibles al cambio de nucletido introducido por la mutacin. En cualquier caso, resulta ms fiable la deteccin mediante Southern del ADNmt digerido con enzimas de restriccin especficas para cada una de las mutaciones concretas, pero esto no siempre es posible y, por otra parte, es ms laborioso. Las deleciones se encuentran siempre en heteroplasmia, aunque pueden llegar a constituir un porcentaje muy alto de la poblacin de ADNmt. Su determinacin se hace fundamentalmente en biopsias musculares, pero si la afectacin es muy grave se pueden llegar a detectar tambin en sangre perifrica. Las deleciones se detectan con relativa facilidad por la tcnica de Southern, que muestra poblaciones de ADNmt de menor -http://www.unav.es/asignatura/genmolhumbq/ 148 de 172

Gentica Molecular Humana (F.Ciencias)-

tamao que el normal (16.569 pb). Se emplea habitualmente ADNmt digerido con BamHI o con EcoRV, utilizando como sonda un gran fragmento de ADNmt obtenido mediante PCR de largo alcance. El diagnstico de deplecin del ADNmt se realiza tambin por hibridacin Southern, comparando los niveles de ADNmt con los de ADN nuclear. La confirmacin molecular de una alteracin del ADNmt ayuda a establecer el diagnstico de enfermedad mitocondrial y el patrn de herencia matrilineal. Esto tiene una importancia capital desde el punto de vista del consejo gentico y el clculo del riesgo de recurrencia de la enfermedad, ya que la herencia matrilineal est caracterizada por la transmisin exclusivamente por va materna. Esto hace que tenga algunas caractersticas especiales: se afectan ambos sexos, pero los varones -enfermos o no- nunca transmiten la enfermedad, y sus descendientes (hijos o hijas) no son portadores; por otro lado, las mujeres afectadas transmiten la enfermedad a toda su descendencia, de forma que todas sus hijas tienen riesgo de transmitir y/o padecer la enfermedad, y todos sus hijos tienen riesgo de padecerla.

La Figura 11.14 muestra un rbol genealgico tpico de herencia matrilineal. La figura muestra el pedigr de una familia en la que se transmite una enfermedad mitocondrial. Se observa un patrn de herencia matrilineal, con transmisin siempre por va materna: ningn varn afectado transmite la enfermedad. Adems, se pueden identificar cuatro mujeres portadoras asintomticas (flechas rojas), ya que &mdash;debido a los distintos grados de heteroplasmia&mdash; con frecuencia las mujeres que transmiten la enfermedad no lleguan a desarrollar el cuadro clnico completo. Las enfermedades mitocondriales pueden deberse a defectos en genes nucleares o a alteraciones del propio genoma mitocondrial. La diferencia entre ambos tipos de procesos es importante porque los tipos de herencia son diferentes y las implicaciones para el clculo de riesgos pueden ser grandes. Dada la importancia del metabolismo oxidativo, las enfermedades mitocondriales presentan gran variedad de sntomas y signos, y suponen un problema diagnstico importante. En general encontramos afectacin neuromuscular: neuropata ptica, convulsiones, accidentes cerebrovasculares, mioclonas, neuropata perifrica, ataxia, demencia, miopatas. De todas formas, los pacientes con enfermedad del ADN mitocondrial pueden agruparse en tres categoras: Raramente se presenta como un sndrome fcilmente identificable: MELAS (encefalopata mitocondrial con acidosis lctica y episodios de accidentes cerebrovasculares) muestra estatura baja, sordera bilateral, diabetes, convulsiones, accidentes cerebrovasculares y encefalopata en la 3 o 4 dcadas de la vida. LHON (Leber hereditary optic neuropathy) muestran fallo visual bilateral en la 2-3 dcadas. Otras presentaciones clsicas son la oftalmoplegia externa con o sin ptosis, que aparece junto con una miopata proximal en CPEO (chronic progressvie external ophtalmoplegia) o con ataxia, sordera bilateral y defectos de conduccin cardaca en el Sndrome de Kearns-Sayre. Otros sndromes son NARP (neurogenic weakness, ataxia, retinitis pigmentosa) y MERRF (epilepsia mioclnica y ragged-red-fibers o fibras musculares rojas deshilachadas). -http://www.unav.es/asignatura/genmolhumbq/ 149 de 172

Gentica Molecular Humana (F.Ciencias)-

Un segundo grupo de pacientes tienen una constelacin de datos clnicos que sugieren enfermedad mitocondrial, pero no encajan en ninguno de los sndromes citados. Por ejemplo, son tpicos los casos de estatura baja con sordera neurosensorial bilateral, oftalmoplegia con ptosis, diabetes y migraas. Es necesario un estudio neurolgico exhaustivo, y la asociacin de cualquiera de estos datos con miopata o signos de afectacin neurolgica central hace el diagnstico de enfermedad mitocondrial muy probable. Sin embargo, lo ms habitual es que estos pacientes sean estudiados para descartar gran cantidad de enfermedades neurolgicas hereditarias autosmicas (alguna forma de ataxia espinocerebelosa, estados iniciales de la enfermedad de Huntington, sndrome de Usher, Charcot-Marie-Tooth) antes de que se llegue a pensar en enfermedad mitocondrial. Un diagnstico comn en estos pacientes es el de myastenia congnita. El ltimo gran grupo de enfermos es el ms difcil de definir, y est constitudo por pacientes con sntomas aislados que -despus de un estudio exhaustivo- terminan achacndose a patologa mitocondrial. Por ejemplo, un cierto porcentaje de accidentes cerebrovasculares juveniles son resultado de patologa mitocondrial, pero adems la presentacin a menudo es extra-neurolgica: cardiomiopata hipertrfica, enfermedad tubular renal, hipoparatiroidismo, insuficiencia suprarrenal, diabetes, disfagia. La sordera familiar neurosensorial progresiva es frecuentemente debida a patologa mitocondrial, como demostr el grupo de Xavier Estivill en 70 familias espaolas con la mutacin del nucletido 1555. Entre las pruebas diagnsticas que resultan tiles para llegar al diagnstico de patologa mitocondrial, contamos con las siguientes: Investigaciones generales: habitualmente, estos pacientes han sido sometidos a gran catidad de tests. Es necesario ver la funcin cardaca, test de tolerancia a glucosa, nivel de lactato en sangre (es ms especfico en el lquido cefalo-raqudeo), electroencefalograma para detectar encefalopata subaguda, TAC cerebral (es comn la calcificacin bilateral de ganglios basales). Investigaciones especficas: deteccin de alteraciones en el ADN mitocondrial, tanto reordenamientos (deleciones, duplicaciones) como mutaciones puntuales. Lo ms habitual es que las mutaciones estn en heteroplasmia, y esto determina la expresividad fenotpica (habitualmente es necesario >85% de ADNmt mutado para que se manifieste la enfermedad). Las mutaciones letales slo pueden estar en heteroplasmia, pero en general el porcentaje de heteroplasmia vara en distintos rganos en un mismo individuo e incluso tambin con la edad, de ah la enorme variabilidad clnica. En algunas entidades es relativamente sencilla la deteccin molecular: por ejemplo, hay 3 mutaciones que en conjunto explican el 95% de los pacientes con LHON. En cambio, las deleciones responsables de los sndromes de CPEO o Kearns-Sayre no son detectables en sangre, por lo que los resultados negativos han de ser interpretados con cautela. En estos casos, la biopsia de msculo esquletico es la piedra angular para el diagnstico de patologa mitocondrial: por un lado, la deteccin histoqumica de fibras deficientes en COX y en otros complejos de la cadena respiratoria confirma la afectacin mitocondrial; adems, los estudios moleculares en ADN muscular confirman la presencia de deleciones o de mutaciones puntuales.

11.7. Aplicacin del teorema de Bayes al clculo de riesgos genticos


En algunas situaciones, los riesgos de recurrencia calculados segn los principios mendelianos pueden ser matizados y precisados por informacin adicional acerca de esa familia. Por este motivo, el consejo gentico hace uso de la estadstica bayesiana, derivada de la aplicacin del teorema de Bayes. En su formulacin general, el teorema de Bayes dice que:

-http://www.unav.es/asignatura/genmolhumbq/

150 de 172

Gentica Molecular Humana (F.Ciencias)-

Esto significa que la probabilidad de un suceso A cuando se verifica una condicin B (eso se representa como "A sobre B") es igual a la probabilidad inicial del primer suceso, multiplicado por la probabilidad de que la condicin B se verifique en presencia del suceso A, dividido por la probabilidad total de la condicin B (que es el sumatorio de todos los posibles numeradores). Es decir, la probabilidad inicial terica de un suceso cualquiera puede ser modificada si se cumple alguna condicin que afecta a ese suceso, dependiendo de la probabilidad de esa condicin y de la probabilidad de que cuando tal condicin se cumple se vea afectado el suceso inicial. Este tipo de anlisis estadstico tiene aplicacin en muchos campos, pero en el caso concreto del consejo gentico es especialmente til en el clculo de riesgos de recurrencia de enfermedades recesivas ligadas al cromosoma X, en las que podemos incluir informacin de tipo condicional. Tambin es posible incorporar los datos del diagnstico molecular para matizar los riesgos de recurrencia calculados segn los principios mendelianos, como veremos en algunos ejemplos. Quizs el ejemplo ms sencillo de cmo utilizar la informacin derivada de rboles genealgicos para modificar los riesgos iniciales sea el clculo del riesgo de ser portador de una enfermedad autosmica recesiva. Como sabemos por los principios mendelianos, cualquier hermano o hermana de un afectado con una enfermedad autsomica recesiva, cuyos progenitores son portadores sanos, tiene una probabilidad inicial del 50% de ser portador sano, 25% de ser homocigoto sano y 25% de ser homocigoto enfermo. En cambio, puede darse el caso de que nos encontremos una familia en la uno de los hermanos es sano, y claramente no ha desarrollado la enfermedad. En ese individuo, lgicamente, podemos despreciar el 25% de probabilidad de ser enfermo, porque de hecho est sano. En efecto, slo hay dos posibilidades de ser hermano sano de un afectado por una enfermedad autosmica recesiva: o ser portador (probabilidad inicial del 50%) o ser homocigoto sano (probabilidad inicial del 25%). De este 75% total, un 50% corresponde a la probabilidad de ser portador, luego el riesgo que tiene un hermano sano de ser portador de la enfermedad no es 50%, como inicialmente cabra suponer, sino realmente 2/3. Esto, que se comprende modo intuitivo, supone realmente una aplicacin del teorema de Bayes. En efecto, la probabilidad (P) inicial de ser portador sano es y de ser homocigoto sano es , como acabamos de ver. Establecemos la condicin ("si el individuo es SANO") y calculamos la probabilidad condicional para cada estado posible: en este caso, la probabilidad condicional es 1 (100%) siempre, ya que tanto un portador sano como un homocigoto sano son sanos. Si hacemos una tabla en la que indicamos las probabilidades bajo cada una de las dos posibles situaciones, obtenemos algo como lo que se muestra a continuacin. Un individuo portador tiene una probabilidad inicial (a priori) del 50% de ser sano, y si cumple la condicin de estar sano su probabilidad condicional (estar sano) es del 100% (P=1); lo mismo puede calcularse para un homocigoto sano (probabilidades inicial y condicional de y 1, respectivamente). A continuacin se calcula la probabilidad combinada conjunta de que ambos sucesos tengan lugar a la vez, es decir, se multiplican la probabilidad inicial y la condicional. La probabilidad conjunta corresponde al trmino P(A) x P(B|A) de la ecuacin anterior. Como vemos en la tabla, las probabilidades conjuntas son 1/2 y 1/4, respectivamente, para el caso de ser portador sano o de ser homocigoto sano: Portador Homocigoto (sano) Inicial 1/2 1/4 Condicional ("si es sano") 1 1 Conjunta 1/2 1/4 Final 2/4 3/4=2/3 1/3 La suma de todas las posibles probabilidades conjuntas (el sumatorio que est en el denominador de la ecuacin) es, en nuestro caso, 3/4 (1/2 + 1/4). Por tanto, la probabilidad final se calcula hallando el cociente entre la probabilidad conjunta de cada situacin y la suma de todas ellas. En nuestro ejemplo, la probabilidad final de que el hermano de un enfermo con una enfermedad autosmica recesiva sea portador

-http://www.unav.es/asignatura/genmolhumbq/

151 de 172

Gentica Molecular Humana (F.Ciencias)-

de la misma, si es sano, es de (1/2) (3/4) = 2/3, y la probabilidad final de que sea homocigoto sano es 1/3. Como se puede ver, los riesgos no siempre son algo fijo, sino que en ocasiones pueden modificarse, a veces de manera sustancial, con la incorporacin de nueva informacin. El teorema de Bayes tambin se utiliza con frecuencia para calcular el riesgo derivado de pruebas diagnsticas bioqumicas o moleculares, y puede combinarse con la informacin obtenida del rbol genealgico. Por ejemplo, si se sabe que una enfermedad tiene una prevalencia de 1/100.000 individuos, la probabilidad inicial de padecerla es P(A)=10-5. Si una prueba diagnstica es positiva en el 80% de los individuos enfermos y en un 5% de sanos (falsos positivos), podemos calcular la probabilidad de que un individuo en el que la prueba es positiva realmente padezca la enfermedad. Para esto, calculamos la probabilidad de tener alterada la prueba si uno est enfermo: P(B|A)=0,8. Igualmente, la probabilidad de tener alterada la prueba si uno est sano es 0,05 (obsrvese el uso del condicional para calcular las probabilidades condicionales). La probabilidad final de que un sujeto tenga la enfermedad y adems una prueba diagnstica positiva es, por tanto, el producto de la probabilidad inicial de enfermar multiplicado por la probabilidad condicional de tener alterada la prueba si est realmente enfermo, dividido por la probabilidad de que el marcador est alterado en general (la suma de ambas probabilidades conjuntas): Sano Enfermo Inicial 10-5 0,99999 Condicional 0,8 0,05 Conjunta 0,8 x 10-5 0,0499995 Final (0,8 x 10-5) 0.0500075 = 1.6 x 10-4 Obsrvese que hemos multiplicado por ms de diez el riesgo inicial, en aquellos casos en los que la prueba diagnstica est alterada. En cualquier caso, la situacin en la que ms se utiliza el teorema de Bayes en consejo gentico es para el clculo del riesgo de ser mujer portadora en las enfermedades con herencia ligada al X recesiva, ya que en estos casos el riesgo puede modificarse sustancialmente. En estas familias es importante identificar correctamente la mujeres portadoras obligatorias (aquellas que han tenido al menos un hijo enfermo o una hija portadora) y asignar la informacin condicional correctamente, sobre todo en el caso de estudios moleculares de anlisis indirecto.

-http://www.unav.es/asignatura/genmolhumbq/

152 de 172

Gentica Molecular Humana (F.Ciencias)-

La Figura 11.15 ilustra la aplicacin del teorema de Bayes al clculo de riesgos en enfermedades de herencia ligada al X recesiva, utilizando algunos ejemplos prcticos. En la Figura 11.13 se presenta un ejemplo de la aplicacin del teorema de Bayes al clculo de riesgos en enfermedades recesivas ligadas al sexo. En primer lugar vemos un pedigr en el que una mujer (III-2) acude a consulta porque quiere saber el riesgo de ser portadora de distrofia muscular de Duchenne, ya que un to materno (II-3) y un primo (III-4) padecen la enfermedad. Lgicamente, este riesgo ser la mitad del riesgo de que su madre (II-2) sea portadora, por lo que primero hemos de calcular ste. Podemos identificar dos portadoras obligatorias que han transmitido la enfermedad (I-2 y II-4). Por tanto, el riesgo inicial de que II-2 sea portadora es 1/2, ya que su madre I-2 es portadora, y as el riesgo de que III-2 sea portadora es la mitad del de su madre, es decir 1/4. Ahora bien, en el pedigr vemos que III-2 tiene dos hijos varones sanos, lo cual es poco probable si realmente es portadora de la enfermedad. De hecho, la probabilidad de tener dos hijos varones sanos, si realmente es portadora, es de 1/2 x 1/2, es decir 1/4. Esta nueva probabilidad puede incorporarse como informacin condicional para calcular el riesgo, aplicando el teorema de Bayes como sigue: III-2 portadora III-2 no portadora Inicial 1/4 3/4 Condicional 1/4 1 Multiplicando la probabilidad inicial por la condicional hallamos la probabilidad conjunta para cada una de las dos hiptesis: III-2 portadora III-2 no portadora Inicial 1/4 3/4 Condicional 1/4 1 Conjunta 1/16 3/4 (12/16)

-http://www.unav.es/asignatura/genmolhumbq/

153 de 172

Gentica Molecular Humana (F.Ciencias)-

La probabilidad final de que III-2 sea portadora es su probabilidad conjunta (1/16) dividido por la suma de las dos probabilidades conjuntas (13/16), es decir, 1/13. Como vemos, el riesgo inicial baja ms de tres veces al incorporar la informacin condicional. Es importante aplicar la informacin condicional al individuo correcto. Por ejemplo, si en esta misma familia la mujer III-2 tuviese 2 hermanos sanos, como se muestra en la siguiente Figura, esta informacin afectara al riesgo de ser portadora de su madre (II-2):

La Figura 11.16 muestra cmo aplicar correctamente la informacin condicional. Aunque inicialmente II-2 tena un riesgo de ser portadora de 1/2, la aplicacin del teorema de Bayes lo modifica: II-2 portadora II-2 no portadora Inicial 1/2 1/2 Condicional 1/4 1 Conjunta 1/8 1/2 (4/8) Final 1/8 5/8 = 1/5 Por tanto, si la probabilidad de que II-2 sea portadora es ahora 1/5, el riesgo inicial de que III-2 sea portadora es la mitad del de su madre, es decir 1/10. La informacin adicional de sus dos hijos sanos dara un riesgo final de ser portadora de 1/37: III-2 portadora III-2 no portadora Inicial 1/10 9/10 Condicional 1/4 1

-http://www.unav.es/asignatura/genmolhumbq/

154 de 172

Gentica Molecular Humana (F.Ciencias)-

Conjunta 1/40 9/10 (36/40) Final 1/40 37/40 = 1/37

11.8. Diagnstico prenatal.


El avance de las tcnicas diagnsticas genticas permite hoy en da, para determinados procesos, realizar diagnstico precoz dentro del tero. Esta modalidad diagnstica, llamada diagnstico prenatal, es con frecuencia causa de la peticin de consejo gentico, y tiene unos matices especiales por las implicaciones emocionales fuertes que conlleva para la familia. El desarrollo de los mtodos de diagnstico prenatal ha ido parejo a la prctica del consejo gentico, y por tanto se ha realizado de modo responsable y adecuado. En cambio, el uso generalizado de nuevos mtodos, especialmente la ecografa, fuera del contexto del consejo gentico (o incluso como sustituto del mismo) sin realizar adecuadamente el clculo de riesgos, la deteccin de portadores ni otras medidas de apoyo, supone un descenso en la calidad de la asistencia que reciben las familias con enfermedades genticas. El uso de pruebas de barrido (screening) en el primer trimestre del embarazo significa que la mayor parte de las consultas de diagnstico prenatal se realizan en situaciones en las que no exista riesgo previo de una enfermedad gentica, lo cual genera situaciones especialmente delicadas que es importante gestionar bien. Dado que los procesos de diagnstico prenatal suponen una cierta tensin emocional para la familia, especialmente para la madre, y pueden provocar una morbilidad fetal significativa, se recomienda que slo se realice diagnstico prenatal cuando se cumplen una serie de condiciones y en aquellos casos en que est indicado. En concreto, slo se debe plantear el diagnstico prenatal en el caso de enfermedades graves para las que exista un mtodo diagnstico especfico y fiable, y que sean susceptibles de tratamiento o prevencin. Las indicaciones principales, por tanto, son las cromosomopatas, los defectos del tubo neural, y la edad materna avanzada. Tambin se debe valorar la aceptacin o no (por motivos ticos, religiosos o de ndole personal) por parte de la familia, del aborto eugnico como opcin. En general, la mayora de los autores desaconseja iniciar los estudios de diagnstico prenatal cuando dicha opcin no resulte aceptable, pues no est claro que el diagnstico conlleve ningn beneficio y por el contrario pueden generarse conflictos serios que son difciles de resolver y a los que el facultativo no podr dar respuesta. En estas circunstancias, el diagnstico prenatal slo sera de utilidad si se pueden tomar medidas preventivas o teraputicas en el periodo fetal, lo cual por ahora slo es posible en un nmero reducido de enfermedades. Por tanto, antes de la puesta en marcha del proceso de diagnstico prenatal es importante conocer las disposiciones de la familia respecto a las posibles opciones teraputicas, adems de considerar otros factores como la severidad de la posible enfermedad, la posibilidad de tratamiento o medidas preventivas, y la fiabilidad de las tcnicas de diagnstico prenatal. Este ltimo punto es tambin de gran importancia, y debe ser explicado con claridad y ejemplos prcticos, porque el concepto de "riesgo" no siempre es correctamente entendido. Igualmente es importante que no se realice diagnstico prenatal sin una estimacin previa del riesgo que tiene un feto concreto de padecer la enfermedad: el diagnstico prenatal no est exento de complicaciones y supone en s mismo un riesgo para el feto, por lo que no est justificado realizarlo cuando el riesgo previo de padecer enfermedad es muy bajo. Esto supone, lgicamente, que el diagnstico prenatal debe formar parte del proceso global de consejo gentico y ser realizado, siempre que sea posible, por especialistas en gentica clnica. Los dos mtodos ms utilizados para la obtencin de material fetal son la amniocentesis y la toma de una biopsia de vellosidades corinicas. La amniocentesis consiste en la toma de una muestra de lquido amnitico, que contiene clulas fetales en suspensin. Dichas clulas se pueden cultivar in vitro para despus realizar estudios cromosmicos, bioqumicos o moleculares, lo cual requiere entre 1 y 3 semanas. El procedimiento es guiado por ultrasonidos y, en manos experimentadas, fiable. Sus principales inconvenientes son el lmite de edad fetal, ya que no puede realizarse antes de las 15 semanas de gestacin, y los riesgos de prdida fetal que conlleva (en torno al 0,5-1%). La biopsia de de vellosidades corinicas puede realizarse durante el primer trimestre del embarazo, en torno a la dcima semana, y es especialmente til para realizar estudios moleculares y en la presencia de un riesgo alto de cromosomopata. En cambio, es menos utilizada que la amniocentesis cuando el riesgo de alteraciones citogenticas es bajo. El -http://www.unav.es/asignatura/genmolhumbq/ 155 de 172

Gentica Molecular Humana (F.Ciencias)-

procedimiento se realiza mediante puncin a travs de la pared abdominal (transabdominal) o a travs del cuello del tero (transcervical), bajo gua ecogrfica. En ese momento, el tejido corinico todava no forma una placenta propiamente dicha, por lo que la biopsia se examina bajo microscopio y se aslan las vellosidades (que nicamente contienen tejido fetal). El material obtenido puede utilizarse directamente (sin necesidad de cultivo) para estudios moleculares o enzimticos. En general, este procedimiento se reserva para embarazos de alto riesgo, ya que la probabilidad de prdida fetal es mayor que en la amniocentesis (en torno al 2-3%). Figura 11.17 Este video muestra grficamente el procedimiento de la amniocentesis. Dado el riesgo relativamente alto de dao fetal que tienen la amniocentesis y, sobre todo, la obtencin de vellosidades corinicas, desde hace aos se estn buscando mtodos no invasivos que permitan realizar estudios moleculares o bioqumicos en material fetal. Entre stos, estn siendo muy utilizados los mtodos ecogrficos, el anlisis bioqumico de sangre materna, el anlisis de clulas fetales presentes en la sangre materna, o incluso la obtencin de sangre fetal (aunque este procedimiento es ms invasivo y por tanto ms peligroso que los otros mencionados). Con la proliferacin de las tcnicas de fertilizacin in vitro, hoy en da tambin es posible realizar diagnstico gentico preimplantatorio, obteniendo un blastmero a partir de un embrin de pocas clulas y realizando estudios moleculares a partir del ADN de esa nica clula. Por desgracia, dicho procedimiento habitualmente no se realiza en el contexto del consejo gentico, y todava no existen datos claros acerca del posible dao fetal que pueda producir. Tampoco hay estudios abundantes sobre las tasas de error que se obtienen en el diagnstico de las distintas enfermedades genticas, y en cualquier caso su aplicacin viene limitada por la baja tasa de xito de la fertilizacin in vitro. Figura 11.18 Un video en el que se ve el diagnstico por ecografa 4D (3D en tiempo real) de un feto de 14 semanas y seis das.

Tema 12. Terapia Gnica


12.1. Componentes de un sistema de terapia gnica y vas de administracin. 12.2. Naturaleza del cido nucleico teraputico. 12.3. Tipos de vectores y su utilizacin en distintas estrategias de transferencia gnica. a) Vectores virales. b) Vectores no-virales. 12.4. Aplicaciones clnicas de la terapia gnica.

12.1. Componentes de un sistema de terapia gnica y vas de administracin


El desarrollo de la gentica molecular durante los ltimos aos, y especialmente toda la informacin derivada del Proyecto Genoma Humano, han propiciado que podamos afrontar la modificacin directa de las alteraciones genticas o la utilizacin de cidos nucleicos como agentes teraputicos. La terapia gnica es una nueva modalidad teraputica surgida a finales de los aos 80, y que puede definirse como la transferencia de cidos nucleicos (ADN ARN) con fines teraputicos. Toda estrategia de terapia gnica se basa, por tanto, en la transferencia de cidos nucleicos (transferencia gnica) al interior de un grupo de clulas. Estas clulas pueden ser las clulas enfermas -cuyo dao se pretende reparar-, o bien un grupo de clulas normales que se modifican genticamente para que sean las efectoras de una accin teraputica, por ejemplo sintetizando una protena concreta. Por lo tanto, todo sistema de terapia gnica es anlogo a un sistema de transporte, en el que hay un agente que es -http://www.unav.es/asignatura/genmolhumbq/ 156 de 172

Gentica Molecular Humana (F.Ciencias)-

transportado y un vehculo de transporte. En nuestro caso, el agente transportado es un cido nucleico y el vehculo encargado de llevarlo al interior de las clulas diana se denomina vector. Segn el modo de hacer llegar el vector (conteniendo el agente teraputico) a las clulas diana, es ya clsica la distincin entre terapia gnica ex vivo y terapia gnica in vivo. En el primer caso, la administracin del vector se realiza fuera del cuerpo: se obtiene una biopsia del rgano de inters, se expanden las clulas mediante cultivo celular y se ponen en contacto con el vector mientras estn siendo cultivadas. Esto hace posible seleccionar las clulas que hayan sido modificadas genticamente y re-introducirlas en el paciente. En la administracin in vivo, el vector teraputico se administra directamente al individuo enfermo por cualquiera de las vas habituales (intramuscular, oral, intravenosa, intraportal, subcutnea), escogiendo aquella que nos permita alcanzar la mxima eficacia teraputica.

La Figura 12.1 ilustra los componentes de un sistema de terapia gnica y las vas de administracin.

12.2. Naturaleza del cido nucleico teraputico


Segn el efecto biolgico que pretendemos obtener, el agente teraputico ser de distinta naturaleza. En general, podemos clasificar los cidos nucleicos teraputicos en tres grupos, dependiendo de si buscamos la correccin directa de una mutacin, la suplementacin gnica, o la inhibicin de la expresin. a) En los ltimos aos se ha conseguido corregir especficamente defectos a nivel del ADN de distintos modos. Uno de los primeros sistemas en ser desarrollados fue el de los quimeraplastos, molculas quimricas (hbridas) formadas por ADN y ARN que son capaces de reconocer especficamente una mutacin y corregirla. Este tipo de tecnologa funciona con cierta eficacia cuando se aplica a clulas en cultivo (in vitro), y es de esperar que en el futuro se pueda utilizar tambin in vivo. Los quimeraplastos son oligonucletidos formados por una molcula lineal de ADN que contiene un tracto de 5 -http://www.unav.es/asignatura/genmolhumbq/ 157 de 172

Gentica Molecular Humana (F.Ciencias)-

desoxi-ribonucletidos complementarios a la secuencia genmica que se quiere corregir. Es importante que esta regin correctora est flanqueada por fragmentos de 10 ribonucletidos (ARN). El oligonucletido se empareja especficamente con la regin mutada y los sistemas de reparacin celulares llevan a cabo la reparacin de la mutacin tomando como molde la base correspondiente del oligonucletido teraputico. Tericamente, es posible disear oligonucletidos ARN/ADN para corregir directamente las mutaciones puntuales que causan las enfermedades hereditarias ms frecuentes.

Figura 12.2 Estructura de un quimeraplasto. En los ltimos aos se ha avanzado mucho en el desarrollo de nucleasas con dedos de zinc, conocidas como tijeras moleculares. Son unas protenas compuestas por un dominio de unin a ADN (formado por varios dedos de Zinc) fusionado con un dominio de rotura de ADN (habitualmente procede del enzima de restriccin FokI). Los dedos de zinc pueden disearse para la unin especfica a una regin del genoma, tras la cual se genera una rotura de doble cadena del ADN. Dicha lesin es reparada despus mediante recombinacin homloga u otro sistema de reparacin del ADN, con lo que se introduce una mutacin especfica.

-http://www.unav.es/asignatura/genmolhumbq/

158 de 172

Gentica Molecular Humana (F.Ciencias)-

Una modificacin reciente que ha mejorado todava ms esta tecnologa ha sido la aparicin de las nucleasas TALEN (Transcription-Like Effector Nucleases), que tienen un dominio de unin a ADN (TAL-effector) con 33-34 aminocidos muy conservados, excepto los aminocidos 12 y 13 que son muy variables. Usando distintas combinaciones en estas posiciones, se pueden conseguir dominios de unin muy especficos para regiones concretas del genoma. Al dominio TALE se le suele unir el mismo dominio de rotura del ADN procedente de FokI. La Figura 12.3 ilustra el funcionamiento de nucleasas de dedos de zinc. En este video se explica el funcionamiento de las TALEN. b) En el caso de mutaciones que simplemente producen prdida de funcin, puede ser suficiente la suplementacin gnica, es decir, suplementar las clulas con copias normales del gen sin preocuparnos de corregir las mutaciones presentes en el ADN genmico. Lo ms habitual en estos casos es que el agente teraputico sea una unidad de expresin en la que la transcripcin del gen en cuestin viene regulada por promotores virales potentes, por promotores regulables o por promotores especficos de un tipo celular concreto.

-http://www.unav.es/asignatura/genmolhumbq/

159 de 172

Gentica Molecular Humana (F.Ciencias)-

La Figura 12.4 muestra un plsmido de expresin para suplementacin gnica. c) Cuando el defecto gentico que tratamos de corregir origina una ganancia de funcin, como suele suceder en mutaciones con efectos oncognicos, lo lgico es intentar inhibir la expresin del gen que est causando el fenotipo aberrante. Los agentes teraputicos ms utilizados en estas circunstancias son las molculas antisentido o los ribozimas. Los oligonucletidos antisentido pueden inhibir directamente la expresin de un gen al unirse a la doble hlice de ADN mediante enlaces tipo Hoogsteen, formado una triple hlice que impide la transcripcin mediada por la ARN polimerasa II. Estos oligonucletidos suelen estar modificados qumicamente para aumentar su estabilidad y eficacia, siendo las principales modificaciones los grupos fsforo-tioato en el esqueleto desoxi-ribosa-fosfato de los oligonucletidos, o bien los cidos nucleicos en los que el enlace fosfo-dister viene substituido por un enlace peptdico (denominados Acidos Nucleicos Peptdicos, PNA). Los ARNm antisentido son capaces de emparejarse con los ARN sentido y formar molculas bicatenarias de ARN que no pueden ser traducidas y son digeridas por la RNAsa H celular. Los ribozimas, pequeas molculas de ARN con actividad cataltica, pueden ser diseados para reconocer un ARNm especfico y degradarlo merced a su actividad endonucleoltica especfica. En general, la utilizacin de molculas antisentido y ribozimas est limitada por la baja eficacia que muestran todava en modelos in vivo.

-http://www.unav.es/asignatura/genmolhumbq/

160 de 172

Gentica Molecular Humana (F.Ciencias)-

La Figura 12.5 muestra los distintos tipos de molculas utilizadas para inhibir la expresin gnica. Hoy en da, las mejores perspectivas de inhibicin eficaz y especfica de la expresin gnica se basan en la interferencia de ARN, un mecanismo de silenciamiento gnico post-transcripcional descrito en plantas y C. elegans que consiste en la degradacin de ARN mensajeros endgenos por la presencia de molculas pequeas de ARN de doble cadena homlogas al mensajero que se destruye. Este proceso depende de una RNAasa tipo III llamada DICER, responsable de la formacin de los ARN pequeos, y de un complejo llamado RISC (RNA Induced Silencing Complex) que contiene unas protenas del complejo ARGONAUTA y los ARN pequeos que dirigen el complejo a la diana. Se ha visto que este mecanismo tambin juega un papel importante en la regulacin gnica en humanos, ya que el anlisis del genoma ha revelado la presencia de genes que codifican ARN pequeos (aproximadamente 75 nucletidos) que forman horquillas y que son procesados por DICER y protenas del complejo Argonauta para generar ARN intereferentes pequeos, de unos 21-22 nucletidos. Estos genes endgenos se denominan miRNA (microRNA), para diferenciarlos de los siRNA que provienen de molculas bicatenarias de ARN de procedencia externa. Actualmente se piensa que ambos tipos de molculas (miRNA y siRNA) tienen la misma va efectora, que acta impidiendo la traduccin (si la homologa de la molcula interferente con el ARN mensajero no es total), o bien eliminando los mensajeros si la homologa es total. Sorprendentemente, tambin se ha visto que las repeticiones centromricas y los transposones, cuando se transcriben, dan lugar a ARN interferentes pequeos que utilizan este mecanismo para modificar la cromatina, induciendo metilacin en las histonas en el ADN y provocando la formacin de heterocromatina o el silenciamiento transcripcional. En los ltimos aos se ha demostrado que se pueden utilizar siRNAs microRNAs para inhibir la expresin de genes endgenos, generando molculas interferentes especficas para un gen concreto. Por ejemplo, se ha conseguido silenciar genes endgenos en clulas humanas mediante siRNAs dirigidos especficamente frente a promotores concretos. Dicho silenciamiento se lleva a cabo por metilacin de los dinucletidos CpG de esos promotores y por metilacin de la lisina 9 de la histona H3 de esa regin. El avance ms espectacular usando esta tecnologa tuvo lugar en 2004, cuando un grupo consigui reducir hasta un 40% los niveles de colesterol en ratn, usando unos siRNA sintticos conjugados con colesterol que fueron -http://www.unav.es/asignatura/genmolhumbq/ 161 de 172

Gentica Molecular Humana (F.Ciencias)-

injectados directamente en la vena de la cola. Los siRNA fueron captados eficazmente por receptores del hgado, yeyuno y otros rganos y provocaron la degradacin de los ARNm endgenos de apolipoprotena B, con el consiguiente descenso en los niveles de LDL y colesterol total. Figura 12.6 El video ilustra el funcionamiento de los microARNs.

12.3. Tipos de vectores


Los cidos nucleicos teraputicos han de ser vehiculizados al interior de las clulas diana por medio de vectores adecuados. Se distinguen dos tipos fundamentales de vectores: los basados en virus (vectores virales) y los vectores sintticos (vectores no virales) que intentan emular la capacidad natural que tienen los virus de introducir cidos nucleicos en las clulas. La siguiente Tabla resume las principales caractersticas de los vectores que se mencionarn a continuacin, y que es bueno repasar al final de este tema:

Como introduccin general, se puede decir que el vector ideal de terapia gnica debera ser fcil de preparar, tener gran capacidad para aceptar genes teraputicos de gran tamao, funcionar tanto en clulas en divisin como en clulas quiescentes, ser totalmente inocuo e invisible para el sistema inmune, fcilmente dirigible a distintos tipos de clulas diana, ser capaz de persistir en las clulas durante periodos prolongados y poseer elementos reguladores de la transcripcin del gen teraputico que sean fcilmente regulables para poder variar los niveles del producto teraputico segn sea necesario. A continuacin se vern algunos ejemplos de cmo se han conseguido mejorar los distintos tipos de vectores para dotarlos con alguna de estas propiedades.

12.3.1. Vectores virales


Los vectores virales fueron los primeros en ser utilizados, dada su alta eficacia como vehculos de cidos nucleicos. Los virus estn compuestos por un ADN un ARN rodeado de una cpside proteica y, en algunos casos, una envuelta lipoproteica. El ciclo biolgico de los virus pasa por la introduccin del genoma viral en determinados tipos celulares, habitualmente por la presencia de receptores en la membrana de las clulas. Para poder utilizar un virus como vector en terapia gnica, es preciso insertar el cido nucleico teraputico en el genoma viral, y conseguir al mismo tiempo que el virus no se replique y por tanto no sea patognico. Por esto, los virus utilizados en terapia gnica se denominan virus recombinantes y defectivos (carecen de alguna funcin necesaria para su propio ciclo replicativo). A continuacin se repasan los principales vectores virales utilizados actualmente en terapia gnica.

-http://www.unav.es/asignatura/genmolhumbq/

162 de 172

Gentica Molecular Humana (F.Ciencias)-

a) Vectores retrovirales. La familia Retroviridae est compuesta por las subfamilias Spumaviridae, Lentiviridae y Oncoviridae. Los vectores retrovirales utilizados en terapia gnica estn derivados de los oncovirus murinos del tipo C, especialmente los que son anfitrpicos (que pueden infectar tanto clulas murinas como humanas). Recientemente se han desarrollado vectores derivados de lentivirus, especialmente del HIV-1. Los retrovirus son virus ARN que tienen una envuelta fosfolipdica, con glicoprotenas que determinan el tropismo del virus al ser reconocidas por receptores celulares especficos. Dentro de esta envuelta hay una cpside proteica de estructura icosadrica que contiene 2 copias del genoma viral, la transcriptasa inversa (RT), y la integrasa. El genoma de un retrovirus es una molcula de ARN de polaridad positiva en la que se distinguen 3 tipos de genes: genes gag (que codifican las protenas de la cpside), genes pol (que codifican las enzimas necesarias para el ciclo viral, como la proteasa y la integrasa) y genes env (que codifican las glicoprotenas de la envuelta). El genoma est flanqueado por dos repeticiones terminales largas (LTR, Long Terminal Repeat), y contiene tambin una seal de empaquetamiento PSI mediante la cual las molculas de ARN se unen a las protenas de la cpside y son empaquetadas eficazmente. El LTR izquierdo contiene una regin (U3) para el comienzo de la transcripcin, y un primer binding site (pbs) para el comienzo de la retrotranscripcin. El LTR derecho contiene una secuencia de poli-purinas (ppt) para la replicacin de la segunda cadena. El ciclo replicativo de los retrovirus comienza cuando el virus es reconocido por receptores celulares, lo que lleva a la fusin de la envuelta viral con la membrana celular y a la internalizacin del nucleoide. A continuacin tiene lugar la retrotranscripcin del ARNm para formar un ADNc bicatenario (este proceso tiene lugar dentro de la nucleocpside, antes de su llegada al ncleo de la clula), y despus se desensambla la cpside al llegar a la membrana nuclear. El genoma viral se integra en el genoma de la clula husped (integracin mediada por la propia integrasa del virus), y entonces comienza la transcripcin a partir del promotor U3 que est en el LTR izquierdo. Se producen distintos tipos de ARNm, fundamentalmente un transcrito que contiene gag y pol y otros transcritos que codificarn las protenas de la envuelta. Los ARNm son exportados al citoplasma y traducidos, dando lugar a poliprotenas gag-pol y a las protenas de la envuelta. Estas ltimas viajan a la membrana celular, mientras que las poliprotenas gag-pol forman nuevas nucleocpsides al unirse a la seal de empaquetamiento de los ARNm positivos. Tras el empaquetamiento, que tiene lugar en el citoplasma, las cpsides salen de la clula por gemacin, quedando rodeadas de nuevo por una envuelta compuesta por la membrana celular y las glicoprotenas codificadas por el virus que haban llegado anteriormente a la membrana. Las nuevas partculas retrovirales se activan cuando la proteasa rompe la poliprotena gag-pol dentro de la propia partcula viral y da lugar a molculas independientes de proteasa, integrasa y retrotranscriptasa.

La Figura 12.7 muestra la estructura del genoma de un retrovirus. Es importante sealar que el nucleoide de un oncovirus es incapaz de atravesar la membrana nuclear, por lo que es necesario que la clula sufra al menos una mitosis para que el genoma viral entre en contacto con el -http://www.unav.es/asignatura/genmolhumbq/ 163 de 172

Gentica Molecular Humana (F.Ciencias)-

genoma de la clula husped. En cambio, los retrovirus de la familia de los lentivirus s que pueden atravesar la membrana nuclear, por lo que pueden infectar clulas que no estn en divisin. Esta es una propiedad muy importante a la hora de valorar las posibles aplicaciones de estos tipos de vectores. Para generar un retrovirus recombinante defectivo, es necesario sustituir los genes de las protenas virales por el gen teraputico que se quiere utilizar. Lgicamente, para producir estos virus defectivos debemos usar una lnea clular (clula empaquetadora) que aporte los genes virales en trans. Estas clulas empaquetadoras tienen los genes virales insertados en el genoma celular, de modo que expresan establemente las protenas virales. Sin embargo, las copias de los genes virales que estn integradas en el genoma celular carecen de la seal de empaquetamiento, por lo que sus transcritos no pueden empaquetarse en las nuevas partculas virales. De este modo, una clula empaquetadora en condiciones normales no produce viriones completos, sino slo partculas vacas. En cambio, cuando transfectamos estas clulas con un plsmido recombinante que contenga el ADN teraputico flanqueado por los LTR y por la seal de empaquetamiento (adems de otros elementos necesarios en cis como el primer binding site, y el tracto polipurnico necesario para la sntesis de la segunda cadena) se generarn partculas retrovirales recombinantes y defectivas, que pueden ser purificadas y concentradas a partir de los sobrenadantes del cultivo celular. En este proceso es muy importante evitar la aparicin de retrovirus con capacidad replicativa, que podran generarse por recombinacin homloga entre las secuencias virales que estn presentes en nuestro plsmido con las secuencias virales presentes en el genoma de la clula empaquetadora. Por este motivo, se utilizan clulas empaquetadoras que tienen los genes virales separados entre s, de modo que seran necesarias varias recombinaciones independientes para generar un virus replicativo, algo altamente improbable. Figura 12.8 En este video se explica el ciclo replicativo de un oncoretrovirus, as como el proceso de produccin de retrovirus recombinantes defectivos. Los retrovirus recombinantes defectivos han sido muy utilizados en terapia gnica. Por las limitaciones propias del tamao del genoma viral, el ADN teraputico no puede ser mayor a 7-8 kb. Son vectores con buena infectividad, un tropismo amplio, pero son bastante lbiles (lo que dificulta su purificacin) y slo transducen eficazmente clulas que estn en divisin. Adems, son inactivados en el torrente sanguneo por el sistema del complemento, por lo que su principal uso ha estado reservado a estrategias de terapia gnica ex vivo. Su capacidad integrativa les permite alcanzar, en teora, una duracin muy larga de la expresin incluso en clulas que estn dividindose activamente. Sin embargo, los promotores virales suelen silenciarse por metilacin, por lo que la expresin no es tan prolongada como cabra esperar. Se est investigando la posibilidad de modificar el tropismo de estos vectores, mediante la creacin de protenas de la envuelta quimricas que incluyan algn scFv (anticuerpo monocatenario) u otros ligandos de receptores celulares conocidos. Como se ha mencionado, recientemente se han desarrollado vectores retrovirales basados en lentivirus, aprovechando la circunstancia de que el HIV-1 es uno de los virus mejor estudiados. El genoma de este virus contiene algunos genes (tat y rev, por ejemplo) que no estn presentes en los oncoretrovirus y que son esenciales para la expresin de los genes virales. Algunas de las protenas virales tienen seales de localizacin nuclear y facilitan la entrada del virus por los poros nucleares, de ah la capacidad que tienen estos virus de infectar clulas que no estn en divisin. Aunque los problemas de seguridad de los lentivirus estn prcticamente superados, todava hay que mejorar los sistemas de produccin para poder utilizarlos en pacientes con total seguridad. Su principal aplicacin est en la transferencia de genes a clulas del sistema nervioso in vivo, y a progenitores hematopoyticos ex vivo, siendo esta ltima una propiedad especialmente interesante por su inmenso potencial teraputico, y porque estas clulas son prcticamente intransfectables por otros medios. b) Vectores adenovirales: Se conocen gran cantidad de serotipos de adenovirus humanos, pero los ms utilizados en terapia gnica han sido los serotipos 2 y 5. Los adenovirus son virus ADN sin envuelta, responsables de las principales enfermedades de vas respiratorias altas (el catarro comn), con muy buen tropismo por clulas humanas. La nucleocpside de un adenovirus consta de una cpside icosadrica que -http://www.unav.es/asignatura/genmolhumbq/ 164 de 172

Gentica Molecular Humana (F.Ciencias)-

est compuesta por 720 protenas hexona y 60 protenas pentona. De las pentonas parte la protena de la fibra (una protena trimrica) que termina en una protena botn (knob) mediante la cual el adenovirus se une a receptores celulares especficos.

Figura 12.9 Estructura de una partcula adenoviral, con las hexonas, pentonas y fibras. Tomada del sitio educativo de los premios Nobel. El genoma adenoviral es un ADN de doble cadena de aproximadamente 35 kb de tamao, flanqueado por repeticiones terminales invertidas (ITR) de 100-140 nucletidos y una seal de empaquetamiento (psi) cerca del ITR izquierdo. Contiene gran cantidad de genes, que se agrupan en regiones tempranas (early) y tardas (late), segn el momento en que se transcriben despus de la infeccin. As, las regiones tardas se transcriben tras la replicacin del genoma viral, y contienen los genes que codifican las protenas estructurales del virus. En cambio, las regiones tempranas se transcriben antes de la sntesis del ADN viral, y cumplen varias funciones: las protenas codificadas en E1 incluyen, por ejemplo, E1A (protena necesaria para transactivar la transcripcin de los dems genes virales) y E1B 55kd (que se une a E4). Adems, estas protenas interfieren con las funciones de la clula husped: E1A es una oncoprotena, E1B 19kd inhibe la apoptosis mediada por p53 y E1B 55kd promueve la degradacin de p53. la regin E2 codifica protenas necesarias para la replicacin viral: ADN polimerasa, protena terminal, etc. la regin E3 codifica algunas protenas que ayudan al adenovirus a escapar al sistema immune, como la protena gp19kd que inhibe la presentacin de fragmentos antignicos con molculas de clase II del Complejo Mayor de Histocompatibilidad. la region E4 codifica diversas protenas que silencian genes endgenos, regulando el transporte de ARN mensajeros fuera del ncleo.

-http://www.unav.es/asignatura/genmolhumbq/

165 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 12.10 Estructura del genoma de un adenovirus. El ciclo replicativo de un adenovirus es ms sencillo que el de los retrovirus. El adenovirus se une a un receptor de membrana especfico denominado CAR (CoxackieAdenovirusReceptor) mediante el botn de la fibra, y a continuacin la pentona se une por un motivo RGD (arginina-glicina-asprtico) a integrinas cercanas para despus ser internalizado por endocitosis. La propia cpside adenoviral es capaz de desestabilizar el endosoma, que se rompe y libera las partculas virales al citoplasma. Las nucleocpsides llegan a la membrana nuclear y son capaces de introducir el genoma viral a travs de los poros nucleares. Para generar adenovirus recombinantes defectivos (es decir, que lleven el ADN teraputico pero no puedan replicarse) se sigue una estrategia similar a la que veamos para los retrovirus: substituir algn gen viral por el gen teraputico. Lo ms habitual es delecionar el genoma viral en la regin E1, para lo que necesitaremos una clula empaquetadora que exprese de manera estable los genes contenidos en esa regin. La lnea celular ms utilizada como clula empaquetadora para construir adenovirus recombinantes se denomina clula 293. Para conseguir el adenovirus recombinante, se cotransfectan clulas 293 con dos plsmidos distintos: un plsmido en el que el gen teraputico est flanqueado por parte del gen E1, la seal de empaquetamiento y los ITR virales, y otro plsmido que contiene todo el genoma viral excepto la seal de empaquetamiento y la regin de E1 que est presente en trans en el genoma de las clulas 293. Una vez dentro de la clula, los mecanismos de recombinacin son capaces de generar un genoma viral recombinante que llevar el gen teraputico dentro del genoma viral (al que le falta E1). Como el gen teraputico va unido a la seal de empaquetamiento PSI, nicamente estos transcritos se empaquetarn correctamente en las nuevas cpsides virales, mientras que los genomas virales producidos endgenamente carecen de la seal PSI y por tanto no producen viriones infectivos. Los adenovirus delecionados en E1 permiten insertar genes teraputicos con un tamao mximo de 5 kb, por lo que posteriormente se han generado vectores que llevan adems deleciones en E3 y E4, para conseguir llegar a una capacidad de 7-8 kb. La ltima generacin de vectores adenovirales consiste en los llamados adenovirus gutless (vacos), en los que todo el genoma viral ha sido delecionado y por tanto tienen una capacidad terica en torno a las 30 kb de ADN exgeno. Para producirlos hay que aportar en trans todas las funciones adenovirales necesarias, mediante plsmidos helper por estrategias que utilizan el sistema Cre/loxP. Figura 12.11 El proceso de produccin de adenovirus recombinantes defectivos se muestra en este video. Los adenovirus comenzaron a usarse en terapia gnica ms tarde que los retrovirus, pero rpidamente ganaron en popularidad y hoy en da son los vectores ms utilizados para aplicaciones in vivo. Infectan gran variedad de clulas, son relativamente estables y fciles de purificar y concentrar, y son eficaces tanto sobre clulas quiescentes como sobre clulas en divisin. Como el genoma del vector no se integra en el genoma de la clula husped, la duracin de la expresin en clulas en divisin es limitada. Su principal inconveniente es la toxicidad que producen a dosis altas, y la fuerte respuesta inmune celular y humoral que sigue a su administracin, con la consiguiente disminucin de eficacia teraputica. Los nuevos vectores adenovirales vacos superan algunos de estos inconvenientes. c) Vectores Virales Adenoasociados: Se trata de Parvovirus que infectan al hombre pero no son patgenos. Pertenecen al grupo de los Dependovirus, virus ADN sin envuelta que necesitan de funciones helper para completar su ciclo replicativo completo. Estas funciones helper las aporta un adenovirus o un herpesvirus que sobreinfecta las mismas clulas que previamente haban sido infectadas por un dependovirus. El genoma de un virus adenoasociado es un ADN monocatenario con un tamao de 4,8 kb y una estructura muy simple, con dos regiones codificantes: cap, que codifica las tres protenas de la cpside, y rep, que codifica 4 protenas necesarias para la replicacin viral. El genoma est flanqueado por dos repeticiones terminales invertidas (ITR), que forman unas estructuras en horquilla y que son los nicos elementos necesarios en cis para poder llevar a cabo el ciclo vital del virus.

-http://www.unav.es/asignatura/genmolhumbq/

166 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 12.12 Estructura del genoma de un adenoasociado. La infeccin por un virus adenoasociado comienza por la unin del virus a receptores celulares y su entrada en la clula. El genoma viral es capaz de entrar en el ncleo incluso en clulas que no se dividen, y una vez all se convierte a doble hebra y se integra en un locus especfico localizado en el brazo largo del cromosoma 19 humano (banda 19q13). Todas estas funciones estn mediadas por protenas de la clula husped, pero adems se ha comprobado que las protenas virales Rep78/68 son necesarias para la integracin especfica del genoma viral en una secuencia llamada AAVS1 que est en 19q13. En ausencia de funciones helper, el genoma viral integrado permanecer como un provirus, en forma latente. Ante una sobreinfeccin por adenovirus herpesvirus, el adenoasociado comienza su fase ltica con la transcripcin de los genes virales, la replicacin del genoma viral y el empaquetamiento en las cpsides para dar lugar a nuevos viriones. Para obtener virus adenoasociados recombinantes como vectores en terapia gnica, se construye un plsmido recombinante que contiene el gen teraputico flanqueado por los ITR virales. En el mtodo clsico de produccin de estos vectores, se cotransfectan clulas 293 con el plsmido recombinante y con otro plsmido que aporta en trans las funciones cap y rep, y despus se infectan esas mismas clulas con un adenovirus. El problema de este procedimiento es que los preparados virales tienen una fuerte contaminacin por adenovirus, por lo que es necesario inactivar este adenovirus contaminante mediante tratamiento con calor. Los mtodos actuales de produccin evitan este problema al aportar las funciones helper del adenovirus en un tercer plsmido que se cotransfecta con los otros dos, de forma que la generacin de adenovirus maduros es prcticamente imposible. Figura 12.13 El siguiente video muestra el ciclo replicativo de un AAV y la estrategia para la produccin de AAV recombinantes defectivos. Los vectores adenoasociados estn ganando popularidad rpidamente por sus extraordinarias caractersticas: buena infectividad, integracin en el genoma de la clula husped, muy baja toxicidad y ausencia de -http://www.unav.es/asignatura/genmolhumbq/ 167 de 172

Gentica Molecular Humana (F.Ciencias)-

respuesta inmune celular frente a las protenas virales. Por desgracia, la especificidad de la integracin en un locus concreto se pierde en los virus adenoasociados recombinantes, ya que no se produce Rep68/78 (que es absolutamente necesaria para que tenga lugar esta integracin especfica). En consecuencia, la integracin se realiza al azar, como en el caso de los retrovirus. Los virus adenoasociados pueden transducir clulas mitticas o clulas en divisin, y estn especialmente indicados en aplicaciones in vivo en las que se requiere una expresin prolongada del gen teraputico. d) Otros vectores virales que actualmente estn ganado en popularidad son los Herpesvirus, basados en el virus del herpes simplex (HSV), que tienen un marcado tropismo neuronal y por eso se emplean fundamentalmente para la transferencia de genes al sistema nervioso. Los HSV son virus envueltos con un genoma lineal de 152 kb de ADN bicatenario, en el que se han identificado ms de 80 genes. El genoma est dividido en dos regiones nicas (Larga y Corta) que estn flanqueadas por repeticiones terminales (TR) y repeticiones internas (IR). El virus se une a glicosamino-glucanos celulares y a receptores celulares especficos (por ejemplo, el receptor HveC, que pertenece a la superfamilia de las inmunoglobulinas y se expresa a alto nivel en el sistema nervioso). Tras la entrada en la clula, el virus avanza por transporte retrgrado y llega al ncleo, penetrando por los poros nucleares. Despus de entrar en el ncleo se expresan los genes inmediatos tempranos, que activan la expresin de los genes tempranos (necesarios para la sntesis de ADN viral) y de los genes tardos (protenas estructurales). Una caracterstica importante es que uno de los genes inmediatos tempranos (ICP4) es absolutamente necesario para la replicacin viral, por lo que basta eliminarlo del genoma para obtener virus defectivos. En los vectores actualmente en uso se han delecionado todos los genes inmediatos tempranos, por lo que son totalmente apatognicos. Otra caracterstica importante de estos virus es que cuando no se replican entran en un periodo de latencia en el que se transcriben nicamente unos transcritos asociados a latencia (LATs), aunque no se expresen los genes inmediatos tempranos. Por tanto, incluyendo la unidad transcripcional en la regin de latencia se pueden obtener virus defectivos que expresan de forma persistente un gen teraputico. Adems, se trata de vectores de gran capacidad porque permiten acomodar hasta 50 kb de ADN exgeno.

Figura 12.14 Estructura del genoma de un virus del herpes simple.

12.3.2. Vectores no-virales


-http://www.unav.es/asignatura/genmolhumbq/ 168 de 172

Gentica Molecular Humana (F.Ciencias)-

Los Vectores no-virales representan un intento de imitar las funciones de los virus como vehculos de transferencia gnica mediante sistemas sintticos, de forma que en principio son vectores mucho ms seguros desde el punto de vista de su peligrosidad biolgica y su patogenicidad. En este sentido, los vectores no-virales no se diferencian conceptualmente de los frmacos a los que estamos habituados. La principal limitacin de este tipo de vectores es que, en la actualidad, su eficacia in vivo es mucho menor que la de los vectores virales. Esto se debe a la inestabilidad propia de sistemas sintticos complejos y a las diferentes barreras que han de superar: Los complejos entre el cido nucleico y los dems componentes de estos sistemas han de ser estables tras su administracin, y no desintegrarse antes de alcanzar las clulas. Por otra parte, la biodistribucin de estos preparados hace que la concentracin efectiva en las clulas diana sea baja, por lo que es importante que lleven en su superficie algn tipo de ligando para receptores especficos de las clulas a las que lo queremos enviar. Habitualmente, estos complejos entran en las clulas por endocitosis, de manera que quedan expuestos al ataque de las enzimas lisosomales. Para evitar esto, se intenta incluir en estos vectores algn tipo de molcula que altere el pH del endosoma y consiga romperlo antes de su fusin con los lisosomas y liberar as el complejo intacto al citoplasma. Estas molculas suelen ser pptidos o protenas virales que cumplen esta misma funcin en algunos tipos de virus. Una vez en el citoplasma, estos complejos han de ser lo suficientemente estables como para llegar hasta el ncleo, pues si el cido nucleico se libera muy pronto ser degradado por nucleasas citoplasmticas. Pero si son demasiado estables, el cido nucleico no conseguir liberarse y por tanto no podr entrar en el ncleo de la clula. Este compromiso entre proteccin y liberacin es quizs uno de los retos ms importantes que tienen que superar los vectores no virales para aumentar su eficacia actual. En cierta medida, la inclusin en estos complejos de alguna molcula capaz de dirigirlos al ncleo celular servira para acelerar su trnsito citoplasmtico. Por tanto, otro componente habitual en los vectores no virales son las molculas con seales de localizacin nuclear que adems permitan la entrada del cido nucleico a travs del complejo del poro nuclear, pues de lo contrario slo sern capaces de ser efectivos en clulas que estn en mitosis. Como se ve, la tarea de construir un vector no-viral ideal equivale a intentar reconstruir en el laboratorio lo que los virus consiguen de manera natural, lo cual no es en absoluto sencillo. En cualquier caso, son uno de los campos de investigacin ms activa, sobre todo por parte de empresas farmacuticas y de biotecnologa, y es previsible que los prximos aos vean avances significativos en este terreno. Actualmente, los vectores no-virales ms utilizados son los siguientes: a) Inyeccin Directa: Lgicamente, lo ms sencillo es injectar directamente el cido nucleico (ADN desnudo) en el rgano de inters. Aunque poco eficaz, este procedimiento funciona razonablemente en ciertas aplicaciones y en algunos rganos. Por ejemplo, el msculo esqueltico es uno de los rganos que ms eficazmente incorporan un plsmido inyectado, alcanzando niveles de expresin suficientes para conseguir inmunizacin frente a protenas virales, tumorales, etc. En ocasiones se utiliza la inyeccin de ADN formulado con diversos polmeros (sobre todo poli-vinil-pirrolidona) que lo protegen de la accin de las nucleasas y prolongan su vida media tras la administracin. Tambin se utiliza el ADN encapsulado en microesferas de polmeros biodegradables (por ejemplo, copolmeros de cido lctico y gliclico), que pueden inyectarse en un rgano y proporcionar liberacin sostenida del cido nucleico teraputico durante un periodo de tiempo ms o menos prolongado, dependiendo del tipo de polmero utilizado. Otra variedad es la transferencia gnica balstica (pistola gnica o gene gun), en la que el cido nucleico teraputico se adsorbe sobre la superficie de una bolas microscpicas de oro u otro metal inerte, que son disparadas a presin sobre el rgano diana. Es una va de administracin utilizada en la piel (para inmunizacin gnica) o a veces sobre otros rganos, pero las bolas no tienen un gran poder de penetracin (raramente superior a unos pocos milmetros).

-http://www.unav.es/asignatura/genmolhumbq/

169 de 172

Gentica Molecular Humana (F.Ciencias)-

Figura 12.15 Transferencia gnica por inyeccin intramuscular directa. b) Complejos formados por el cido nucleico teraputico y otros componentes: son los sistemas ms complicados de elaborar y optimizar, pero los ms eficaces dentro de los vectores no-virales. El principio que subyace a todos los sistemas de este tipo es la complejacin del ADN (molcula grande con alto nmero de cargas negativas) con polmeros de naturaleza catinica (con cargas positivas), de manera que la neutralizacin de cargas da lugar a complejos ms o menos estables, de pequeo tamao, en los que el ADN est protegido de la accin de nucleasas. Suele distinguirse entre lipoplexos (cuando el ADN se compleja con lpidos catinicos) y poliplexos (ADN complejado por policationes, habitualmente poli-lisina o poli-etiln-imina). Sobre la estructura bsica de un lipoplexo o un poliplexo pueden aadirse otro tipo de molculas que acten como estabilizadores, ligandos para receptores especficos, molculas desestabilizadoras del endosoma, seales de localizacin nuclear. Por ejemplo, se ha utilizado poli-etiln-glicol para aumentar la estabilidad de lipoplexos en el torrente sanguneo y evitar la inactivacin por el suero. Asimismo, ha sido muy utilizada la unin de poli-lisina a transferrina o a orosomucoide, para conseguir unin especfica a receptores hepticos. Otra estrategia utilizada con bastante xito ha sido la formacin de lipoplexos que adems incluyen partculas del virus hemaglutinante del Japn (virus Sendai) inactivados, lo que proporciona una entrada en las clulas muy eficaz (por la fusogenicidad del virus Sendai) y buen escape endosomal. Figura 12.16 Este video muestra la combinacin de vectores virales y no virales, con un ejemplo tomado del virus hemaglutinante del Japn (virus Sendai).

12.4. Aplicaciones clnicas de la terapia gnica


Desde el caso de la nia Ashanti Da Silva, primer paciente de la historia tratado mediante terapia gnica en 1989 por sufrir Inmunodeficiencia Combinada Severa (dficit del enzima adenosn-desaminasa), el nmero de ensayos clnicos llevados a cabo en todo el mundo ha aumentado rpidamente, de manera que en la actualidad hay varios miles de enfermos includos en protocolos clnicos de terapia gnica. Como las estrategias utilizadas son variadsimas, a continuacin se resumen las ms utilizadas hasta el momento: Terapia gnica del cncer: la estrategia ms utilizada es, sin duda, la utilizacin de los llamados genes suicidas. Se trata de transferir a las clulas tumorales un gen que codifique una protena capaz de activar un pro-frmaco inactivo a su forma activa. Es muy popular la utilizacin del gen de la timidn-kinasa del virus -http://www.unav.es/asignatura/genmolhumbq/ 170 de 172

Gentica Molecular Humana (F.Ciencias)-

del Herpes Simplex (HSV-tk), que codifica una timidn-kinasa capaz de fosforilar el ganciclovir a ganciclovir-trifosfato. El ganciclovir tri-fosfato es la forma activa capaz de interferir con la replicacin del ADN y provocar la muerte de las clulas que estn dividindose activamente. Por tanto, si somos capaces de transferir el gen de la HSV-tk a las clulas de un tumor, que tienen una alta tasa replicativa, la administracin sistmica de ganciclovir conseguir matar selectivamente las clulas tumorales. Una ventaja aadida es el llamado efecto espectador (bystander), mediante el cual la timidn-kinasa producida en unas clulas puede pasar a las clulas vecinas, de forma que aunque no todas las clulas tumorales hayan incorporado el gen teraputico, el efecto citotxico es bastante homogneo en todo el tumor. Esta estrategia se ha empleado en tumores cerebrales, usando vectores retrovirales para transducir slo clulas tumorales (en divisin) pero no neuronas (que no se dividen). Tambin se ha empleado con xito en tumores hepticos, usando en este caso vectores adenovirales. Otra estrategia utilizada en terapia gnica del cncer se basa en la suplementacin de las clulas malignas con genes supresores tumorales (p53, por ejemplo). Se ha utilizado tambin la transferencia al tumor de genes que inhiben la angiognesis (endostatina, angiostatina, etc) para eliminar el tumor por falta de aporte vascular. Por ltimo, una de las estrategias que han tenido ms xito y que ofrecen mejores perspectivas de futuro es la inmunopotenciacin, es decir, favorecer la puesta en marcha de una respuesta inmune frente a las clulas tumorales. En este sentido, se han transferido los genes de gran variedad de citoquinas o molculas inmunopotenciadoras (IL-2, IL-12, GM-CSF, IFN-g, TNFa, etc.) tanto a clulas tumorales como a clulas presentadoras de antgeno (clulas dendrticas), o bien se han transferido a las clulas tumorales los genes de molculas co-estimuladoreas del complejo mayor de histocompatibildad (por ejemplo, B7.1) para favorecer la presentacin de los antgenos tumorales. El video de la Figura 12.17 muestra algunos ejemplos de utilizacin de terapia gnica frente al cncer. Terapia gnica de enfermedades hereditarias: la mayora de las enfermedades metablicas debidas a mutaciones inactivantes en genes que codifican protenas con actividad biolgica (un enzima, un factor de coagulacin, una hormona, etc) pueden abordarse mediante una estrategia de suplementacin gnica que restaure los niveles de la protena deficiente. Por ejemplo, se ha utilizado la transferencia gnica al msculo para conseguir la produccin local de distrofina en casos de distrofia muscular de Duchenne. De manera similar, se han transferido genes al msculo o al hgado para que estos rganos secreten al torrente circulatorio un factor que est ausente. En este sentido, ha tenido especial resonancia el xito alcanzado con la transferencia mediada por virus adenoasociados del gen del factor IX de la coagulacin al msculo esqueltico, para producir niveles plasmticos de este factor que puedan corregir los defectos en la coagulacin que sufren animales hemoflicos. En los ltimos aos, hemos asistido a importantes avances en este campo, como la curacin de dos nios con adrenoleucodistrofia, la restauracin de la visin tricromtica en monos daltnicos, la curacin de un paciente adulto con talasemia, la reparacin de una mutacin causante de hemofilia mediante nucleasas de dedos de zinc, o la curacin de 13 nios burbuja. Inmunizacin frente a enfermedades infecciosas mediante transferencia gnica, con el fin de que las clulas sinteticen pptidos inmunognicos y estimulen al sistema inmune hasta eliminar el agente patgeno. Se estn ensayando inmunizaciones gnicas frente a virus (virus B y virus C de la hepatitis, virus de la gripe) u otros agentes, como el parsito de la malaria. Es bastante eficaz la inyeccin directa de un plsmido en msculo o la transferencia intradrmica mediante pistola gnica. En general, la eficacia de estos tratamientos reside en la capacidad de producir localmente una protena que sea liberada y capturada por macrfagos y otras clulas presentadoras de antgenos, que procesan esas protenas a pequeos pptidos y los presentan con molculas de clase II del sistema mayor de histocompatibilidad (MHC) para estimular las clulas CD4+ (linfocitos T helper). Adems, si las clulas transfectadas expresan molculas de clase I del MHC tambin podrn presentar los pptidos recin sintetizados y estimular clulas CD8+ (linfocitos T citotxicos). Tras ms de 20 aos de trabajo, la terapia gnica est comenzando a demostrar su utilidad clnica en humanos, como se ha visto en los prrafos anteriores. De todas formas, an ser necesario esperar a los resultados de los ensayos clnicos que estn en marcha en todo el mundo. En 2012 haba 1843 ensayos clnicos activos, el 79% de ellos en fase I (estudio de toxicidad) fase I/II. El resto son ensayos en fase II -http://www.unav.es/asignatura/genmolhumbq/ 171 de 172

Gentica Molecular Humana (F.Ciencias)-

(estudio de eficacia teraputica) o en fase III, y dos estn ya en fase IV. Las tablas siguientes, tomadas del sitio web del Journal of Gene Medicine, agrupan estos ensayos por tipos de enfermedad, vector o molcula teraputica:

-http://www.unav.es/asignatura/genmolhumbq/

172 de 172