Está en la página 1de 18
LA ORGANIZACION DEL GENOMA HUMANO Reparticién del genoma en los cromosomas. Localizacién de las secuencias de ADN. Definicién y denominacién de los genes humanos. Caracteristicas globales del genoma. Variantes: SNP. Repeticiones. El proteoma humano. Microarreglos. Tipos de microarreglos : ry sus usos. Introdu n La conerecién del Proyecto del Genoma Hu- mano en 2003 permite describir por primera vez las caracteristicas generales del genoma (con- ">, junto de la informacién genética) de la especie >. humana.!? } Bxiste consenso en cuanto a que esta etapa, 3 decir la del completamiento de la secuencia- 4s, ci6n del ADN humano, no es sino la base nece- saria para traducir toda esa gran masa de datos de secuencias de ADN en conocimientos biol6- Bicos funcionales, muchos de ellos aplicables en. ‘medicina. El paso inmediatamente posterior es la descripcién completa del conjunto de protef- i) nas que pueden ser producidas por las células humanas, es decir el proteoma humano. Este aso indudablemente es més complejo y labo- rioso y requeriré mds tiempo que los quince afios planificados para el desarrollo del Proyec- to del Genoma Humano. En realidad lo que ha coneluido es simplemente la enumeracién de la secuencia de bases a lo largo de las moléculas de ADN de los 23 cromosomas humanos, un pro- yecto tecnolégico de gran envergadura, alto costo (unos 3.000 millones de délares) y mucho tiempo, pero atin quedan. numerosos interro- antes acerca del significado funcional de estas secuencias, como lo demuestra la dificultad pa- ra determinar el niimero exacto de genes en hhuestro genoma, que se considera que se apro- xima a 28,000 pero cuya exactitud sigue discu- tigndose (en el afio 2000, con gran parte del ge- noma ya secuenciado, las estimaciones del ni- mero total de genes en los centros de estudios variaban entre 30,000 y mas de 100.000; los ni- meros mayores de 30.000 han sido descartades). Esto quiere decir que los estudios genémicos no han concluido con la secuenciacién final del DN. Una parte importante de esta disciplina sgenémica (estudio del conjunto de genes de un organismo) es la genémica comparada, que es el andlisis comparado de las secuencias de ADN de organismos modelo, en los que se conoce la secuencia total o una parte sustancial de ella. Esto muy til cuando se encuentran secuencias conservadas en diferentes organismos, que indi- can que esas secuencias son, necesariamente 110 Gen ie Humana Iuasta el allo 2001. FI reducido nvimer de genes de la especie humana (alrededor de 28,000) no implica un mente reducido de protefnas; dada la frecuencia de empalmes alternatives en mu chos yenes y la varivdad de prucesumiento pos- traduccional de ciertas proteinas, se ha estima- do que el niéimero de diferentes protefnas que componen el proteoma humano es varias veces mayor, y probablemente mayor de 100.000. Es- tas complejidades explican por qué el proceso de “anotamiento” (nombre que se le da a la lo- calizacién exacta de cada secuencia codificante de genes y su funcién) de las secuencias de ADN que se pensaba publicar junto con las se- ‘cuencias, solo esti terminado en una minoria de ella. Con la acumulacién de grandes némeras de datos de secuencias ha surgido una. diseiplina que trata de clasificar, ordenar, archivar y pre- sentar informaciones genéticas a los investiga- ores y al pablico: la bioinformstica. Esta disci- plina tiene gran importancia en medicina por- que el acceso a los datos actuales de la genética molecular tiene lugar mediante los métodos de- sarrollados por la bioinformstica. Hoy las bases de datos son esenciales para adquirir informa- cin genética. Por otra parte, con el desurrollo del Proyec- to del Genoma Humano se planificé como uno de los objetivos el estudio del impacto social, legal y ético de los nuevos avances de la genéti- ca, Este objetivo es tratado por el programa “ELSI”, parte del proyecto. Sin embargo, los adelantos logrados en bioética han sido menos significativos que los logrados en ciencia bésica ‘yson especialmente poco conocidos en los paf- ses menos desarrollados. La descripcién minuciosa del patron de ban- das de cada cromosoma humano, que fue reali- zada por los citogenetistas durance las dltimas décadas del siglo xx, asf como la localizacién de secuencias marcadas (con un marcador que-fi- nalmente se revela por fluorescencia) en cada sector de los cromosomas, han sido muy ttiles para la secuenciacién, y en el mapa actual se comienza justamente por la localisacién citoge- nética. Reparticién del genoma (ADN) en los cromosomas EL ADN secuenciado se corresponde con una molécula de ADN por cada uno de los 22 ‘autosomas (cromosomas no sexuales) y también con una molécula de ADN del cromosoma X y otra del cromosoma Y (ademés hay un pequefio ‘Cuadro 6-1. Organismos “modelo” entre los eucariontes usados con frecuencia para comparar secuen- cias de ADN y su organizaciin (genémica comparada). El ratén (Mus musculus) 9 la especie humana tienen el mismo nsémero de genes ¢ igual anasto de ADN y solo el doble de genes que la mosca Drosophila melanogaster ORGANISMOS EUCARIONTES CON GENOMA SECUENCIADO Organismo “Tamaito (ADN) Fecha de secuencia NS de genes S. cerewsiae 12,1 Mb 1996 6.034 - 6.100 (levabera) C. elegans 9TMb 1998 19.100 (aprox.) A. thaliana 100Mb 2000 25.000 D. melanogaster 180 Mb 2000 13.000 Mus musculus 3.000 Mb 2003, = 28.000 Homo sapiens s. 3.000 Mb 2003 = 28.000 ADN propio de kas mitocondrias, el ADNa). Lia longitud del ADN, es decir su eantidad en millones de bases (Mb), es aproximadamente proporcional al tamafio de cada cromosoma (cuadro 6-2). parte de su localizacién en uno de los exo- ‘mosomas, una secuencia weénica de ADN puede hallarse en cualquiera de las dos eadenas; y imo éstas son antiparalglas y el sentido (u orien- tacién) de un gen es siempre de 5' 3, debe es- tablecerse si la secuencia se halla en la cadena positioa (sentido 5'-3" hacia el centrémero, a partir del extremo del brazo corto) 0 en la ca- dena negativa (sentido 5'-3" a partir del extre- smo del brazo largo). También debe establecer- se la cantidad de exones que contiene el gen, la longitud de cada uno de ellos y el ramatto de sus intrones. Una caracterfstica muy variable ‘de los genes humanos es la longitud de ADN que ocupan (ADN genémico, por oposicién al ADNe, que siempre es compacto por ser la co- pia del ARNm); por ejemplo, el gen de la dis- trofina (denominado DMD porque es respon- -sable de la distrofia muscular de Duchenne- Becker) ocupa mis de 2 Mb en el cromosoma - Xpl1.3 y tiene 79 exones, pero su ADNe pose solo 14 kb, Por su parte, el gen SRY (determi- nnante del sexo) en el cromosoma Y ocupa solo 2,2 kb y tiene un Gnico exén (véase cap, sobre Adeterminacién sexual). También es necesaria “estublecer los puntos que determinan el empal- ‘ine, no solo los inicios y las terminaciones de Jos intrones, por cuanto es muy comiin que {existan localizaciones de empalmes alternati- £¥0s (el citado gen de la distrofina, DMD, es un “buen ejemplo de ello, con un minimo de 8 em- «palmes alrernativos). Una vez determinados los _-exones, mediante el cddigo genético es posible “ predecir la secuencia de aminodcidos de la pro- {tena codificada, En cuanto a dicha secuencia, se Jpdebe buscar si coincide, aunque sea parcial- “mente, con las secuencias de segmentos de tas proteinas conocidas. A parti de esos “do- {minios” homologos alos de una proteina cono- Weide) wets entpoeitioia geeitaipeate papel -furicional de la proteina buscada. Todas estas “informaciones y otras de caricter exclusiva- “mente técnico se encuentran en bases de datos ‘accesibles por Internet. La organizacion del Genoma Humano_111 Cuadeo 6-2. Timaito en megabases (MB) del ADN de cada cromosoma humano.24 Coomosoma “Tamato del ADN en Mb 1 263 2 255 3 24 4 203 5 194 6 183 7 m 8 155 9 145 10 Mt u Me 2 43 B ns 4 109 5 106 16 98 7 2 8 85 9 a 2 n n 50 2 56 x 164 y 8 TOTAL 3.286 Localizacién de las secuencias de ADN en Ios cromosomas humanos. El visor del mapa (génico) Actualmente la localizacién de un gen hu- mano y su estructura puede buscarse en la base de datos oficial estadounidense “Entrez” del NCBI (Centro Nacional de Informacién Bio- tecnolégica de los Estados Unidos), que puede ser consultada sin cargo por Intemet. Una de las formas mAs practicas de buscar esa informa- ccidn es a través del “visor del mapa” (Map Vie- wer), al que se accede en: http://www.ncbi.nlm- rnih.gov/mapview/map_search.cgi. En exe sitio se encuentra el esquema de los 22 autosomas, los eromosomas X e Y y un sim- 112__Genética Humana bolo del genoma mitocondrial. El ndmero de ‘cada cromosoma es un “vineulo” (link) con el cual se accede en particular a cada uno (fig. 6- v. Cuando se sefiala un cromosoma determi- nado en el “visor del mapa” aparece el esque- ma de bandas de ese cromosoma y luego los genes en su orden ya establecido, aparte de muchos otros detalles. Cada zona por visuali- zar puede ser expandida en grados sucesivos, hasta que se vea la estructura en exones ¢ in- trones de cada gen. La secuencia de bases es- pecifica de cada exén o cada regién también se muestra en un vinculo (“seq”). Si se efec- da una sefial con el ratén en el nombre abre- viado (sigla) del gen se visualizan datos sobre su ARNm, un pequefio resumen de la protei- na codificada, las mutaciones reconocidas y otros datos. Por consiguiente, para poder ini- ciar una bisqueda en el mapa del genoma hu- mano es conveniente saber la sigla correcta del gen de interés, aunque en muchas ocasio- nes basta con conocer el nombre correcto de la enfermedad o el sindrome correspondiente al gen, o el de la proteina codificada por ese gen. (fig. 6-2). oo —— 1 2 6 a a peak ltlitdi 14 15 16 7 18 19 20 Fig. 6-1. Orfico de los 22 autosomas, los cromosomas Xe ¥ y e fone del ADN mitocondrial. EL nsmero corespondin? 0" del cortexpondiente cromosoma. (Gréfico del sitio "Map te (en azul) es un “vinculo” que en lntemet se ditige al view” de la base de datos del NCBI; véase el texto). Defini de datos n de un gen en las bases La indefinicién sobre el niéimero exacto de ‘genes humanos a pesar de la finalizacién de la secuenciacién del ADN se debe a los problemas que entrafia le definici6n actual de un gen hu. mano. Esta definici6n, dada la creciente tras- cendencia de los ARN codificados en el geno- ma que no se traducen a proteinas (ARN es- tructurales, cataliticos y reguladores, como los productores de interferencia por ARN), debe comprender tanto la codificacién de protefnas como de ARN. Por consiguiente, un gen se de- fine como un segmento completo de ADN cromo- sémico capaz de generar un producto funcionante Es importante que se subraye la funcionalidad del producto. Sin embargo, en el caso de segmentos de ADN concretos hay dificultades con esta de- finici6n. Esas dificultades surgen de la aplica- ccién de los distintos criterios para definir un gen que se mencionan a continuacién. 1. La presencia de un marco abierto de lectura (MAL, en inglés “ORF"). La definicién ya vista de un MAL (un codén de iniciacién Biingi Zz ° MT 20 Numero de exones por transcripto. ig. 63. Distibucién del numero de exones en una poblacign de transcriptos del genoma humano. Las frecuencias mayo- fie corresponden a pocos exones (1.2 4) peto alguns genes poseen més de 20 ¢ incluso més de 100 exones (hacia Ia dere- 116 Genética Humana variantes son auténticus y no el producto de errores en el proceso de {a secuenciacién. Por otra parte, la distribuciin de los SNP a lo laryo del genoma no es aleauora, es lec, hay regiones con tendencia a acumular variantes (ADN intrénico ¢ intergénico) y otras regiones (exones) en las que ccurre lo contrario; esto dltimo se explica porque la seleccidn natural tiende a expulsar es- tas variantes en los exones, cuando son nocivas. El hecho de que la tasa de variantes en los exo- nes, que cambia el sentido (un aminoécido por ‘otro) sea muy baja (0,12%) es fundamental para dar basamento a la presuncién de que existe una mutacién (que puede ocasionar una enferme- dad) cuando en una secuencia de un ex6n hay un cambio de una base. Por consiguiente, la basque- dda de mutaciones por secuenciacién de genes en caso de enfermedades, en general est convalida- da (sin olvidar que hay mutaciones silenciosas que no se teflejan en el fenotipo). Ademés, los SNP son heredables y por consi- guiente pueden ser usados como “marcadores” 0 hitos para localizar genes. Algunos datos numéricos del genoma humano Enel cuadro 6-3 se mencionan algunos datos: tgenerales obtenidos durante la realizacién del Proyecto del Genoma Humano? Como se desprende del cuadro 6-3, los genes hhumanos se encuentran muy fragmentados, por- que los que poseen més de un ex6n tienen intro- nes de un tamafio considerablemente mayor que los exones. En promedio, los genes ocupan el 25,5% del ADN de la eucromatina pero el 24,4% corresponde a los intrones y solo el 1,1% a los ‘exones. Esto quiere decir que en el caso de los ge- nes que poseen mas de un exén, cabe esperar que la mayor parte de la secuencia de ADN corres- ponda a los intrones. Ahora bien, como cada cex6n de un gen en general corresponde a un “do- rminio” de una proteina, se puede arribar a la con- clusién de que nuestro genoma tiende a represen tar dominios (sectores con una forma espacial y una funcién particular) de proceinas, més que proteinas {ntegras. Cuando se compara el genoma hhumano con el de organismos menos complejos, como el gusano C. elegans o la mosca Drosophila, se observa que en el genoma humano se producen, més combinaciones de dominios de proteinas 0 ‘que es mas “creativo” en su manejo."Este concep- to también surge de la evaluacién de los empal- ‘mes alterativos de los genes humanos, que en promedio permiten que cada gen pueda codificar tres proteinas.® Repeticiones en el genoma humano. Genes pardlogos y ortélogos La secuenciacién del genoma ha confirmado Ja existencia de una gran cantidad de secuen- cas repetidas (aproximadamente el 35% del ge- noma). Las secuencias repetidas y cortas deno- Cuadro 6-3. Datos generales de la secuencia del genoma humano 2 [Neimero de genes “anotados” Genes de funcién desconocida Gen con el mayor nimero de exones (234 exones) “Tamato de los genes humanos (promedio) Total de ADN en “desiertos génicos” Total de ADN ocupado por exones oral de ADN ocupad por intrones ‘Toral de ADN intergénico ‘Tasa de variantes de un nuclestido (SNP) 26.383 42% ‘TIN (Tiina) 27 kb 605 Mb 11% 144% # 74.5% 11.250 pb “Los dats de esta tabla provinen dela pblicaciin de grupo Celera (Venter etal, 2001.2 El tal secuenciado no coresponde al al dA tua, puro que etn ena lguas eos pntpsmae ls corepondients a eterocromana conta (emwonen et rninavlas Alu ocupan 288 Mb, e 10% lel gen ain. E que son el producto dle muchas retropesiciones de un ARN especial (ARN 7SL) y cuya funcién se desconoce, tienen ln peculiaridad de acumue fare en kas cen genes funcio: nales, de modo que no solo no parecen perjui- carla funci6n yénica sino que adems es posible que intervengan de glguna manera en su re | lacién. En cambio, las » | langas conocidas como LINE (long interspersed repeated sequences) no presentan este tipo de asociaci6n con genes funcionales, a pesar de ‘que cubren 466 Mb. Por utro lado, hay secuencias de tipo génico que son précticamente idénticas a una copia de tun gen pero que finalmente no se “expresan” en. rningén fenotipo, a veces por carecer de promo- tot, El niimero total de estas copias no funcio- rales © pseudogenes es incierto por las razones resumidas previamente (es dificil distinguir los pseudogenes de los genes funcionales). La secuenciacién del genoma permitié obser- =-var numerosas secuencias aparentemente dupli- cadas, es decir que aparecen en un cromosoma y también en otto, al parecer copiadas y desplaza- das a otro lugar. En algunos casos las duplicacio- hes son grandes y comprenden docenas de Mb, & pero en general son pequefias (1 kb). Los resulta- ddos son compatibles con una potble duplicacién ‘hist6rica del genoma de los invertebrados en el giones ms Hens ES prucban que haya existido una duplicacién com- pleta en un evento tinico, sino que es ms proba- ble que en distintos periods de la evolucién se ‘hayan ido duplicando algunas regiones separadas HE del genoma, Estas regiones duplicadas en el cur- fo de la evolucién dieron lugar a la existencia de 3s Hamados genes pardlagos, es decir miembros ide una familia, derivados de una duplicacién ori- ‘ginal y tras posteriores, con funciones especia- # les asignadas a cada miembro de esa familia. La HF familia de los genes HOX del desarrollo embrio- nario, que se encuentra por cuadruplicado en_ ‘uatro cromosomas humanes, es un ejemplo ca- HF nncteristico (véase el capitulo 16). Cuando se GE comparan los genomas de dos Grganismos es muy ftecuente encontrar genes que cumplen funcio- A nes similares en los dos y cuyas secuencias de La organi cion del Uenoma Humano 117 ADN son semejantes, en mayor grado cusinto ins cercana es su relacién filogenética; estos ge- nes, son derivados de un tronco comin 0 gen ori- tinal y todos ellos se denominan ortélogos. La comparacién de las secuencias génicas humanas con las de ratén (separadas por 200 millones de afios de evolucién) muestra muchas evidencias de genes orrélogos que cumplen funciones simi- tures? El proteoma humano predecible por la secuencia del genoma El conjunto de secuencias génicas humanas para protefnas (26.383 en el grupo de Venter y col.) fue comparado con el conjunto de se- ‘cuencias para proteinas de dos organismos mo- delo, el nematodo C. elegans y la mosca Dro- sophila, cuyos genomas ya estan secuenciados; estas comparaciones son s6lo preliminares* y en muchos laboratories se las sigue realizando con el abjeto de determinar proteinas descono- cidas y obtener informaci6n sobre las posibles funciones de las proteinas humanas. Las com- paraciones preliminares han sido bastante res- ringidas por el hecho de que las funciones del 41,7% de las proteinas predecibles humanas son completamente desconocidas y ademés por las restricciones relacionadas con las desviacio- nes en las secuencias del ADN impuestas por la evolucién de los distintos organismos. Uno de los problemas previstos es el surgimiento de nombres para 26,000 productos génicos; otro problema, mds acuciante, radica en la provi- sign de criterios para clasificar las proteinas, cuando muchas de ellas son casi desconocidas. En este sentido ha surgido una organizacién, lamada “Consorcio de Ontologia Génica” (“Ge- ne Ontology Consortium”), formada por los or- ganizadores de bases de datos de genomas de varios organismos, incluido el humano, cuiyo ambicioso propésito es “prover un vocabula- rio comin, preciso y controlado para describir los roles de los genes y de sus productos en to- dos los organismos vivos”. !° Las bases de datos y los vocabularies propuestos por este consorcio son accesibles en Internet: (www.geneontolo gy.org/) y constan de tres partes: 118 Gen ica Numana Definiciones de procesos bioldgicos (p. e}., ere- imiento celular, transduccién de sefales) 2. Definiciones de funciones moleculares (p. ej. cenaimas, transportadores, receptores). 3. Definiciones de componentes celulares (p. ej,proteosoma, ribosoma). Esta “ontoloy de los genes” fue usada para clasificar las pro- tefnas del proteoma humano (fig. 6-4) La comparacién de este proteoma tesrico humano con los proteomas de otros modelos (como Drosophila y C. elegans), demuestra, en primer lugar que hay un niicleo basico de pro- tefnas comin a todos los proteomas y que se re- fiere a reacciones y procesos basicos del meta- bolismo, como las protefnas necesarias para la sintesis, la transcripcidn y la traduccién de éci- dos nucleicos, enzimas del metabolismo inter- medio, etc. En cambio, en otros campos funcio- nales, se ha observado un incremento significa- tivo del niimero de protefnas humanas respecto del ruimero de proteinas de los organismos in- vertebrados. Estos campos corresponden princi- palmente a: 1) proteinas con furiciones inmuni- Proteinas estructurales: 3,6% Protooncogenes: 1,9% ‘Transportadoras: 5,6% Funcién desconocida: 35,8% Hidrolasas (proteasas, otc): 4.7% tarias, 2) proteinas vinculadas con el desarrollo, la estructura y las funciones del sistema nervioso, 3) protefnas que forman parte de los sistemas de transmisi6n o transducci6n de sefiales, tanto in- tracelulares como intercelulares y que intervie- nen en el desarrollo y en el mantenimiento de la homeostasis (equilibrios del medio intemo del organismo), 4) proteinas que participan en mecanismos de apoptosis (muerte celular progra- mada) y 5) proteinas que intervienen en la hhematopoyesis,en la coagulacién sanguinea y en las funciones de la sangre. Este incremento de las protefnas es légico si se consideran las diferencias anatémicas y fisiolégicas de los mamiferos con respecto a los invertebrados. Mis alld de esas diferencias, es notable que el riimero de genes de la especie humana, e inclu- so el de sus protefnas, no se alejen mucho de los niimeros respectivos del gusano C. elegans y de la mosca Drosophila. Es logico que para explicar las diferencias org4nicas con esta similitud de geno- mas, se busquen diferencias funcionales en las proteinas: es probable que sus capacidades de in- teraccién (de unas proteinas con otras y de las Factor de transcripeién: 4,7% Enzimas de dcidos Tucleicos: 12,9% Smessicint| Receptor: 1,3% Jouinasa: 4,0% Reguladoras: 5,1% Enzimas del ‘metabolismo intermo- dio: 13,9% Fig. 6-4. Esquema muy simplficado de la clasificacién de las funciones del conjunto de las proteinas predichas en el geno- ‘ma humano. Para la clasificacién se usaron los trminos definidos por el "Consorcio de Ontologia Genie la funcién de mts del 41% de las protefnas. se desconoce proteins con los didlos nucleieos), sus eapaciah- des de modificacién postraduccional (recortes proteoliticos, ylucosilaciones, ete.) y sus capaci- ddades de traslocacién y localizaciones diversas * fengan una trascendencia mayor en el origen de la complejidad del organismo humano. Diferencias genémicas entre individuos Todos los individuos cuyo genoma ha sido analizado hasta el presente, comparten sus se- * quencias de ADN en el 99,9% de su cotalidad, in- © cluidas las regiones no génicas. Esto significa que el genoma de los seres humanos presenta un ele- *) vado grado de identidad y que las variaciones de ‘na persona a otra son menores a una base de ca- @ da mil. Se estdn analizando las SNP y las variantes de [F secuencias repetidas para constarar la identidad f genética de distinas poblaciones humanas en las que ya existen evidencias de diferencias (estadis- 4° ticamente significativas) en la frecuencia de de- ‘terminados alelos de algunos genes, como por ejemplo los de los grupos sanguineos. Sin embar- 10, la especie humana es notablemente homogé- tien en lo que respecta a su genoma, La Organizacién Proteoma i Humano (HUPO) Una vez finalizada la secuenciacién del FADN humano, corresponde analizar el total de ¢ las protefnas humanas (proteoma). Los objeti- vos de la organizacién HUPO consisten en {8 consolidar y coordinar los estudios sobre el pro- _feoma, organizar reuniones cientificas sobre ese tema y asistir a los investigadores de varias ma- # neras.!' Como primer paso ya existen bases de '® datos sobre alrededor de 14.000 protefnas hu- ‘manas y aproximadamente 11.000 proteinas de Fatén y de rara.!? e El estudio del proteoma es diferente del estu- lio del genoma por varias razones. En primer lu- ‘4 gar, el grado de complejidad del proteoma hu- # Mano es significativamente mayor que el del ge- Lat Uryatvetcion ues UH nientras que el andlisis del ADN huma- no se basa fundamencalmence en la secuencia li neal de cuatro tipos de bases, el andlisis de las protefnas debe considerar las secuencias de veinte aminodcidos; y estas secuencias se desa- rrollan en las tres dimensiones del espacio (en ver de la linea que corresponde a las secuencias de bases del ADN). En segundo lugar, el niime- ro de protefnas es superior al ruimero de genes, debido sobre todo a la capacidad de muchos ge- nes de codificar varias prote{nas por empalmes alternativos. En tercer lugar, las proteinas no so- lo consisten en secuencias de aminodcidos, sino que ademas muchas de ellas poseen modificacio- nes postraduccionales consistentes en la adicién de residuos de hidratos de carbono ode lipidos cn sitios definidos de la proteina. En cuarto lu- sar, no existe un proceoma comtin a todos los te- jidos: las células pancresticas exocrinas, por ejemplo, producen un conjunto de protefnas muy diferente del producido por los queratinoci- tos de la piel. Por iltimo, los mécodos que se uti- lizan para el anélisis de las protefnas son consi- derablemente més complicados y costosos que los que se usan para el andlisis del ADN. Los métodos bésicos para el anslisis de proteinas son de tres categorfas: 1) electroforesis bidimensio- nal en geles, 2) espectrometrfa de masa y 3) cris- talografia de rayos X. Los equipos correspon- dientes son més costosos: un equipo de espectro- metria de masa cuesta mas de medio millén de dolares estadounidenses. Dadlo que cada tipo celular produce tn proteo- ma caracteristico, los estudios proteémicos se han segmentado en proteomas de tejides particulares. Algunos de los proyectos de andlisis de proteomas particulares més avanzados incluyen: 1. El proteoma de las proteinas plasmaticas de Ja sangre humana. 2. El proteoma hepatico (de los hepatocitos). 3. El proteoma cerebral (de las neuronas de la corteza cerebral), Por otra parte, se encuentran en desarrollo bases de datos especiales y metodologias infor- maticas para hacer frente al ordenamiento y al procesamiento de las grandes masas de datos que implica el estudio del proteoma.!"4 Comparacién entre los resultados del Proyecto del Genoma Humano y los estudios del proteoma Durance la seyun I del siglo Xx los ge- nies humanos fueron objeto de anilisis en labo- ratorios universitarios y por parte de grupos pe~ ‘quefios de investigadlores hasta que en 1990 se inici6 el Proyeeto del Genoma Humano, finan- ciado por el gobierno de los Estados Unidos y que 1 mayor escala, pero atin basadas en laboratorios uuniversiturios coordinados por centros especial- ‘mente equipados para la secuenciacién en masa del ADN. Los estudios yénicos iniciales, al igual que los descubrimientos de fenémenos bésicos para los adelantos de las técnicas genémicas (enzimas de restriccién, vectores para clona- cin de genes, reaccién en cadena de la polime- rasa y otros muchos), fueron efectuados por cientificos individuales 0 por pequefios grupos de investigadores. En los jiltimos afios del siglo XX, empresas de “biotecnologia” del tipo de Ce- lera (empresa estadounidense dirigida por J. (Craig Venter hasta 2001) ingresaron al drea de secuenciacién del genoma humano en compe- tencia con el proyecto oficial y con el aparente objetivo de obtener patentes de las secuencias del ADN humano con fines de lucro, Los resul- tados del ingreso de estas empresas han sido an- bivalentes: por ejemplo, el grupo de J. Craig ‘Venter pudo completar una secuenciacién “en borrador” del genoma humano en forma répida y con datos numerosos y ctiles. Sin embargo, estos resultados fueron obcenidos a partirde una iasificacién del trabajo que despersonaliz6 los resultados finales (el trabajo publicado esta fir mado por 266 autores, el primero de los cuales es J.C. Venter). Por otra parte, si bien en los Es- tados Unidos hubo empresas y laboratorios que presentaron varios miles de solicitudes de pa- tentes de secuencias de ADN humano, el otor- gamiento de esas patentes qued6 bésicamente cen suspenso, debido a la oposicién presentada por la mayorfa de los mas conocidos investiga- dores cientificos, incluido James D. Watson, y a la decision politica del enconces presidente de EEUU y del primer ministro del Reino Unido, quienes rechazaron la posibilidad de patentar re6 el comienzo de investigaciones en Jas secuencias del ADN humano. Previamente, en 1997, la Onganizacién de las Nuciones Us das habia emitido una “Declaracién” o docu- mento consensuado, en el que se afirmaba que el yenoma humano es patrimonio de la humani- dad y que, por consiguiente, no es patentable.!> Finalmente las secuencias del ADN humano, dado que las codificantes son minorfa, y por lo general no codifican una tinica protefna, han do consideradas poco relevantes para obtener los réditos econémicos esperados."* El afio 2001, con la publicacién de los resul- tados “en borrador” de las secuencias del ADN thumano,* parece representar un punto de infle- xién, porque una ver concluida la secuencia- cién en la especie humana, las empresas biotec- noldgicas rebajan la prioridad de este campo 0 lo abandonan para conseguir el papel principal en el andlisis del proteoma humano. En especial las empresas farmacéuticas, que dedicaron 20,000 millones de délares a investigacién y desarrollo en el afio 2000, estin dispuestas a aceptar erogaciones aun mayores en el campo de la proteémica con el fin de patentar protet- nas humanas y desarrollar agonistas y antago- nistas moleculares para esas protefnas, nuevas pruebas diagnésticas y nuevas drogas terapéuti- cas. La predominancia de las empresas en el campo de la proteSmica podria determinar una menor publicidad de los descubrimientos cien- tificos y de la descripcién de nuevas técnicas (el secreto industrial desanima esta publicidad) ast ‘como un menor protagonismo de los cientificos individuales. Tecnologias para el diagnéstico multigénico o gendmico: microarreglos de ADN En los iltimos afios de la década de 1990, en Jos laboratorios de la Universidad de Stanford y de otras Universidades de los Estados Unidos, se desarrollé un ingenioso método que permite observar el grado de funcionamiento (transcrip- cién), ya no de un solo gen, sino de un conjun- to de miles de genes e incluso de todo un geno- ma. "El método de los “microarreglos”, conoci- dos también como pastillas de ADN (DNA Fig. 65. Represenacion de un microarreglo de ADN (* chips) (que luego se extendié a las protefnas), consiste en deposicar microgotas mindsculas en. las microcuadriculas de un casillero virtual de = varios miles de espacios sobre el vidrio de un portaobjecos especialmente preparado (fig. 6- Be 5). En la base de toda la técnica de los microa- E reglos est lu hibridacién especffica de segmentos Ede dcidos nucleicos desconocidos con los seg- G},imentos (diana 0 blanco) pegados al vidrio. La b especificidad de esta hibridacién esté dada por la complementariedad de las secuencias desco- nocidas con las secuencias diana pegadas al vi- tio. Como se vio en el capitulo respectivo s0- bre técnicas, las condiciones (pH, presencia de | formamida, temperatura y otras) de hibridacién £2 son importantes para que la hibridaci6n sea efi- egmento diana es fundamental. Una vez ocu- if rida Ia hibridacisn se iluniina con luz léser el microarreglo para determinar la presencia o la ‘ausencia y el grado de hibridacién de cada uno de los miles de segmentos diana; como todos los Segmentos desconocidos estaban rowwlados con un F colorante fluorescente, el nivel de fluorescencia fi en cada punto es proporcional al nivel de hibri- daci6n, Ahora bien, cada uno de los miles de cuadra- La organizacién del Genoma Humano_ 121 Sector aumentado ochi rado se han depesitdo varios miles de microgotas ordnadas (Ia disposicién ordenada se abtiene con “inyectores smila- tes. ls de las impresoras de chorro de tinta); cad microgota contiene un segmento de ADN diferente o un oligonucles- tido diference que han sido auheridos al vidrio del portaobjctos en forma indeleble. Con este portaobjetu con microarreglo se puede buscar (después de bafarlo en una mezcla de ARN o de segmentos de ADN) cusles son los segmentot que se hi- bridan in vier y con cusles de las secuencias pegadas al vidrio lo hacen. ). Sobre un portaobjeto de vidio especialmente prepa- puede consistir (cada una) en la hibridacién de un gen con su ARNm (0 su equivalente, el ADNc). Lo fundamental en los mictoarreglos 8 que se realizan todas las hibridaciones simul- téneamente y se analizan como un sistema, es de- cir que se puede visualizar todo el genoma fun- cionante, 0 sea la expresion no ya de un gen sino del genoma, Ahora bien, como cada tipo celular expresa solo una parte del genoma, en los microarreglos hay dos conjuntos diferentes de hibridantes: ‘mientras que los segmentos diana representan la to- taldad del genoma, los segmentos desconocidos deben provenir de un solo tejido 0 tipo celular para poder ser correctamente interpretados, por ejemplo, deben ser de hepatocitos, queratinoci- tos, adipocitos, ete. También pueden utilizarse las bibliotecas de ADNe de un érgano, que aun- ‘que contiene varios tejidos, acta como una uni- dad funcional (p. ej. rifi6n, pancreas o cerebro) y las hibridaciones deben interpretarse como un conjunto de expresiones génicas de ese drgano. Por consiguiente los microarreglos permiten la definicién de un “perfil de expresin génica de tun tgjdo” y en muchas ocasiones se habla de de- terminar ese perfil de expresién génica para co- nocer el estado funcional de dicho tejido, aun- ‘que en realidad los perfiles citados varfan ante variaciones incluso pequefias, de las condicio- nes ambientales. Esto ha llevado a que la prin- cipal aplicacién de estos perfiles sea comparati- 122 Gené ica Humana sua, es decir que se compare ef conjunto de hi- bridaciones de un tejido “contro!” con el de un tejido “experimental”, lo que es muy stil en me- dicina, en farmacologta y en el disefio de aue- vas droga farmacéuticas. El esquema general de uso de los microarreylos, cons tes pasos (fig. 6-6): pe: I. Preparacién de dos muestras de tejido u 6r- gano, idénticas salvo por una variable: una es la muestra “control” y la otra es “experi- mental” (pueden ser normal y tumoral; nor- mal y en presencia de suero; o normal y tra- tada con una droga, etc). 2. Extracci6n del ARNm total de ambas mues tras (ése es el universo de expresién génica de ese tejido en las muestras). 3. Obtencién del ADNe de las dos muestras (con transcriptasa inversa) en presencia de PREPARACION DE LAS MUESTRAS. (ADNc “control” y ADNe “experimental’) TAR ann APL Transcripcién inversa y rotulado con fluorocromos | { Tae wwe Mezcia para hibridacion | HIBRIDACION: sobre el microarrego SS ANALISIS DE LAS IMAGENES: cl cociente de las intensidades VERDE/ROJO fen cada punto del microarreglo indica la nuclestidos rotulades pero con rétulos dis- tintos en cada muestra, para obtener un co- lor de fluorescencia distintivo de cada una. 4, Reaccién de hibridacién sobre un portaobje- to con un microarreglo de todo el genoma, Para efectuar la reaccién se bafta el portaob- jetos con el microarreglo con una mezcla de partes equivalentes de los dos grupos de ADNe. Examen del microarreglo y deteceién de los tipos de fluorescencia mediante un escéner especial que en cada punto del mictoarreglo anota las coordenadas (del lugar exacto), el tipo de fluorescencia y su intensidad. 6. Anilisis de los datos; determinacién de los agrupamientos de genes (“‘clustets”) que se comportan como si estuvieran coordinados (genes cuya transcripeién aumenta o dismi- rnuye en forma sincrénica y arménica). 5 PREPARACION DEL MICROARREGLO (depésito de microgotas sobre el portaobjetos) ESCANEO ———> proporcisn de transcripto experimental/control Fig.6-6, Esquema de los pasos de la utilizacién de un jeroarrglo de ADN para analizar comparativamente el “perfil ‘expresin génica” de un teido en dos musts, una control a ot “experimental”. (Datos de NIH, EEUU.) comparacién, con otrus ensayos de microarreylos y con bate ses de datos. ‘Una caracter(stica importante de los microa- rreglos es que cada punto de la cuadricula don- de se deposita una microgota de ADN diana al 2 fabricar el microarreglo, tiene una “direccién” precisa (una ordenada y una abscisa para cada punto), de modo que el ADN diana que ests pegudo al vidrio en ese punto puede ser identi- ficado por su posicién (p. ¢j., en la ordenada 50 yy la ubscisa 33 de un microurreglo de 100 x 100 total: 10.000] cuadrados puede estar el ADNe del gen del canal de cloro de la fibrosis quistica [CFTR] y en el siguiente cuadrado el ADNe de otro gen). Como las microgotas se colocan con microinyectores robéticos, siempre se conserva ‘en un archivo de computadora la posicién de cada punto del microarreglo con Ia identidad j. del ADN depositado. Cuando se escanea la hibridacién de un i croarreglo se agrega la informacién de la posi ci6n de cada punto a la intensidad y el tipo de i fluorescencia en ese punto, de modo que se sa- IE be cuil es la identidad del gen que esta siendo HE: hibridado en él. i. y de oligonuclestidos sint. Implicancias de sus usos i. Hay dos tipos principales de microarreglos Kf de écidos nucleicos" a saber: 1) los microarre- Gj glos de ADNe (comercializados por Incyte y fj, otras firmas) y 2) los microarreglos de oligonu- destidos sincéticos (comercializados por Affy- ; metrix y otras compafifas). Cada tipo de microarreglo tiene sus ventajas Y sus caracteristicas particulares. Los de ADNe fabrican con microgotas de 100 micrones de liimetro y se usan bésicamente para determi- ar los “perfiles de expresién génica” de los te- jidos. En cambio, los microarreglos de oligonu- { cle6tidos sintéticos se utilizan fundamental- = Mente para la deteccién de SNP 0 mutaciones p de genes determinados. En la fabricacién de es- La organizacion del Genoma Humano 123 sino simplemente oligonucléoticos sintetizados a partir de la informacién de secuencias de exo- nes de genes “in silico” (la expresién in silico se usa para aludir a todo aquello que estd en bases dde datos informsticas). Los microarreglos de ADNe (también llama- dos “impresos” por su fabricacién con inyectores similares alos de chorro de tinta de las impreso- ras) se usan en forma creciente en genémica funcional para estudiar las relaciones funciona- les de muchos genes entre sf. La determinacién de los “perfiles de expresi6n génica” con este ti- po de microarreglos se ha extendido a muchos campos de la medicina, pero se utiliza especial- mente para estudiar tejidos tumorales versus el tejido normal," la interaccién entre agente pa- t6geno microbiano y huésped,”el efecto de dis- tintas drogas (tejido tratado versus no tratado), cl efecto del envejecimiento (tejido joven ver- sus tejido envejecido) y muchos otros temas El uso de los microarreglos de ambos tipos ha apoyado Ia hipétesis que poscula que muchos ge- nes actéian en forma de “reds” Como ha ex- presado claramente el grupo de la Universidad de Stanford," “mucha de la informacién del ge- noma no est destinada a especificar la estructu- ta de la proteina o el ARN que se codifican, si- ‘no a controlar con precisin en qué eélulas, en qué condiciones y en qué cantidades debe ser produci- do el producto génico”, Este es el tipo de infor- ‘macién que se busca con el uso de los microarre- gos. Sin embargo, la interpretacién de los resul- tados no es sencilla sino que requiere métodos estadisticos especiales, formacién de bases de datos especificas y estandarizacién adecuada de Jos procedimientos. Microarreglos de proteinas. El proteoma humano Mis recientemente se han producido mi- croarreglos de protefnas capaces de cubrir el proteoma de la levadura (alrededor de 6.000 prote{nas)®* pero que no pueden cubrit sino muy parcialmente el proteoma humano.# Estos microarreglos difieren de los de écidos nuclei- cos fundamentalmente porque las protefnas de- ben mantenerse hidratadas a temperatura amn- 124 Genética Humana biente, porque al secarse suften una desnatural- zaci6n parcial o total y suelen perder sus propie- dades y la posibilidad de ser reconocidas por an- ticuerpos espectficos. Adem, al contrario de la caructeristica homogeneidad de los seidos nu- cleicos (todos polianiones fuertemente cargados yyde tipo lineal) las protefnas son extraordinar mente variadas, con dominios hidrofébicos e hi- drofilicos, tamafios y fonmas tridimensionales completamente dispares, residuos cargados 0 neutros, etc. Los microarreglos de proteinas se clasifican segtin sus superficies, en quimicos o biologicos.* Las superficies “quimicas” escogen selectivamente ciertas proteinas de la muestra actuando como una separacién cromatogréfica, de modo que solo son iitiles para un sector del proteoma, Las superficies “biolégicas” capturan proteins de la muestra por reconociiniento y afi nidad molecular, tipicamente por anticuerpos 0 fragmentos de anticuerpos. La preparacién de un microarteglo de proteinas es mucho més com- pleja, incompleta y costosa que la preparacién de un microarreglo de dcidos nucleicos y la in- terpretacién de sus resultados es mucho ms in- cierta: las dificultades para un andlisis del pro- teoma humano con microarreglos de protefnas son inmensas." No hay una relacién directa en- tre la abundancia de una proteina en un tejido y su actividad: muchas protefnas son segregadas como “precursures” © cimégenos y muchas tie- nen modificaciones por adicién de hidratos de carbono 0 lipides. Los microarreglos de protef- nas son iitles sobre todo para estudiar la afini- dad de proteinas diferentes entre si y de ciertas proteinas con secuencias de dcidos nucleicos 0 on lipidos, El andlisis de los “perfiles proteinicos” de las enfermedades, con microarreglos de protefnas es un objetivo no logrado.* RESUMEN Con Ia finalizaci6n del Proyecto del Geno- ma Humano (PGH) se obtuvo la secuencia to- tal del ADN humano (excepto algunas regiones heterocromiticas pricticamente desprovistas de genes). El ADN nuclear humano consta de las 22 moléculas de ADN de los cromosomas 1 222 y de las moléculas de ADN de los cromo- somas Xe Y y forma un conjunto de alrededor de 3.200 millones de bases (3.200 megabases 0 Mb) repartidos entre esas 24 moléculas, en for- rma més o menos proporcional al tamafio de ca- da cromosoma. El estudio del genoma, es decir del conjunto de los genes humanos y del ADN que los contiene, en la forma de un sistema éini- co, es el objetivo de la disciplina llamada “ge- rnémica”. Un sector de esta disciplina es la gend- ‘mica comparada, que estudia en forma compara- tiva el genoma de organismos “modelo” como el ratGn o la mosca Drosophila, cuyos ADN tam- bién estén secuenciados, con el fin principal de descubrir “secuencias conservadas", es decir que hayan mantenido una semejanza suficiente en el curso de la evolucién porque representan ge- nes y son importantes para la supervivencia de diferentes tipos de organismos. El objetivo principal del Proyecto del Geno- ma Humano era identificar la totalidad de los genes, que son aproximadamente 28.000, y de- jarlos descritos bajo la forma de “anotados”, es decir con su localizacién y su funcién previsible definidas. En lo que se refiere a la funci6n, esta tarea esté solo parcialmente coneluida porque se desconoce la funcién del 42% de los genes, es decir que la “genémica funcional” (estudio y clasificacién de las funciones de los genes de to- do el genoma) continéa en desarrollo. El desa- rrollo de bases de datos genéticos y de metodo logtas informaticas especiales para genetistas ¢s una tarea de la biginformatica conectada con la gendmica. Los aspectos sociales, éticos y legales derivados del Proyecto del Genoma Humano estén a cargo de un subprograma conocido co- mo*ELSI”, La secuenciacién del ADN humano ha sido el paso previo a la identificaci6n, la cla- sificacién y el estudio del conjunto de las pro- tefnas humanas 0 “proteoma”, que se considera formado por mas de 100.000 proteinas, dado que los genes humanos codifican en promedio 3 protefnas diferentes cada uno mediante el em- palme alternativo de sus regiones exénicas. Los genes humanos pueden estar en la cadena “po- sitiva” (empezando el sentido 5’ a 3° desde el extremo del brazo corto del cromosoma) o en la “negativa” (empezando el sentido 5’ a 3° desde el extremo el brazo largo) y su tamafio puede variar mucho [desde mis de 2 Mb en el caso del gen de Ia distrofina [DMD] hasta menos de 2,5 ben eldel gen SRY y los genes de las globinas), Jo mismo que el niimero de exones (desde un maximo de 234 exones en el gen de la titina del miisculo estriado hasta un solo exén en numero- 50s genes), el tamafio de los intrones, la localiza- cién en regiones ricas © pobres en genes, etc. M4 Actualmente, para buscar la localizacién y la es- © tructura de un gen humano se consulta una ba- se de datos por Internet, por ejemplo la base de > datos “Entrez” del orgunismo estadounidense NCBI, en especial a través del “visor del mapa” (genético) de esa base de datos. El uso de bases 8 de datos es muy importante hoy en dia; para la medicina, ademés de “Entre”, son bésicas la ba- se de datos de enfermedades hereditarias @ “OMIM”, la base de datos de genes “Gene = cards" y la base datos de genética clinica “Gene- i Clinics", La definicién de un gen real no es fécil é porque los criterios que se utilizan para ello no son absoluramente estrictos. Para las bases de G datos un gen debe reunir varias condiciones: 1) debe poseer un marco abierto de lectura (MAL, *ORF"), 2) debe tener una secuencia = conservada, 3) debe ser transctipto en un £ARNm, y 4) su inactivacién por mutacién ge- G.neralmente debe ser perceptible en el fenotipo. Se ha establecido una nomenclatura intemacio- nal para los genes humanos, mediante la cual se los designa con letras, con niimeros 0 con letras * yndmeros, siempre empezando con una letra, en. maytisculas, preferiblemente de no mas de seis fermedad con la que se relaciona o a su localiza- fr cidn. Las caracteristicas globales del genoma g humano demuestran que en los 26.383 genes Analizados, el nimero promedio de exones por "gen es de 7,8, que el 20% del ADN corresponde "ADN ocupado por exones representa solo el ff 1.1% del total, que los intrones ocupan el 24,4% BY del ADN y que el ADN “intergénico” constitu- "ye el 74,5% del ADN. El ADN humano & no- tablemente homogéneo entre diferentes indivi- EF duos porque en promedio tiene una sola base dis- pe tinta cada 1.250 bases. Estas variantes se deno- f minan polimorfismos de un solo nucle6tido (SNP), g,tin distribuidas en forma muy desigual, sobre La organizacién del Genoma Humano 125 todo en los incrones y en el ADN intergénico, y sieven como “marcadores” para localizar genes, porque son heredables. Los genes humanos en general estin muy fragmentados en exones, lo que sugiere que los genes tienden a representar “dominios” diferentes de las protetnas en cada exén, Un 35% del genoma esté ocupado por se- ‘cuencias repetidas sin significado funcional; las secuencias repetidas cortas “Alu” tienden a acu- mularse cerca de los genes. Hay un niimero significativo de genes aparen- temente “repetidos” que ocupan lugares en dife- rentes cromosomas; algunos de esos genes repeti- dos son productos de mas de una duplicacién su- cesiva a partir de un tinico gen original en el cur- so de la evolucién, con funciones particulares pa- ra cada uno de los miembros de esa “familia” rica, como por ejemplo los genes HOX del desa- rrollo embrionario, que forman cuatro grupos de genes pardlogos. Los miembros correspondientes a las duplicaciones de un gen original se denomi- nan “parslogos”. Los genes simples (no duplica- cdos) que desemperian funciones similares en di- ferentes especies y que son derivados de un tron- co comén se llaman “ortéloges”. El proteoma ‘humano predecible por las secuencias génicas del ADN humano ha sido clasificado de acuerdo con las normas del “Consorcio de Ontologia Cié- nica”. En comparacién con otros organismos “modelo"este proteoma muestra un enriqueci- miento relativo en proteinas relacionadas con el sistema inmunitario, con el desarrollo del siste- ma nervioso, con la transduccién de sefiales in- tercelulares, con la apoptosis (muerte celular programada) y con las funciones de la sangre. El andlisis del proteoma humano, que se en- ‘cuentra en sus comienzos (porque es més com- plejo que el del genoma), se concentra en los segmentos particulares del proteoma que co- rresponden a algunos tejidos (proteoma hepéti- co 0 cerebral). Los microarreglos de ADN (“chips” de ADN) constituyen una importante metodologia para el anslisis del genoma normal y de sus anormalidades funcionales porque per- miten observar el grado de funcionamiento (transcripci6n) simulténeo de miles de genes 0 de todo el genoma de una vez. Mediante los mi- ccroarreglos se determina el perfil de expresién gé- nica" de un tejido normal y, sobre todo, se esta- 126 Genética Humana blecen comparaciones de perfiles de expresién entre tejidos control y tejidos patol6gicos. Los dos tipos principales de microarreglos tienen varias aplicaciones: los de oligonuclestidos se uusan para detectar SNP y mutaciones y los de ADN¢ se emplean principalmente para definir perfiles de expresién yénica. Los microarreglos de protefnas son mucho més dificiles de realizar e interpretar; se encuen- tran en una etapa inicial de su desarrollo y se prevé que se los usar para deverminar las afini- dades de diversas proteinas entre s{ y con otros tipos de moléculas. REFERENCIAS 1. Collins FS, Morgan M, Patrinos A. The human geno- ime project: lessons from large-scale biology. Science 2003; 300:286-290. 2. J. Craig Venter y col. The sequence of the human geno- sme, Science 2001; 291: 1304-1351. 3. The Intemational Human Genome Consortium. A physical map of the human genome. Nature 2001; 409:934-941, 4. Morton NE. Parameters of the human genome. Proc Nat Acad Sci USA 1991; 88:7474-7476. 5. Tafiery-Giraud S, ChambereS, Demaille J, Chustres M Poine mutations in the dystrophin gene: evidence for frequent use of cryptic splice sites asa resue of splicing defects, Hum Mut 1999; 14:359-368. 6. Snyder M, Gerstein M. Defining genes inthe genomics era. Science 2003; 300-258-260. 7. Wain HM, Bruford EA, Lovering RC, Lush MJ, Wright MW, Povey. Guidelines for humian gene nomenclat- re, Genomes 2002; 79:464-470. 8.Pennisi E. The Human Genome. Scisucs 2001; DULITLA80, 9. Wolfbeng TG, McEntyre J, Schuler GD. Guide to the draft human genome. Nature 2001; 40%824-826. 10. The Gene Oncology Consortium (Ashburner M y col.) Gene ontology: tool for the unification of biology. Na- ‘ure Genee 2000; 25:25-29. Human Proteome Organization (HUPO). hcp:/weww-

También podría gustarte