Está en la página 1de 6

UNIVERSIDAD NACIONAL AUTNOMA DE MXICO

FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLAN

CAMPO 1

LICENCIATURA EN BIOQUMICA DIAGNSTICA

GENETICA MOLECULAR

PROYECTO GENOMA HUMANO.

MIGUEL ANGEL GOMEZ REYES

PROFESOR:
QFB. ALEJANDRO GUTIERREZ GARCIA
SEMESTRE 2015-I

GRUPO 1652

Cmo se llev a cabo el Proyecto Genoma Humano?

Antecedentes.
En 1986, el Departamento de Energa de los Estados Unidos lider la Iniciativa del Genoma
Humano, tras varios aos de contactos y reuniones, y puso en marcha el mayor proyecto
biomdico de la historia con el objetivo final de conseguir la secuencia completa del genoma
humano en el ao 2005. El Proyecto Genoma Humano comenz oficialmente en Estados Unidos
en octubre de 1990, siguiendo un plan a cinco aos para desarrollar las herramientas que
permitiesen conseguir esa meta. Estas herramientas eran principalmente la construccin de mapas
genticos (de ligamiento) y de mapas fsicos (de clones) de todo el genoma humano, al tiempo que
se desarrollaba la tecnologa necesaria para realizar secuenciacin a gran escala. La estrategia
general consisti en construir mapas genticos y fsicos e integrarlos, para aumentar cada vez ms
en resolucin desde el cromosoma hasta la secuencia de ADN.
Los mapas genticos describen la organizacin cromosmica de caracteres (un rasgo fenotpico,
una enfermedad) o de marcadores genticos, mediante estudios de ligamiento gentico.
Los primeros xitos de mapeo gentico en humanos fueron los que consiguieron asociar un
carcter a un cromosoma, como por ejemplo el ligamiento del daltonismo al cromosoma X, o
ligamiento del grupo sanguneo Duffy al cromosoma 1. Este ltimo fue el primer rasgo hereditario
mapeado a un autosoma (en 1968) gracias a que, en una familia concreta, se observ que este
rasgo se heredaba junto con un heteromorfismo del cromosoma 1. Esto puso de manifiesto la
utilidad de contar con marcadores de ADN que estuviesen distribuidos por todo el genoma, fuesen
fciles de estudiar en un nmero alto de individuos y tuviesen una posicin cromosmica conocida,
ya que as se podran realizar estudios de ligamiento gentico en familias que padecen una
determinada enfermedad gentica para determinar si esa enfermedad est en ligamiento con
alguno de estos marcadores, lo que facilitara la identificacin del gen responsable.
Los tipos de marcadores ms utilizados en estudios de ligamiento en Gentica Humana son:

Polimorfismos de Longitud de Fragmentos de Restriccin (en ingls, las siglas son RFLP).
Un RFLP es un polimorfismo originado por un cambio de un nucletido que crea o destruye
una diana de restriccin, de manera que encontraremos alelos con esa diana y alelos sin
ella. Por tanto, un RFLP es por definicin un marcador biallico (slo hay dos alelos
posibles). La presencia o ausencia de esa diana hace que los fragmentos originados por la
digestin del ADN con esa enzima de restriccin sean de distinto tamao. En general, un
polimorfismo tipo RFLP puede detectarse de dos modos: a) digerir directamente el ADN
genmico, separar los fragmentos en un gel, hacer un Southern blot e hibridarlo con una
sonda especfica para detectar cada uno de los fragmentos polimrficos; b) amplificar la
regin del polimorfismo mediante PCR y digerir directamente el producto de PCR para
separar los fragmentos en un gel.

Los marcadores tipo VNTR (acrnimo ingls de Nmero Variable de Repeticiones en


Tndem") son polimorfismos originados por pequeas secuencias de ADN que estn
repetidos en tndem. El nmero de repeticiones es diferente en los distintos individuos de
la poblacin, por lo que en principio pueden existir ms de dos alelos distintos para cada
marcador (aunque cada individuo slo lleve dos alelos, en la poblacin general pueden
existir ms). Los marcadores en los que la secuencia repetida es corta (2 a 4 nucletidos)
se denominan tambin micro satlites STR (Short Tandem Repeats", Repeticiones
Cortas en Tandem), y estn homogneamente distribuidos por todo el genoma. Los
marcadores en los que la secuencia repetida es ms larga (decenas a cientos de
nucletidos) se denominan mini satlites, y han sido muy importantes en los estudios de
gentica forense ya que permiten establecer una huella gentica nica para cada individuo.

Los mini satlites son ms abundantes hacia las regiones telomricas de los cromosomas,
y -debido a su tamao- en principio deben detectarse mediante Southern blot e hibridacin.
En cambio, los marcadores de tipo micro satlite pueden detectarse mediante PCR y estn
distribuidos uniformemente por el genoma, por lo que su anlisis es ms rpido y sencillo y
proporcionan mayor informacin.

Los SNP (pronunciado snip) son polimorfismos de un solo nucletido (Single Nucleotide
Polymorphisms) en los que el simple cambio de un nucletido en una secuencia genmica
da lugar a distintos alelos. Lgicamente, para cada posicin slo puede haber cuatro alelos
como mximo (A, C, G o T), aunque lo habitual es que un SNP tenga dos alelos en la
poblacin general. Se estima que, como promedio, hay al menos un SNP cada 500-1.000
pares de bases, de los cuales un porcentaje importante son polimorfismos codificantes (es
decir, cambian un aminocido en la protena codificada por el gen) y constituyen la
principal fuente de variabilidad gentica inter-individual, puesto que dos individuos
cualesquiera tienen alrededor de un 0,1% de sus nucletidos distintos. La gran ventaja de
los SNP sobre los dems tipos de marcadores, adems de ser tan abundantes y estar muy
uniformemente distribuidos por todo el genoma humano, es la posibilidad de analizarlos
mediante mtodos automatizables a gran escala, como los microarrays, de manera que se
pueden determinar cientos o miles de SNPs a la vez en un mismo experimento.

Desarrollo.
El objetivo inicial del PROYECTO GENOMA era crear un mapa gentico (de ligamiento) con
marcadores distribuidos por todo el genoma con una distancia media de 1 cM entre marcadores.
Los mapas genticos se basaron en un primer mapa publicado en 1987, hecho con 393
marcadores tipo RFLP agrupados en 23 grupos de ligamiento, con una distancia media entre
marcadores superior a 10 cM. El primer mapa gentico de todo el genoma fue el realizado por un
centro de investigacin francs llamado Gnthon en 1992, e inclua 803 marcadores tipo micro
satlite.
Los mapas fsicos, en cambio, reconstruyen la estructura de un segmento de ADN, determinando
los tipos y orden relativo de las distintas secuencias que lo componen, sus tamaos, y las
distancias entre ellas. Para la construccin de mapas fsicos se utiliza un tipo de marcador distinto,
que veremos ms adelante. Lgicamente, el mapa fsico de mayor resolucin posible es
la secuencia completa de ese segmento (resolucin de 1 nucletido), pero tambin es posible
realizar mapas de menor resolucin (un ejemplo, mapas de restriccin). El tipo de marcador
utilizado en la creacin de mapas fsicos se denomin STS(Sequence-Tagged Site = Sitio
Etiquetado por su Secuencia). Un STS es un pequeo fragmento de ADN (unos pocos cientos de
pares de bases) de secuencia y localizacin genmica conocidas, fcilmente amplificable mediante
PCR. Durante aos se haban identificado un buen nmero de marcadores STS, mediante la
secuenciacin parcial de clones previamente mapeados por otros mtodos. Adems, los micro
satlites utilizados en la creacin de mapas de ligamiento tambin pueden convertirse fcilmente
en STS, leyendo la secuencia que flanquea las repeticiones del micro satlite. Gracias a esto, hoy
contamos con una lista ordenada de STS que estn distribuidos por todo el genoma humano, cuya
secuencia y condiciones de amplificacin mediante PCR son fcilmente accesibles a todo
investigador. El PROYECTO GENOMA se propuso inicialmente conseguir mapas de marcadores
tipo STS distribuidos por todo el genoma y con una distancia media entre marcadores en torno
a 0.1 Mb(es decir, 100kb).
Utilizando estos marcadores STS, se pudieron construir mapas fsicos, es decir mapas compuestos
por clones de bibliotecas genmicas, capaces de albergar insertos de gran tamao. Existen
distintos vectores de este tipo, entre los que destacan los vectores tipo YAC(Yeast Artificial
Chromosome), PAC (P1-phage Artificial chromosome) y BAC (Bacterial Artificial Chromosome).

Cada uno de estos vectores de clonacin tiene caractersticas especficas, ventajas e


inconvenientes. En concreto, los YAC son los vectores que permiten albergar un mayor tamao de
inserto (hasta 2 Megabases), pero son bastante inestables (tienden a perder fragmentos del inserto
cuando se replican) y tienen un porcentaje relativamente alto de clones quimricos (es decir, clones
en los que el inserto est en realidad formado por dos fragmentos procedentes de cromosomas
distintos). Los PACs y BACs, en cambio, slo permiten clonar insertos de unas 100 a 150 kilobases
de tamao (por lo que son necesarios muchos ms clones para cubrir completamente un segmento
genmico determinado), pero en cambio son muy estables y el porcentaje de quimerismo es muy
pequeo. Aunque los YACs han sido el vector principalmente utilizado al principio de los aos 90,
hoy en da han sido desplazados por PACs y BACs.
Los primeros mapas fsicos del genoma humano estaban compuestos por contigs de YACs que
cubran parcialmente el genoma humano, siendo el mejor ejemplo el mapa creado tambin
por Gnthon en 1993. Este mapa supuso un avance enorme porque aunque no cubra muchas
regiones genmicas sirvi como punto de partida para elaborar mapas ms completos con
vectores ms fiables y manejables, como BACs y PACs.
El PROYECTO GENOMA hizo una revisin de sus objetivos en 1993, teniendo en cuenta los
progresos realizados en los 3 aos anteriores, y estableci nuevas metas para los siguientes 5
aos (1993-1998). En resumen, estos nuevos objetivos fueron:

conseguir un mapa gentico con resolucin de 2 a 5 cM entre marcadores.

conseguir un mapa fsico con STS espaciados regularmente cada 0.1 Mb (lo que
significaba identificar y localizar la posicin de como mnimo unos 30.000 STS).

desarrollar nuevas tecnologas para la identificacin de genes a partir de ADN genmico.

desarrollar nuevas tecnologas de secuenciacin y completar 80 Mb de secuencia


confirmada para todos los organismos que estaban siendo secuenciados por los distintos
proyectos.

Potenciar la genmica comparada: completar las secuencias de E. coli, S. cerevisiae y C.


elegans, y comenzar los proyectos de secuenciacin de los genomas de Drosophila y de
ratn.

Cuando en 1998 se revisaron los avances realizados en esos cinco aos, con el fin de disear un
nuevo plan quinquenal, los resultados haban sido realmente prometedores: en Septiembre
de 1994 se public un mapa gentico de todo el genoma humano integrado por 4.000 marcadores
tipo micro satlite y 1.800 marcadores tipo RFLP, con una distancia media entre marcadores de 0.7
cM. Esto superaba en ms de 3 aos el objetivo propuesto inicialmente. Por su parte, Gnthon
public en 1995 otro mapa fsico de YACs que estaba formado por 255contigs (con un tamao
medio de 10 Mb cada contig) y cubra el 75% del genoma humano. Durante esos aos se
continuaron desarrollando nuevos marcadores tipo STS, hasta llegar en 1998 a un mapa que
contena 52.000 STS (casi el doble de los inicialmente propuestos).
Por lo que respecta a la secuenciacin, en octubre de 1998 se haba obtenido un total de 180
Mb de secuencia del genoma humano (6% del total), adems de 111 Mb de secuencia de otros
organismos, muy por encima de lo previsto en el plan 1993-1998. Adems, se haba completado la
secuencia de E. coli y de S. cerevisiae, ste ltimo el primer organismo eucariota en ser
secuenciado totalmente. Esto fue posible gracias a importantes avances en la tecnologa de
secuenciacin, que se hizo progresivamente ms rpida, fiable y barata. Posteriormente, en

diciembre de 1998, se complet la secuencia de C. elegans, el primer organismo multicelular


secuenciado en su totalidad con un genoma de unas 97 Mb.

Por tanto, en 1998 el PROYECTO GENOMA se fij un nuevo plan de objetivos hasta el ao 2003,
en el que se incluan 6 metas concretas:

Completar la secuencia del genoma humano para 2003 (ao que coincida con el 50
aniversario del descubrimiento de la doble hlice por Watson y Crick), creando un primer
borrador de trabajo en el 2001. Este objetivo se aceler enormemente por la competencia
de la empresa privada Celera Genomics (tambin iniciativa de Craig Venter), que se
propuso secuenciar todo el genoma humano, utilizando una estrategia distinta al consorcio
internacional del PROYECTO GENOMA, con el fin de obtener la propiedad intelectual y
poder explotar esa informacin con fines comerciales. A pesar de los problemas suscitados
inicialmente por la fuerte competencia entre ambos proyectos, el 26 de junio de 2000 se
produjo el anuncio oficial de que se haba alcanzado un primer borrador del 87% de la
secuencia del genoma humano. Este primer borrador fue publicado el 15 de Febrero de
2001 en las revistas Nature (el mapa del Consorcio Internacional) y Science (el mapa de
Celera Genomics).

Continuar el desarrollo y la innovacin de las tecnologas de secuenciacin. Como ya se ha


comentado, ste ha sido un factor determinante en el avance del PROYECTO GENOMA.

Estudiar la variacin en el genoma humano. Como hemos visto, los SNP se encuentran en
el genoma humano a razn de 1 por cada kilobase, como promedio, y representan las
diferencias genticas entre individuos de una misma especie. Como se ver en el Captulo
11, la creacin de mapas densos de SNP permitir llevar a cabo estudios de asociacin
para detectar los genes que estn implicados en enfermedades complejas, debidas a
alteraciones en muchos genes siendo la contribucin de cada gen a la enfermedad
pequea y, por tanto, difciles de detectar por otros mtodos de ligamiento paramtrico.

Desarrollar tecnologa para la genmica funcional, es decir, identificar todos los genes y
determinar cul es la funcin de cada gen. La gran revolucin en las estrategias de
identificacin de regiones codificantes (es decir, genes) comenz con la idea de Craig
Venter de secuenciar al azar y a gran escala fragmentos de ADNc de bibliotecas obtenidas
a partir de diversos tejidos. Estos fragmentos de secuencia se denominaron "Etiquetas de
Secuencia Expresada" (EST, Expressed Sequence Tags), ya que en el fondo cada
una representa un fragmento de un ARNm (una secuencia expresada en un tejido
concreto). En pocos aos, la base de datos de EST creci de manera exponencial, con
cientos de miles de secuencias expresadas procedentes de distintas bibliotecas de ADNc.
Como algunos de estos EST proceden de un mismo ARNm, se cre una coleccin no
redundante llamada UNIGENE que agrupa los EST por familias, siendo cada familia
representativa de un nico ARNm. Poco despus comenzaron tambin proyectos
internacionales para mapear secuencias de UNIGENE, de manera que en 1994 se public
un primer mapa con la localizacin de 16.000 EST correspondientes a genes distintos, y en
1998 se public un segundo mapa de 41.664 EST, que representaban 30.181 genes
distintos. Cuando se conozca el catlogo completo de genes de nuestro genoma, ser
necesario estudiar la expresin de cada gen en distintos tejidos y en distintas situaciones
fisiolgicas y patolgicas, en respuesta a distintos factores ambientales, etc. Lgicamente,
esto ser el objeto de la investigacin biomdica de buena parte del siglo XXI.

Genmica Comparada. El anlisis comparado de los genomas de varias especies es de


gran utilidad para identificar mecanismos biolgicos conservados durante la evolucin (por

lo que son especialmente importantes), estructura y funcin de genes ortlogos, etc.


Aunque el plan para 1998-2003 se propuso conseguir la secuencia completa del genoma
de Drosophila para el ao 2002, esta meta se cumpli en abril del ao 2000 gracias a la
colaboracin de laboratorios y Universidades con Celera Genomics, descifrando unas 120
Mb de secuencia que comprenden la prctica totalidad de la eucromatina de este insecto.
El nuevo gran reto ahora es conseguir la secuencia completa del genoma de otras
especies de mamferos: el primer borrador completo del genoma de ratn se obtuvo en
2002 y el del genoma de chimpanc en 2005.

Implicaciones ticas, legales y sociales del PROYECTO GENOMA. Es importante tener


consciencia de la influencia que va a tener el Proyecto Genoma y sus aplicaciones sobre
los individuos y las sociedades. Cuestiones como el diagnstico de enfermedades que no
tienen tratamiento, la extensin de una mentalidad eugensica que lleve a la discriminacin
por razn de deficiencias genticas, el diagnstico prenatal de alteraciones genticas que
confieren predisposicin a sufrir enfermedades que se manifestarn en la edad adulta, la
deteccin de rasgos psicolgicos con base gentica, la confidencialidad de la informacin
gentica de los individuos (y la posible discriminacin laboral) sern una constante en los
debates sociales de este siglo, y es importante llevar a cabo una labor de divulgacin seria
para que la sociedad pueda discutir de modo sosegado y bien fundamentado las bases
ticas sobre las que sostener las aplicaciones biomdicas de la biotecnologa en los aos
que se avecinan.

Desarrollo de herramientas bioinformticas (bases de datos y herramientas de anlisis de


datos) que puedan ser compartidas por la comunidad cientfica. Ser especialmente
importante el desarrollo de herramientas informticas que permitan identificar exones y
predecir la estructura de genes en grandes secuencias genmicas, as como plataformas
de genmica funcional para el anlisis de la expresin de miles de genes a la vez.

Formacin en genmica: favorecer que cientficos y acadmicos se dediquen a la


investigacin genmica y a divulgar y aumentar el conocimiento pblico de los distintos
aspectos del PROYECTO GENOMA.

Finalmente, la primera versin esencialmente completa del genoma humano fue anunciada
oficialmente el 14 de abril de 2003, cubriendo un total de 3.069 Mb (92.3% del total estimado del
genoma humano) con un 99.99% de fiabilidad en cada posicin secuenciada. El anlisis de la
secuencia publicada permite hacerse una idea bastante aproximada de la estructura de nuestro
genoma, su composicin y algunas de sus caractersticas funcionales.