Documentos de Académico
Documentos de Profesional
Documentos de Cultura
7 - Genómica y Proteómica PDF
7 - Genómica y Proteómica PDF
1 2
Durante la década de 1980 los genetistas comenzaron a utilizar la tecnología del ADN
recombinante como una aproximación al análisis genético, cartografiando secuencias de ADN
clonadas en cromosomas específicos. La mayor parte de estas secuencias no eran genes, sino
marcadores como polimorfismos de longitud de fragmentos de restricción (RFLP), polimorfismo de
un único nucleótido (SNP) y otros. Una vez asignados a un cromosoma, estos marcadores se
utilizaban en árboles genealógicos para establecer un ligamiento entre los marcadores y
enfermedades genéticas. Este método denominado clonación posicional se utilizó para
cartografiar, aislar, clonar y secuenciar los genes de distintas enfermedades.
1
A mediados de 1980 ya se habían asignado más de 3.500 genes y marcadores a
cromosomas humanos. Actualmente se han secuenciado centenares de genomas de procariotas
y eucariotas, y hay más de mil proyectos en ejecución.
Genómica Estructural
Genómica Funcional
Genómica Comparativa
2
La Proteómica es una extensión de la Genómica y su objetivo es el estudio de las proteínas
presentes en una célula, en un tejido, en un fluido en un momento dado bajo determinadas
condiciones. Define el conjunto completo de proteínas codificadas por un genoma. Incluye:
Identificación de todas las proteínas expresadas en una célula bajo determinadas
condiciones.
La naturaleza y el alcance de cualquier modificación pos-traduccional de las proteínas.
Las interacciones proteína-proteína.
La localización subcelular de las proteínas.
3
GENÓMICA ESTRUCTURAL
MAPAS GENÉTICOS
Distancia en un
mapa genético
Marcadores de ADN
4
Durante muchos años, los genes podían detectarse sólo observando su influencia en un
rasgo (fenotipo) y la construcción de mapas genéticos estaba limitada por la disponibilidad de
rasgos de un locus individual que podrían examinarse por la evidencia de la recombinación. Al
final, esta limitación se superó con el desarrollo de técnicas moleculares, como el análisis de
polimorfismos de la longitud del fragmento de restricción, la reacción en cadena de la polimerasa
(PCR) y la secuenciación de ADN, mejorando los mapas genéticos.
Los mapas genéticos tienen varias limitaciones, la primera es la baja resolución o el detalle.
Segundo, no siempre se corresponden con precisión a las distancias físicas entre los genes. Los
mapas genéticos se basan en las frecuencias de entrecruzamiento o recombinación, que varían
de un cromosoma a otro, de modo que las distancias de un mapa genético son sólo
aproximaciones de distancias físicas reales a lo largo de un cromosoma. A pesar de estas
limitaciones, los mapas genéticos han sido fundamentales para el desarrollo de los mapas físicos y
la secuenciación de genomas completos.
MAPAS CITOGENÉTICOS
5
Con el avance de las técnicas de bandeo cromosómico, la citogenética cuenta con una
herramienta de mayor precisión en la individualización de los cromosomas, facilitando su
agrupamiento y clasificación morfológica.
El estudio citogenético en animales domésticos se ha desarrollado rápidamente en los
últimos años. Hoy en día es utilizado como elemento de diagnóstico que permiten detectar un
gran número de patologías. A su vez el bandeo cromosómico, ha permitido precisar la
localización de genes aportando información al mapa genético. Por otro lado permiten realizar
estudios evolutivos de especies relacionadas entre sí.
La construcción de los mapas citogenéticos o cromosómicos se realizan utilizando técnicas
que no incluyen la reproducción sexual (meiosis) y, por lo tanto, asignan una localización según las
regiones citogenéticas (además, estos mapas presentan la ventaja de no requerir del uso de
marcadores polimórficos). Esas técnicas son:
Hibridación in situ,
Híbridos de células somáticas
Híbridos de radiación.
Hibridación In Situ.
Cuando una secuencia de ADN, en este caso referida como una “sonda” de ADN (en
inglés, probe), es marcada con isótopos radioactivos o fluorescencia, podemos hibridarla con su
secuencia complementaria en el ADN genómico de un cromosoma específico y observar la
marca directamente sobre el extendido cromosómico con un microscopio óptico. Las células
deben estar fijas y los cromosomas esparcidos en un portaobjetos y expuestos a una solución de
pH elevado para romper el apareamiento de bases y permitir el acceso a las sondas. La
hibridación in situ fluorescente (FISH) es una técnica muy sensible siempre que se cuente con
sondas lo suficientemente grandes (y homólogas) y que se suprima la fluorescencia de fondo. La
sensibilidad de esta variante de la técnica de hibridación in situ es que permite localizar una
secuencia con una precisión de hasta 30 Mb y de detectar anormalidades cariotípicas en
cromosomas metafásicos tanto como interfásicos. Los fluorocromos más empleados son:
fluoresceína (FITC), rodamina (XRITC) y Texas Red.
6
Por último, el pintado de cromosomas (del inglés chromosome painting) es una variante del
FISH que emplea una mezcla de sondas de ADN derivada de un cromosoma entero o de una
región cromosómica de interés. Se utiliza para obtener patrones de regiones homólogas entre
diferentes especies y es una forma muy directa de evaluar la cantidad de rearreglos que se
produjeron entre dos especies en el curso de la evolución.
7
Híbridos de Radiación (HR)
Otra técnica desarrollada para obtener mapas de alta resolución son los paneles de
híbridos de radiación (Radiation Hybrid –RH), enfoque descripto por Goss y Harris en 1975. Las dos
grandes ventajas de este sistema son que pueden mapearse marcadores o genes no polimórficos
(se evalúa sólo la presencia o ausencia de un marcador) y que se logra una resolución mayor que
con los mapas de ligamiento, constituyendo un puente entre éstos y los mapas físicos. Estos
paneles de células híbridas se construyen a partir de células donantes (de la especie a ser
mapeada) que han sido irradiadas letalmente (ya sea con rayos g o X) para causar la
fragmentación de sus cromosomas (por roturas de doble cadena). Las células así irradiadas son
fusionadas con líneas celulares receptoras deficientes para un marcador de selección, como ser
la timidina quinasa (TK–) o la hipoxantina fosforibosil transferasa (HPRT–). Usando condiciones de
selección con medios apropiados, sobrevivirán sólo aquellas células que contengan, por lo menos,
algún fragmento cromosómico proveniente de las células dadoras.
El concepto teórico es que aquellos loci que se encuentran muy próximos unos de otros
serán retenidos en el mismo fragmento cromosómico después de la radiación. Esta característica
es similar al principio de ligamiento genético que hemos visto en los mapas meióticos. Como en los
paneles de ADN obtenidos con cruzas de animales, la información de los paneles HR es
acumulativa y puede proveer datos para el ordenamiento (de alta resolución) de regiones no
polimórficas o no separables por los mapas de ligamiento.
Figura 6. Híbridos de radiación. Construcción de clones de híbridos de radiación (HR) a partir de células
donantes con un único cromosoma humano (híbrido mono-cromosómico) y células receptoras de hámster.
Cada clon (abajo) presenta una colección diferente (al azar) de fragmentos del cromosoma humano
original. Los 6 loci hipotéticos (A a F) se marcan como + (presencia) o - (ausencia), dando una idea del
ordenamiento en el cromosoma original
8
Cuando se evalúa un marcador (por Southern blot, FISH o PCR), el patrón de presencia (+)
o ausencia (–) a través del panel, define el emplazamiento del mismo: aquellos marcadores con el
mismo patrón de + y – estarán localizados en el mismo “bin” o posición. Estos estudios se conocen
como “patrones de retención de marcadores” y nos ayudan a determinar la ubicación de un gen
o marcador. En estos casos, la unidad para medir la distancia en el mapa es el Ray o el centiRay
(cR).
MAPAS FÍSICOS
Los mapas físicos están basados en el análisis directo del ADN y ponen los genes respecto
a distancias medidas en el número de pares de bases, kilobases o megabases. Un tipo común de
mapa físico es el que conecta piezas aisladas de ADN genómico que fue clonado en bacterias o
levaduras. Una de las ventajas es que, por lo general, los mapas físicos tienen resolución mayor y
son más exactos que los mapas genéticos.
Clones de ADN
alineados
Figura 7. Los
mapas físicos a
menudo se utilizan
para ordenar los
fragmentos de
ADN clonados.
Hay varias técnicas para crear mapas físicos, entre las que se incluyen el mapeo de
restricción, que determina las posiciones de sitios de restricción en el ADN; el mapeo del sitio de
secuencia específica (sequence-tagged site, STS), que localiza las posiciones de secuencias
cortas únicas de ADN en un cromosoma; la hibridación in situ fluorescente (fluorescent in situ
hybridization, FISH), por el cual pueden mapearse los marcadores visualmente en sus
localizaciones cromosómicas y la secuenciación de ADN.
9
VISUALIZACION DE LOS FRAGMENTOS DE ADN
2. Otra técnica es la Southern blot, sirve para transferir los fragmentos desnaturalizados
monocatenarios provenientes de un gel a un medio sólido delgado. Estos fragmentos son cortados
por una o más enzimas de restricción. Se puede identificar que clones de una biblioteca
contienen una determinada secuencia de ADN y para caracterizar el tamaño de los fragmentos.
También se puede utilizar para determinar si un clon contiene todo un gen o solo parte de el.
Los fragmentos se separan por electroforesis en gel, lo que produce una serie de bandas.
Se tiñe el ADN en el gel con bromuro de etidio y se fotografía o escanea para determinar el
número y peso molecular de los fragmentos. El ADN se debe desnaturalizar en fragmentos de
cadena sencilla con un tratamiento alcalino. Se cubre el gel con una membrana de nitrocelulosa.
Los fragmentos de ADN del gel se transfieren a la membrana colocando la membrana y el gel
sobre un pabilo (esponja) sumergida parcialmente en una solución tampón. Se colocan varias
capas de papel de celulosa secante. La acción capilar arrastra el tampón por el gel y de esta
manera se transfieren los fragmentos de ADN del gel al filtro de nitrocelulosa. Después de la
transferencia al gel se coloca en una solución de hibridación de una sonda marcada en forma
radiactiva o química. La sonda se unirá a todos los fragmentos de ADN en la membrana que
posee secuencias complementarias. Luego se lava la membrana para sacar la sonda no unida y
la sonda unida se detecta por autorradiografía u otro método para sondas marcadas.
10
Figura 8. Técnica de Southern blot
para transferir los fragmentos
desnaturalizados monocatenarios
provenientes de un gel a un
medio sólido delgado.
7. Mutagénesis
Una manera muy eficaz para estudiar los genes es provocar mutagénesis y estudiar los efectos
en el organismo.
11
8. Animales transgénicos
En ratones y otros mamíferos el ovocito es lo
suficientemente grande como para inyectar el ADN
de manera directa. En el estado de dos pronúcleos
antes de la fecundación. Antes de la fecundación se
puede inyectar el ADN en uno de ellos y así unas
copias de ADN son inyectadas y se integran al azar
mediante un proceso denominado recombinación
no homóloga. Los embriones se implantan luego en
una hembra seudopreñada, madre sustituta.
Figura 10. Knock-out. Dentro del ratón la copia normal del gen
puede intercambiarse con la desactivada a través de la
recombinación.
12
Reacción en Cadena de la Polimerasa para amplificar el ADN (PCR)
14
SECUENCIACION
15
Figura 12. Método químico de
Maxam y Gilbert.
16
de poliacrilamida - urea. Cada una de las cuatro reacciones de síntesis se corre en calles
individuales (A, T, G y C) y se visualizan las bandas de ADN mediante autorradiografía o luz
ultravioleta. Las bandas obtenidas en el gel corresponden a los fragmentos de ADN de diferentes
longitudes
Una banda en una calle indica un fragmento de ADN que es el resultado de una
terminación de la cadena tras la incorporación de un didesoxinucleótido (ddATP, ddGTP, ddCTP o
ddTTP). El nucleótido terminal puede ser identificado de acuerdo al didesoxinucleótido que se
añadió en la reacción que dio lugar a esa banda. Las posiciones relativas entre las cuatro calles
se utilizan entonces para leer la secuencia de ADN.
17
Secuenciación automática de Sanger
Durante muchos años, la secuenciación del ADN se realizó sobre todo en forma manual y
era una técnica laboriosa y costosa. En la actualidad, la secuenciación se lleva a cabo mediante
aparatos automatizados que utilizan colorantes fluorescente y escáneres de láser para los miles de
secuencias de pares de bases en unas pocas horas.
Figura 14. Esquema de la secuenciación por el método automático de electroforesis capilar con la secuencia
obtenida.
Los ddNTP utilizados en la reacción automatizada se marcan cada uno con un colorante
fluorescente distinto. Las cuatro reacciones pueden tener lugar en el mismo tubo de ensayo y
pueden colocarse en el mismo pocillo durante la electroforesis, dado que cada dNTP se marca en
forma distintiva. Los aparatos de secuenciación recién desarrollados llevan a cabo la electroforesis
en tubos capilares que contienen gel. Los fragmentos de diferentes tamaños producidos por la
reacción de secuenciación se separan dentro de un tubo y al migrar pasan por delante de un haz
de láser y un detector.
Cuando los fragmentos pasan por el láser, sus colorantes fluorescentes se activan y la
fluorescencia resultante se detecta por un escáner óptico. Cada colorante emite fluorescencia de
una longitud de onda característica que se lee en el escáner óptico. Para la interpretación, la
información ingresa en una computadora y los resultados se imprimen como un conjunto de picos
18
en un gráfico (Fig. 14). Los aparatos de secuenciación automatizados pueden contener 96 tubos
capilares o más, lo que permite leer secuencias de 50.000 a 60.000 pb en unas pocas horas.
19
El equipo funciona de forma completamente automática inyectando las muestras (que se
preparan exactamente igual que durante la secuenciación en geles y se colocan en una placa
de 96 pocillos), en un capilar previamente cargado con un cierto polímero que funciona como lo
hace la matriz de acrilamida-bisacrilamida-urea de los geles de secuencia, permitiendo resolver
fragmentos de ADN de cadena sencilla que se diferencian en una única base.
A una altura determinada el laser detecta la fluorescencia emitida por cada cadena
sencilla de ADN fluorescente y traduce esta emisión de fluorescencia en la secuencia
correspondiente. Una vez desarrollada la electroforesis de la primera muestra, el capilar se vacía
rellenándose nuevamente con polímero fresco. Se inyecta a continuación una segunda muestra,
se procede a desarrollar nuevamente la electroforesis y así sucesivamente.
20
SECUENCIACIÓN DE TODOS LOS GENES DEL GENOMA
Corte de ADN
con enzima de Figura 17. Estrategia general para clonar un gen.
restricción
Un trozo de ADN es manipulado con enzimas de
restricción e introducido en un plásmido el cual a
su vez es introducido en una bacteria. Al cultivar la
bacteria se obtienen múltiples copias del ADN de
interés.
Introducción del
plásmido El clonado se realiza con distintos tipos
recombinante a
la bacteria de enzimas de restricción y vectores: Las
enzimas de restricción son proteínas aisladas
de bacterias cuya función es cortar ADN.
Cada enzima reconoce un sitio particular del
ADN, es decir que reconoce una secuencia
particular de nucleótidos. Esa secuencia
específica se denomina “sitio de restricción”.
Una vez que la enzima reconoce estos sitios,
se posiciona sobre la molécula de ADN y
corta dentro o en torno de esa secuencia.
21
Cortes con extremos romos Cortes con extremos cohesivos
de ADN que llevan insertados. Para que sirva de vector, una molécula debe ser capaz de
replicarse junto con el fragmento de ADN que transporta. También tiene que tener secuencias de
reconocimiento que permitan la inserción del fragmento de ADN a clonar.
Para insertar un fragmento de ADN al vector, se utiliza una enzima de restricción, y se
mezcla con fragmentos de ADN producidos con la misma enzima.
Los vectores que transportan un fragmento insertado se denominan vectores
recombinantes.
Hay muchos vectores de clonación, que es una molécula de ADN replicante y estable a la
cual puede adherirse un fragmento de ADN extraño para la introducción en una célula. Difieren
en la especificidad de la célula huésped, el tamaño de los insertos que pueden transportar y en el
número de copias que producen y el número y tipo de genes marcadores que contienen.
Tipos de Vectores:
Vectores procariotas:
1. Plásmidos: (ADN episómico). Para secuencias cortas de 10.000 bases (10 Kb). Son circulares y
existen naturalmente en las bacterias. Contienen orígenes de replicación y pueden por eso
replicarse independientemente del cromosoma bacteriano.
22
extremos romos. Primero, se corta el plásmido y el ADN extraño con una enzima de restricción. Si la
enzima de restricción produce extremos cohesivos, estos se eliminan por una enzima que digiere el
ADN monocatenario. De manera alternativa el plásmido y el ADN extraño pueden cortarse por
una enzima de restricción que produce extremos romos. Una vez que el plásmido y el ADN extraño
tienen extremos romos, los extremos cohesivos monocatenarios son agregados por una enzima
transferasa terminal.
Un tercer método de inserción de fragmentos consiste en utilizar la enzima ligasa T4, capaz
de conectar dos piezas cualquiera de extremos romos de ADN y se denomina clonación
mediante el uso de conectores.
Una vez insertado el plásmido debe introducirse en las células bacterianas. Esta tarea suele
cumplirse mediante la transformación y que es la capacidad de las bacterias de captar el ADN
del ambiente externo. Muchas veces la transformación es un proceso natural, y otros deben
tratarse en forma química o física previamente. Los plásmidos dentro de la célula se replican y
multiplican.
2. Bacteriófagos: (gran capacidad para invadir bacterias, se utiliza para ADN complementario y
genómico). Ofrecen ciertas ventajas y el más común es el bacteriófago λ que infecta E. Coli. Una
de sus ventajas es la elevada eficiencia para transferir el ADN a las bacterias. Una segunda
ventaja es que cerca de la tercera parte del genoma λ no es esencial para la infección ni para la
reproducción. Estos genes no esenciales que comprenden alrededor de 15 Kb pueden ser
reemplazados por hasta 23 Kb de ADN extraño. El ADN extraño cortado con EcoRI tendrá
extremos cohesivos que son complementarios con los de los extremos de los genes λ esenciales, a
los cuales puede conectarse mediante la ligasa. El cromosoma λ posee extremos monocatenarios
cortos denominados sitios cos, necesarios para empaquetar en ADN λ dentro de la cabeza de un
fago. Los cromosomas del fago recombinante pueden entonces empaquetarse en la cubierta
proteica y agregarse a E. coli. Los fagos inyectan su ADN recombinante dentro de la célula,
donde se replicará. Sólo los fragmentos de ADN de tamaño adecuado y que contienen genes
esenciales se empaquetarán en las cubiertas del fago.
3. Cósmidos: Los cósmicos combinan las propiedades de los vectores plásmidos y los fagos. Los
fragmentos de ADN grandes de 44 Kb pueden clonarse en cósmicos.
Los cósmicos son plásmidos pequeños que contienen los sitios cos del fago λ; pueden
empaquetarse con las cubiertas virales y transferirse a las bacterias por infección viral. Dado que
se pierden todos los sitios virales menos los sitios cos, un cósmico puede tener más del doble del
ADN extraño que puede transportar el fago vector.
23
El ADN extraño es insertado en los cósmicos del mismo modo que se introduce en los plásmidos.
Vectores eucariotas:
24
1. YACs: (cromosoma artificial de levadura). Es un material bastante inestable. Para secuencias
de hasta 1 Mb (1000 Kb o 1 millón de bases). Son moléculas de ADN con un origen de replicación
de levadura, que permite que se replique, un par de telómeros que garantizan estabilidad dentro
de la célula y un centrómero.
2. BAC: Cromosoma artificial de bacterias. Se utilizan para clonar segmentos grandes desde 100
a 500 Kb (100.000 bases a 500.000 bases).
El ADN clonado en los BACs es por lo general más pequeño que los YACs. Sin embargo, los
BACs ofrecen ventajas importantes como por ejemplo, son más manipulables para ciertos tipos de
25
estudios en el laboratorio. Los BACs se usan a gran escala para construir mapas físicos de alta
resolución de los cromosomas, con el fin de establecer la secuencia completa del genoma.
El método de Hierarchical Shotgun Sequencing fue propuesto por James Watson y Francis
Collins, entre otros, contando con la mayor parte de la financiación pública.
Esta metodología resulta la más compleja, con un conocimiento más exhaustivo del
genoma. Básicamente consiste en secuenciar el genoma completo, cromosoma a cromosoma de
26
un extremo al otro. Se hacen 2 o 3 fragmentos del ADN (fragmentos cortos de 2 Kb, fragmentos de
15-20 Kb y también se pueden hacer fragmentos de 200-300 Kb).
Luego se construye una biblioteca genómica con cada preparación con la utilización de
vectores BAC. Se seleccionan y secuencian clones al azar de estas bibliotecas. Luego se utiliza un
programa para ensamblar y superponer largos tramos de secuencia a partir de los fragmentos
cortos, usando las secuencias de los clones más largos como marco de referencia.
1 2
27
Tabla 1. Ejemplos de genomas completos o de borradores de secuencias publicadas.
28
NUEVOS MÉTODOS DE SECUENCIACIÓN
SECUENCIACIÓN DE ALTO RENDIMIENTO
Figura 25. Evolución de las tecnologías de alto rendimiento. ABI-3730 de Applied Biosystems, posiblemente el
más utilizado en la secuenciación del genoma Humano, con una capacidad de 1 Mb por día (Un millón de
bases). El AB-SOLID actual, en menos de 10 años ha multiplicado por 1000 la capacidad de secuenciación.
29
Amplificación clonal in vitro
Figura 26. Emulsión de PCR. Una molécula de ADN por perla. La amplificación clonal de miles de copias se
produce en microrreactores en una emulsión.
30
Figura 27. Amplificación en fase sólida. Una molécula de ADN por Cluster.
Secuenciación paralelizada
Una vez que las secuencias clonales de ADN se localizan físicamente en posiciones
separadas de la superficie, se pueden utilizar varios métodos de secuenciación para determinar
las secuencias de ADN de todas las localizaciones en paralelo.
1 2
31
La "secuenciación por síntesis", como en la popular secuenciación electroforética con
terminador marcado con colorante, usa el proceso de síntesis de ADN por ADN polimerasa para
identificar las bases presentes en la molécula complementaria de ADN. Los métodos de
terminador reversible (usados por Illumina y Helicos) utilizan versiones reversibles de terminadores
marcados con colorante, añadiendo un nucleótido cada vez, y detectando la fluorescencia
correspondiente a esa posición y removiendo posteriormente el grupo de bloqueo para permitir la
polimerización de otro nucleótido.
32
reservorio de todos los oligonucleótidos posibles de una longitud dada, marcados de acuerdo con
la posición secuenciada. Los oligonucleótidos se templan y ligan; el ligamiento preferente de las
ADN ligasas por su secuencia específica produce una señal correspondiente a la secuencia
complementaria en esa posición concreta. Shendure et al., usaron este método para secuenciar
el genoma de E. coli MG1655.
33
Real Time (Secuenciación en Tiempo Real)
Genoma de enriquecimiento
A pesar de las reducciones de costes sustanciales asociados con tecnologías NGS (Next
Generation Sequencing) en comparación con el método automatizado de Sanger, la
secuenciación del genoma completo es todavía un esfuerzo costoso. Una solución provisional a
este problema puede ser el uso de plataformas de NGS para apuntar a regiones de interés
específicas. Esta estrategia se puede utilizar para examinar todos los exones en el genoma, genes
específicos de las familias que constituyen dianas farmacológicas conocidas o las regiones que
están implicados en enfermedades o en efectos farmacogenéticos.
34
El concepto de focalización de regiones específicas del genoma está bien establecido,
con la PCR es el más ampliamente utilizado, aunque en una escala pequeña. PCR acoplado con
secuenciación de Sanger está adecuadamente emparejado para analizar unos cuantos
candidatos genes, pero el acoplamiento de la PCR con las plataformas NGS de alto rendimiento
no es práctico porque la preparación de la muestra requeriría el manejo de decenas de miles de
cebadores de forma individual o en grupos multiplex.
Un artículo de Frazer y sus colegas en colaboración con RainDance Technologies (2009)
informaron la amplificación simultánea de 3.976 productos que utilizan tecnologías de microgotas
PCR.
La producción de grandes cantidades a bajo costo hace que las plataformas de NGS
descritas anteriormente sean útiles para muchas aplicaciones. Estos incluyen el descubrimiento de
la variante por resecuenciación de regiones específicas de interés o genomas en su totalidad, el
asamblado de novo de bacterias y de genomas eucariotas menores, la catalogación de los
transcriptomas de células, tejidos y organismos (ARN-seq), los perfiles en todo el genoma de las
marcas epigenéticas y la estructura de la cromatina usando métodos basados en la seq (CHIP-
seq, metil-seq y ADNsa-seq) y la clasificacion de especies y el descubrimiento de genes pora
estudios de la metagenómica.
Por ejemplo, las plataformas Illumina/Solexa y LIfe/APG son variantes muy adecuadas para
el descubrimiento de resecuenciación de genomas humanos, porque se producen por ciclo
volúmenes gigantescos de bases de alta calidad.
Además, la plataforma, Helicos BioSciences es muy adecuado para aplicaciones que
exigen información cuantitativa de ARN o ARN seq.
El rápido ritmo de los avances tecnológicos en el campo podría cambiar esta información
en un futuro próximo.
Genomas individuales
Los estudios del genoma humano tienen por objeto un catálogo de SNV S (variante de un
simple nucleótido) y la SVS (variantes estructurales) y su asociación a diferencias fenotípica, con el
objetivo final de personalizar la genómica con fines médicos. En 2004, el Consorcio Internacional
de Secuenciación del Genoma Humano publicó la primera, y todavía única, referencia terminada
del genoma humano (actualmente Centro Nacional de Biotecnología de la Información: NCBI). Su
costo fue estimado en US $300 millones.
La genómica individual también está siendo aplicada al estudio de la enfermedad. Por
ejemplo, Mardis et al., reportaron la secuencia de dos genomas del cáncer de leucemia mieloide
agudo mediante la plataforma Illumina/Solexa, y ambos estudios, identificaron mutaciones
somáticas que pueden ser asociada con la enfermedad. Gibbs et al., describieron recientemente
35
la elucidación de las dos variantes alélicas en una familia con una forma recesiva de la
enfermedad de Charcot-Marie-Tooth utilizando la plataforma Life/APG.
Varios proyectos destinados a la secuenciación de más individuos, incluyendo el “Atlas del
genoma del cáncer” y “El proyecto de 1000 Genomas”, también están utilizando las plataformas
Illumina/Solexa y Life/454 para secuenciar genomas enteros.
En comparación con la secuenciación automatizada de Sanger, las plataformas de NGS
han aumentado dramáticamente el rendimiento y redujo sustancialmente los gastos, con varios
grupos presentando informes de costos de reactivos por debajo de $100.000. Sin embargo, existe
una gran variabilidad entre y dentro de plataformas NGS en términos de tamaño del molde y
construcción, largo de lectura, rendimiento y la base y la cobertura del genoma, y dicha
variabilidad hace que sea difícil evaluar la calidad (es decir, la precisión de la cobertura del
genoma y continuidad del genoma) de los genomas basado en consideraciones de costo.
En junio de 2009, Illumina anunció la secuenciación del genoma individual por el precio de
US$ 48.000. Complete Genomics ofrece un servicio similar a un precio de US$ 5.000. Sin embargo, el
logro del ahorro de los costos también puede venir con una disminución de la calidad de la
información.
Las tecnologías de NGS tienen una impresionante gama de aplicaciones, y actualmente se
están desarrollando aún más. Además de las aplicaciones descritas anteriormente, las tecnologías
de NGS están siendo utilizadas para caracterizar las relaciones evolutivas de genomas antiguos y
para dilucidar el papel de secuencias no codificantes en la salud y enfermedades. En un futuro no
muy lejano, es previsible que las tecnologías de NGS pudieran ser utilizadas para obtener datos de
alta calidad a partir de la secuencia un genoma aislado de una sola célula, lo que sería un
avance importante, sobre todo para la genómica del cáncer. Para que esto ocurra, serán
necesarios avances en las técnicas, para aislar eficazmente largas moléculas de ADN intactas, y
en los métodos, para la lectura precisa de la secuencia. El campo del desarrollo de NGS y las
aplicaciones es un área de rápido movimiento de la investigación, que hace de este un momento
emocionante para los estudios genómicos.
36
Aplicaciones de la tecnología del ADN recombinante
Además de proporcionar información valiosa sobre los genes la Tecnología del ADN
recombínate tiene numerosas aplicaciones como la elaboración de productos farmacéuticos
(insulina), y otras sustancias, bacterias especializadas (como producción de etanol a partir de
plantas), plantas y animales de granja diseñados por ingeniería genética y para corregir defectos
genéticos humanos. Algunos fármacos oligonucleótidos (secuencias cortas de ADN sintético o de
ARN pueden utilizarse para tratar enfermedades (terapia génica). Los oligonucleótidos antisentido
son complementarios a los ARN no deseados, como el ARN viral. Cuando se agrega a una célula,
estos ADN antisentido se unen al ARNm viral e inhiben su traducción. Varios fármacos han sido
probados para diferentes tratamientos para el cáncer.
También ha permitido el desarrollo de sondas para detectar mutaciones causantes de
enfermedades. Se dispone de la comprobación prenatal para varios centenares de
enfermedades genéticas. Para muchas enfermedades genéticas las únicas pruebas diagnósticas
disponibles son las que identifican una mutación predisponerte en el ADN, pero muchas
enfermedades genéticas son provocadas por varias mutaciones diferentes y derivar en resultados
pueden ser falsos Salvo la completa secuenciación del gen que es costosa no hay manera de
identificar a todos los individuos predispuestos.
En la terapia génica debían primero localizarse los genes causantes de enfermedades y
desarrollarse vectores. Un método de terapia consiste extraer células del cuerpo agregar los virus
con los genes recombinantes e reintroducir las células en el cuerpo del paciente. En este caso los
vectores se introducen directamente.
Figura 32. Evolución de proyectos y publicaciones
37
Generalidades del análisis genómico
El objetivo final del análisis de la secuencia es obtener una descripción funcional completa
de todos los genes del genoma de un organismo.
38
GENÓMICA FUNCIONAL
La Genómica Funcional clasifica los genes de las secuencias dilucidadas por la Genómica
Estructural e identifica sus funciones.
Algunos genes pueden tener funciones previamente asignadas mediante los métodos
clásicos de mutagénesis y de cartografía de ligamiento; pero muchos genes no tienen aún una
función asignada.
La genómica funcional es el estudio simultáneo de todos los genes involucrados en un
estado fisiológico determinado o en un tejido en particular.
Permite comprender la organización y los mecanismos genéticos que en conjunto hacen a
la fisiología de un organismo.
La secuencia de nucleótidos de un gen puede utilizarse para predecir la secuencia de
aminoácidos de la proteína que codifica. Entonces, la proteína puede sintetizarse o aislarse y
estudiarse sus propiedades para determinar su función. Sin embargo, este enfoque bioquímico
para la comprensión de la función génica insume tiempo y es costoso. Un objetivo fundamental
de la genómica funcional fue desarrollar métodos informáticos que permitan identificar la función
génica a partir de la secuencia de ADN sola, evitando el proceso laborioso de aislar y caracterizar
las proteínas individuales.
Después de obtener una secuencia genómica, la siguiente tarea es asignar funciones a los
genes de la secuencia. Algunos genes pueden tener funciones previamente asignadas mediante
los métodos clásicos de mutagénesis y de cartografía de ligamiento; pero muchos genes no
tienen una función bien dirigida asignada.
Una aproximación para asignar funciones a estos genes es la utilización de búsqueda de
homología. Este análisis tiene diversos componentes: búsqueda en bases de datos como GenBank
para encontrar genes parecidos aislados en otros organismos, comparar la secuencia de un ORF
con la de un gen bien caracterizado de otro organismo, rastrear el ORF en busca de motivos
funcionales, regiones del ADN que codifican dominios proteicos como canales de iones, regiones
de unión a ADN o señales de secreción/exportación.
39
Predecir redes “sociales” de genes estrechamente relacionadas con procesos biológicos
específicos.
Northern Blot
PCR cuantitativa
Hibridación substractiva
Differential display
Microarrays (Microarreglos de ADN)
SAGE
XX-seq: RNA-Seq, Chl-Seq, CVN-Seq.
Northern Blot
40
PCR cuantitativa o PCR en tiempo real
Al igual que la PCR convencional, se utiliza un molde de ADN, cebadores específicos, dNTP
y una ADN polimerasa; a esto se le adiciona una sustancia marcada con fluoróforo.
41
1 2
42
1. Se construye o compra un
microarray o chip, que contiene el
ADN de cadena simple que
representa miles de genes
diferentes.
Figura 38. SAGE. Luego de la obtención de los ditaq se realiza clonado, secuenciación y análisis
bioinformático.
44
Figura 39. Comparación de las secuencias de los Tag con bases de datos específicas como SAGE Genie
donde ya se encuentran mapeados los tags con sus respectivos genes y permite la identificación y
caracterización de los transcriptos
ARN-Seq
46
GENÓMICA COMPARATIVA
47
por organismos alejados sean esenciales para la vida. Comparando los conjuntos de genes
compartidos por organismos diferentes sería posible catalogar los compartidos y desarrollar una
lista de genes que se considerarían indispensables para la vida.
Los genes ortólogos son aquellos que descienden de un gen ancestral común que tienen la
misma función en diferentes especies. Así por ejemplo Mycoplasma genitalium comparte 240
genes ortólogos con Haemophilus influenzae además se identificaron 16 genes cuyas secuencias
son diferentes pero realizan la misma función. Mycoplasma genitalium tiene un genoma con 480
genes que codifican proteína, lo que representa el genoma bacteriano mas pequeño de entre los
casi 150 genomas secuenciados hasta la fecha.
Los genes que pertenecen a familias multigénicas comparten secuencias de ADN similares
pero no idénticas como resultado de una mutación en linaje con un único gen ancestral. Sus
productos a menudo son diferentes con funciones parecidas pero sus genes no siempre se
encuentran en una misma localización del cromosoma.
Las familias multigénicas permiten aportan conocimientos sobre la evolución del genoma.
Las proteínas que surgen a partir de la duplicación de un único gen se denominan parálogas. La
familia de la globina es un ejemplo de familia multigénica paráloga que surgió por duplicación y
dispersión a diferentes sitios cromosómicos.
Las familias multigénicas están presentes en muchos genomas. Además de las amplias y
grandes mutaciones de los genes pequeños bloques de genes pueden duplicarse mediante
diversos mecanismos. La filogenia molecular ha trazado el linaje y las relaciones entre los miembros
de las familias génicas. Uno de los ejemplos mejor estudiados de divergencia es la superfamilia
génica de las globinas. En esta familia hace 800 años se produjo la duplicación de un gen
ancestral que codificaba a una proteína de transporte de oxígeno. De los dos genes generados,
uno evolucionó hasta la mioglobina actual y el otro en el gen de la globina ancestral el que se
duplicó y formó los prototipos de las subfamilias génicas de la α y β globina. Otros patrones se
observan en otras familias génicas las que son intensamente estudiadas en el genoma humano.
Como se observa en la figura 42, en la región media del cromosoma 6 bovino (BTA6) se
han mapeado diferentes QTL asociados a rasgos fenotípicos como producción de leche,
conformación y rasgos funcionales en animales de tambo y composición corporal y crecimiento
en animales de cría. En BTA6, la proporción de los genes de la especie bovina que se han
asignado es relativamente pequeña y se distribuye de manera desigual. Estudios comparativos del
mapeo cromosómico de alta resolución combinados con la información de las secuencias
nucleotídicas pueden ser utilizado para detectar la posición y función, dentro de regiones del
cromosoma, de genes candidatos polimórficos que afectan variables fenotípicas de importancia
económica y fisiológica en bovinos. La alineación comparativa de las secuencias de los
cromosomas ortólogos humanos, de ratón, de gallina y de perro con la secuencia bovina permitió
enriquecer mapas previos del cromosoma BTA6 determinando loci nuevos. Utilizando el análisis de
RH, incluyeron un total de 63 nuevos genes y EST con precisión en relación con la posición de los
48
loci conocidos, por lo tanto, aumentaron la densidad de los genes y ESTs integrados en el mapa
de BTA6.
Figura 42. Mapeo comparativo entre cromosomas de pollo, bovino, humano, ratón y perro.
49
LA PROTEÓMICA
Esta rama se ocupa de Identificar y analizar las proteínas de una célula. El Proteoma define
el conjunto completo de proteínas codificadas por un genoma.
En la mayoría de los genomas secuenciados se desconoce la función de muchos de los
genes recién descubiertos. Muchas veces se le asigna una función por su homología con genes
conocidos. En E coli y S cerevisiae se desconoce la mayor parte de la función de los genes
codificados al igual que en humanos.
A medida que se dispone de más datos de las secuencias de los eucariotas se hace
evidente que su complejidad no esta necesariamente correlacionada con la cantidad de genes.
Por ejemplo Drosophila tiene menos genes que C. elegans pero no es menos complejo que el
nemátodo. La relación entre gen y producto génico es compleja. Los genes pueden tener sitios
múltiples de inicio de la transcripción que produce varios transcriptos distintos. El corte y empalme
alternativo y la edición de las moléculas generan docenas de proteínas diferentes a partir de un
único gen. En humanos se estima que el 40 – 60% producen más de una proteína por ese motivo.
El análisis de la función proteica se ve dificultado por el hecho de que muchas proteínas trabajan
vía interacciones proteína – proteína o como parte integrante de un gran complejo molecular.
La proteómica se utiliza para reconciliar las diferencias entre el número de genes de un
genoma y el número de proteínas (producto final) observadas en la célula. Proporciona
información sobre la función de las proteínas, su estructura, las modificaciones post-
traduccionales, las interacciones proteínicas sus variantes y las relaciones con otras proteínas del
genoma.
La proteómica utiliza técnicas para separar e identificar las proteínas aisladas. La
combinación de técnicas implica un gel de electroforesis bidimensional (2DGE) y espectrometría
de masas. En la primera las proteínas extraídas de una célula se cargan en un gel de
poliacrilamida y se separa según su carga eléctrica. El gel se rota 90º y las proteínas se separan
según su peso molecular. Las modernas técnicas de espectrometría de masas permiten
determinar con precisión la masa de moléculas. Uno de estos métodos se denomina ionización
por láser asistida por matriz (MALDI). Se pueden identificar cientos de proteínas por día y los
bancos de espectrómetros pueden procesar cientos de muestras en un solo día. Nuevos
instrumentos se están desarrollando para el procesado de muestras con más rapidez, sensibilidad
y precisión.
50