Está en la página 1de 29

1.0 ORGANIZACIÓN DEL GENOMA HUMANO Y DE OTROS ORGANISMOS MODELO.

PROYECTOS
GENÓMICOS

1.1 Dogma central, estructura DNA y RNA, cromatina y cromosomas:


El genoma nuclear tiene aproximadamente 3,200,000,000 nucleótidos de ADN, divididos en 24
moléculas lineales denominadas cromosomas. Hay 22 cromosomas autosómicos y 2 sexuales,
dando un total de 35,000 genes en genoma nuclear. En genoma mitocondrial, se tiene molécula de
ADN circular con 16,569 nucleótidos.

La mayoría de las células en el cuerpo son diploides, y tienen 46 cromosomas totales en humanos.
Se denominan, células somáticas Las células sexuales o gametos, son haploides y solamente tienen
23 de los 46 cromosomas totales. Para expresar la información biológica en el genoma, se requieren
reacciones coordinadas de enzimas y proteínas, denominada, expresión de genoma. El producto de
la expresión genómica es el transcriptoma, el cual es una colección de ARN derivados de genes
codificantes de proteínas. La transcripción es el proceso de convertir segmentos de ADN codificante
a ARN-mensajero. El 2do producto de la expresión genómica es el proteoma; el repertorio proteico
de la célula. Las proteínas del proteoma se obtienen mediante el proceso de traducción.

Desde 1903, W.S. Sutton había determinado patrones de herencia en genes paralelos a la división
cromosómica, dando lugar a la teoría cromosómica (los genes están dentro de cromosomas). El
teñido celular permitió ver que los cromosomas efectivamente están hechos de ADN y proteína en
proporciones relativamente iguales. Para 1930, Avery, MacLeod, y McCarty mostraron que el ADN
y no las proteínas era el componente activo del “principio transformador” con un experimento de
inoculación de S. pneumoniae en ratones con variantes neutralizadas y patogénicas. Hershey y
Chase usaron marcado radioactivo para mostrar el funcionamiento de los bacteriófagos a través de
la inserción de su ADN viral. Ambos experimentos no confirmaron absolutamente al ADN como el
“principio transformador” en comparación a las proteínas, pero eso vendría después con la
estructura de doble hélice de Watson y Crick en 1953.

Para poder dilucidar la estructura del ADN, Rosalind Franklin usó difracción en rayos X para poder
observar la estructura. No obstante, Watson y Crick hicieron uso del contenido de agua en las fibras
de ADN, las proporciones de bases determinadas por las reglas de Chargaff, y construcción de
modelos para obtener la estructura de doble hélice. Las principales características de esta
estructura involucran el pareado de bases específico entre A y T y C y G con 2 y 3 puentes de
hidrógeno (respectivamente), y las interacciones pi-pi hidrofóbicas que le dan una mayor estabilidad
a pares de bases adyacentes y a la estructura general de la doble hélice.

El ADN es un polímero linear no separado en el que las subunidades están hechas de cuatro
nucleótidos distintos que pueden venir en cualquier orden particular y en cualquier número de
unidades. Cada nucleótido tiene una 2-desoxiribosa (una pentosa), una base nitrogenada (citosina
y timina son pirimidinas con un anillo y adenina/guanina son purinas con anillo doble) que forma un
enlace beta-N-glicosídico con el azúcar, y un grupo fosfato. Si solo se tiene el azúcar y la base, se
tiene un nucleósido. Los nucleótidos individuales están unidos por enlaces fosfodiéster en sus
carbones 5’ y 3’, y la diferencia entre el extremo 5’ y 3’ (P-terminal y OH terminal) es lo que le da
especificidad en transcripción para ir en dirección 5’-3’.
La estructura de doble hélice se conoce como la forma B del ADN. La mayoría del ADN en células
tiene esta forma, pero hay otras formas que existen a causa de que cada nucleótido en la estructura
tiene la flexibilidad de adoptar otras configuraciones estructurales. Las características de esta y las
demás formas están en la siguiente tabla.

1.3 Funciones de las secuencias no codificantes:


La estructura del ARN es similar a la del ADN, pero con diferencias importantes. El azúcar es una
ribosa, y la timina es reemplazada con un uracilo (U). Las ARN polimerasas dependientes de ADN
son responsables de llevar a cabo el proceso de transcripción. La división más importante entre tipos
de ARN es el ARN codificante y no codificante. El primero compone al transcriptoma y está hecho
de una sola molécula, el ARN mensajero (ARN-m). El segundo tipo también se conoce como ARN
funcional, y da lugar a diversos tipos de ARN como el ARN ribosomal (ARN-r. Uno de los más
abundantes y componente esencial de los ribosomas), el ARN de transporte (ARN-t. Moléculas
involucradas en síntesis de proteínas al transportar aminoácidos al ribosoma), el ARN nuclear
pequeño (ARN-sn. Involucrado en splicing y esencial para convertir transcritos primarios a ARN-m),
ARN pequeño nucleolar (sno-ARN). Encontrados dentro del nucléolo. Tienen un papel en modificar
ARN-r a través de metilaciones u otros mecanismos, y micro ARN (mi-ARN. Regulan la expresión de
genes individuales.

El procesado de pre-ARN o ARN precursor incluye diversos procesos. Modificaciones en los extremos
5’ (tapones) y cadenas poli-A en extremos 3’. El splicing es la remoción de intrones para tener ARN
maduro compuesto solo de exones. El tercer proceso son modificaciones o edición de ARN a través
de la adición de otros grupos químicos (metilaciones o acilaciones).

El código genético es la conexión más clara que existe entre el proteoma y el transcriptoma de un
organismo, y específica como una o más secuencia de 3 nucleótidos en ARN-m se traduce a un
aminoácido específico. El código genético no es universal, y otras especies eucariontes o hasta las
mitocondrias pueden codificar para diferentes aminoácidos con un mismo codón.

1.4 Estructura y organización del genoma procarionte:

2. GENOMAS Y EVOLUCIÓN

1.2 Tipos de secuencias y organización del genoma humano:


1.4 Estructura y organización de otros genomas secuenciados:

2.1 Evolución de las secuencias codificantes. Familias génicas:

2.2 Genómica comparativa:

3.1 El contenido de RNA de la célula. RNA codificante y no codificante:

3.2 Tipos y funciones de RNA no codificante:

4. INTRODUCCIÓN A LA BIOINFORMÁTICA

4.1 Búsqueda en bases de datos biológicos (NCBI/entrez):

4.2 Análisis de secuencias de nucleótidos. Polimorfismos y mutaciones:

4.3 Análisis de proteínas. Secuencia de aminoácidos, estructura y función:

Resumen del artículo de Mark B. Gerstein et al de qué es un gen posterior al proyecto encode:
Abstracto: Aunque el secuenciado del genoma humano sorprendió con la cantidad de proteínas
codificante, no cambió perspectiva acerca de lo que es un gen. Los patrones complejos de
regulación y la transcripción penetrante descubiertos con el proyecto ENCODE, al lado de
conservación no génica y la gran abundancia de ARN no codificante; cambiaron el concepto de
gen. El artículo reseña las definiciones de Mendel y Morgan, hasta ORFs modernos,
resumiéndolos descubrimientos actuales de ENCODE y proveyendo una nueva definición para el
gen: Una unión de secuencias genómicas codificando un set coherente de productos
potencialmente sobrepuestos y funcionales.

El consorcio ENCODE completó su caracterización del 1% del genoma humano en 2007. Este
proyecto fue un logro mayor en la caracterización del genoma humano y cambió la perspectiva
proteica alrededor del gen.
Wilhelm Johannsen definió por primera vez el concepto del gen en 1909 basándose en la teoría
desarrollada por Mendel, quién demostró que algunos rasgos como altura o color de flor no se
entremezclaban en su descendencia, sino que pasaban como entidades distintas y discretas. En
1910, el genetista Hunt Morgan estudiaban mutaciones de segregación en D. melanogaster.
Pudieron explicar sus datos con un modelo en el que los genes se arreglaban linealmente y que su
capacidad de entremezclarse es proporcional a la distancia que los separa. En este entonces, el
gene era una entidad abstracta cuya existencia era reflejada en la forma en la que los fenotipos
eran transmitidos entre generaciones. Para los 40’s Beadle y Tatum descubrieron que las
mutaciones en genes podían dar lugar a defectos en pasos dentro de vías metabólicas, dando
lugar a la perspectiva de un gen-un polipéptido o un gen-una enzima. Para los 50’s se había
demostrado que la herencia tenía un componente físico y molecular porque los rayos X causaban
mutaciones. En 1955, Hershey y Chase establecieron que la sustancia transmitida por
bacteriófagos a las bacterias realmente era ADN y dio lugar a que el gen fuera visto como un
cistrón, una región de ADN definida por mutaciones que in trans no podrían complementar
genéticamente a otras. En los años 60’s, el haber obtenido la estructura tridimensional del ADN
desde 1953 permitió explicar como es que el ADN funciona como una molécula de herencia. El
pareado de bases explicaba como la información genética podía ser copiada, y la existencia de dos
hebras explicaba porque a veces había errores durante la replicación del ADN y como esto podía
dar lugar a mutaciones. Fue también en esa década que la biología molecular tuvo un rápido
desarrollo. Se sabía que algunos genes codifican no para proteínas pero si para ARN-r y ARN-t,
causando que el gen fuera visto como un código de ácidos nucleicos que da lugar a un producto
funcional. Durante la década de los 70’s y los 80’s, el gen fue considerado como un ORF. Se
desarrollaron técnicas de clonación y secuenciación, revolucionando el campo de la biología
molecular. Se creó el concepto del gen nominal, definido por su secuencia predicha en vez de ser
visto como un locus responsable de un fenotipo. La definición de los 90’s a los 2000’s es la que se
usa actualmente y fue definida por la organización de nomenclatura del genoma humano como un
segmento de ADN que contribuye a la función del fenotipo, pero en ausencia de una función
demostrada, un gen puede ser caracterizado por secuencia, transcripción, u homología.

La actual definición de un gen tiene diferentes problemáticas. Una de ellas es la regulación de


genes. Desde 1961 Jacob y Monod proveyeron un paradigma para el mecanismo de regulación del
gene. Consiste de una región de ADN compuesta de secuencias que codifican para una o más
proteínas, un promotor, una secuencia para unirse a la ARN polimerasa, y un operador.
Posteriormente se encontró que otras secuencias podían afectar prácticamente cada aspecto de la
regulación génica; desde la transcripción a la degradación de ARN-m y modificaciones post-
traduccionales. Estas secuencias podían estar muy unidas, o muy separadas, de la región
codificante. Esto implicaba que un solo gen podía codificar para varios elementos diferentes y por
ende no sigue la regla de tener solamente un gen para una proteína o enzima. Otro problema
considerable es la existencia de genes sobrepuestos y con splicing. Esto implica que ciertos genes
se sobreponen el uno sobre el otro, con la misma secuencia pero otro ORF. Por otra parte, el
splicing alternativo permitía que un locus genético codificara para múltiples transcritos de ARN-m
diferentes. La existencia de splicing en trans (ligado de dos moléculas separadas de ARN-m)
complica también la situación, porque puede haber transcritos del mismo gen, de hebras
opuestas, o de otro cromosoma que se unen a un transcrito particular antes de sufrir splicing. En
la tabla siguiente se muestran otros problemas para la definición del concepto de gen.
Posterior a los experimentos del proyecto ENCODE, se notaron diferentes descubrimientos, en los
cuales una vasta cantidad de ADN, es transcrita como ARN. Aunque la mayoría del genoma se
transcribe al nivel de transcritos primarios, solamente la mitad es procesado por splicing. Esto, en
conjunto con sitios de inicio de transcripción no anotados (TSS), la existencia de splicing
alternativo, ARN no codificante, pseudogenes y elementos constreñidos de ADN t

Resumen del artículo de Peter Portin y Adam Wilkins de la definición del término del gen:

Abstracto: El artículo da una historia de porque el término de gen requiere redefinirse. Se


designan períodos clásicos y neoclásicos, y el período moderno en la genética. Las 1eras dos
etapas se tratan de aumentar la claridad alrededor de la naturaleza del gen. Aunque inicialmente
el gen se considero como una unidad de herencia, después se consideró un punto adimensional en
un cromosoma, luego un segmento lineal de un cromosoma, y finalmente un segmento lineal del
ADN que codifica una cadena polipeptídica.

En 1866, Mendel hizo sus primeros experimentos de herencia, sin usar el término de genes. Este
término no se tuvo hasta 1909, con Johannsen. En el año de 1900 ya se conocía la existencia de los
cromosomas, pero en 1902, Boveri demostró la individualidad de cada cromosoma y su
continuidad a través de la mitosis. Estas dos propiedades dieron una buena explicación para las
leyes de segregación y de mezclado independiente. En 1916, Bridges mostró con D. melanogaster
que la falta de segregación en marcadores genéticos durante la formación de gametos siempre se
asocia a un comportamiento excepcional de un par cromosómico durante la meiosis. Después, se
encontró el fenómeno de pareado en arvejillas, indicando que los genes pareados están en el
mismo cromosoma y aquellos con mezclado independiente no. Después de ello se demostraría
con Morgan que genes separados en el cromosoma también pueden tener una clasificación o
mezclado independiente por la recombinación durante la meiosis, pero los genes cercanos entre
ellos tienen un cierto grado de herencia compartida. Se siguió trabajando en mapas genéticos de
grupos de genes pareados y luego mapas citológicos de los cromosomas. Morgan pudo explicar
citológicamente el entrecruzado genético con la teoría del quiasmatipo de Jannsens. La otra
hipótesis era la hipótesis clásica, que no requería el rompimiento y unión de cromosomas, pero
asumía que las variaciones eran resultado de las cromáticas mezclándose una encima de la otra.
Para 1930, el concepto de gen era visto como una unidad indivisible de herencia, localizada en
puntos específicos de un cromosoma y caracterizados por tener transmisión hereditaria,
recombinación genética, la capacidad de mutar, y una función. Lo que se desconocía todavía era
como los genes llevaban a cabo estos procesos. Muller en 1922 había publicado que los genes
eran moléculas con 3 capacidades esenciales, autocatálisis, heterocatálisis (producción de un
material o efecto no genético) y la habilidad de mutar). Durante el período clásico, el gen fue
tratado como un punto adimensional en un cromosoma.
Posteriormente, durante el período neoclásico; el gen adquiere una dimensión espacial no
ambigua, una longitud, y después una identidad lineal química en la forma de la molécula de ADN.
El período neoclásico comenzó en 1940 con dos líneas de investigación principales, una que usaba
mapeo recombinacional y otra que usaba la naturaleza molecular y estructural del gen. Ambas
líneas se unirían en 1950. A principios de los 40’s, se demosró que los genes podían ser disectados
en segmentos contiguos con recombinación genética. Los experimentos de Avery y sus colegas
dieron amplia evidencia de que el ADN era la molécula principal de la herencia en 1944, y Hershey
y Chase mostraron en 1952 que los bacteriófagos usaban el ADN para multiplicarse. Más relevante
aún sería la estructura del ADN en 1953-1954 que daría lugar a demostrar que los genes se
transcriben a ARN-m y luego a proteínas. Se había logrado establecer la naturaleza del gen y su
conexión con las proteínas. Benzer en 1961 destruyó la concepción clásica del gen como una
unidad fundamental de función, recombinación y mutación demostrando que el gen podía tener
varias mutaciones y recombinaciones. El período neoclásico de la genética culminó en el
averiguamiento del código genético y dio lugar a un nuevo concepto para el gen: un gen-un
ARNm-un polipéptido.

Existen desviaciones del concepto neoclásico del gen que eliminan su validez. Se encontró que un
gen podía dar lugar a más de un ARNm, y que un gen puede ser parte de varias unidades de
transcripción a través de promotores complejos, y/o splicing alternativo. Por ende, un solo gen
puede dar lugar a más de un transcrito. El splicing alternativo se estudió a finales de los 70’s,
notando la existencia de los intrones y su eliminación por splicing para solamente tener exones en
ARN maduro. En splicing constitutivo, todos los exones de un transcrito se incorporan a un ARN
maduro por ligado invariante de exones consecutivos, dando un único tipo de ARNm a partir de un
gen. En el splicing alternativo, los exones no consecutivos se unen por el procesamiento de
algunos, pero no todos, los transcritos de un gen. Adicionalmente, las secuencias de aminoácidos y
sus funciones son derivables del ADN de su gen correspondiente (edición de ARN). Esto implica
procesos moleculares post-transcripcionales en los que se altera la molécula de ARN y por ende se
tiene una secuencia de aminoácidos diferente a la predicha originalmente. También es importante
considerar el concepto de compartir genes, en los que diferentes células tienen polipéptidos
iguales derivados del mismo gen, pero con funciones diferentes.

Algunas inconsistencias más severas en el concepto del gen se pueden resumir en los siguientes
puntos. 1) En organismos eucariontes hay casi nula restricción a la transcripción, haciendo
imposible establecer relaciones generales simples entre transcritos primarios y sus productos. El
genoma está lleno de transcritos sobrepuestos que hacen imposible establecer una relación 1:1:1
para secuencias específicas de ADN, transcritos, y funciones. Esto se complica más si se considera
que los transcritos codificantes y no codificantes pueden derivarse de cualquiera de las 2 hebras
de ADN. 2) Los exones de diferentes genes pueden ser miembros de más de un transcrito. La
fusión de genes anula el concepto neoclásico del gen y tiene ocurrencia en 4-5% de pares de genes
en tándem en humanos. 3) En organelos de eucariontes microbiales, hay muchos genes
encriptados que están fragmentados en diferentes segmentos a lo largo del genoma. 4) Hay
evidencia de que el estatus funcional de un gen puede ser heredado de una generación a otra a
través de herencia transgeneracional epigenética. 5) La restauración genética puede ocurrir y dar
lugar a reescribir el ADN de un organismo a través de segmentos de ARN heredados de
generaciones pasados. 6) Hay muchos genes codificantes para ARN que producen ARN diverso que
no traduce a proteínas (ARN-r, ARN-t, miARN).

El estado actual del concepto del gen requiere entender que el gen no es autónomo, ni
independiente, pero si ejerce sus efectos dentro o afuera de sistemas complejos de interacción.
Son “engranajes” de una red regulatoria genética (GRN) y es difícil entender los fenotipos
mutantes que pueden resultar. Esto causa que el gen sea visto como una entidad
multidimensional. Los autores de este artículo dan la siguiente definición al concepto de gen: Un
gen es una secuencia de ADN (cuyos segmentos no necesariamente son contiguos) que específica
para uno o más ARN relacionados por secuencia/proteínas evocadas por GRNs y que participan
como elementos de las GRNs; con efectos indirectos, o como resultados de GRNs y dando lugar a
efectos fenotípicos más directos. Esta definición es sumamente molecular, pero su tamaño la hace
una solución meramente tentativa o temporal.

Resumen del primer capítulo del Griffiths introduction to genetic analysis, 10ª edición:

Los genes y el ADN que los compone tienen diferentes propiedades. La capacidad de replicarse, la
generación de formas usando el ADN como la información para dar lugar a ellas, y la posibilidad de
sufrir mutaciones. La generación de forma se lleva a cabo a través de la formación de proteínas.
Primeramente, se transcribe la secuencia de nucleótidos para obtener un ARN-m. Esta secuencia se
conoce como el “transcrito”. Posteriormente viene el proceso de producir una cadena de
aminoácidos basada en la secuencia de nucleótidos del ARN-m; denominada traducción. La
traducción hace uso de tres nucleótidos sucesivos, llamados codones. La síntesis proteica ocurre en
los ribosomas, donde los ARN de transporte (ARN-t) llevan aminoácidos individuales para formar
una cadena polipeptídica. El ADN es una molécula lineal de cuatro bloques constitutivos
denominados “nucleótidos”. Los cuatro nucleótidos son la Adenina, Timina, Guanina, y Citosina.
La estructura de un gen en eucariontes es más complicada que en procariontes, los cuales no tienen
núcleo celular dentro de ellos. En los genes de muchos eucariontes, la secuencia codificadora está
interrumpida por segmentos de ADN denominados intrones. Estas secuencias son eliminadas del
ARN-m maduro antes de salir del núcleo y dejan solamente las partes codificantes; denominadas
exones.

La selección natural es un proceso donde individuos con una característica particular tienen a
reproducirse mejor que otros en un entorno particular; dando lugar a una mayor abundancia de
individuos que comparten esa característica particular en su fenotipo. La similitud por ascendencia
de un ancestro común se conoce como “homología”. Un árbol evolutivo es un diagrama ramificado
que muestra la ascendencia de especies modernas y extintas a través de sus ancestros a lo largo del
tiempo. Esto puede llevarse a cabo con secuenciado de ADN.

Las variantes que puede haber en un especie o población pueden clasificarse en continuas o
discontinuas. Las variaciones discontinuas consisten de una característica encontrada en una
población que da lugar a dos o más fenotipos diferentes. Estas variaciones suelen ser producto de
diferencias alélicas. La constitución alélica de un organismo es su genotipo, el cual es el origen
hereditario del fenotipo. La existencia de dos o más variantes discontinuas da lugar a un
polimorfismo, pero no es hasta que se tienen variantes discontinuas excepcionales que se tiene una
mutante. Las variantes continuas tienen un rango constante de fenotipos en una población (tamaño,
peso, color de piel, etc.). Las variantes alélicas son el resultado de cambios en sitios activos de
polipéptidos, los cuales son grupos de aminoácidos cruciales. Los alelos que no dan lugar a proteínas
funcionales se conocen como “nulos”. Estos cambios alélicos a su vez pueden ocurrir por
sustituciones de par de nucleótidos, deleciones, y duplicaciones. Esto puede dar lugar a mutaciones
de marco de lectura, donde la pérdida o adición o pérdida de uno o más nucleótidos causa que la
transcripción de todo el segmento esté incorrecto.

Puede haber diversas metodologías para el estudio de genes y sus actividades. Una es el aislamiento
de mutaciones que afectan un proceso biológico, revelando un componente genético del proceso y
su conexión a una serie de proteínas relacionadas. Otra metodología es el análisis de la progenie
con cruzas controladas entre mutantes e individuos wild type para identificar genes, sus alelos, y
localizaciones cromosómicas, así como patrones hereditarios. Un tercer enfoque es un análisis
genético de los procesos bioquímicos celulares, y ver como estos procesos son afectados en un
individuo variante y en uno no variante para así deducir el papel de uno o más genes. Un cuarto
enfoque es el análisis microscópico para ver la estructura y movimiento cromosómico, así como
localizaciones específicas en los mismos. Una quinta metodología involucra análisis directo de ADN
a través de secuenciado, haciendo uso de clonado de ADN. Todas estas metodologías dan lugar a la
genómica, que es el estudio de la estructura, función, y evolución de genomas completos y está
subdividida en bioinformática; el análisis matemático del contenido informacional de los genomas.

La genética clásica trata a las células con fenotipo “normal” (wild-type) con un agente como rayos X
o ciertos compuestos químicos para dar lugar a mutaciones. Después se debe determinar si la
mutación afecta más de un gen particular, para descubrir uno o más genes que hayan sido
afectados. Luego se debe determinar la función del gen o genes que fueron afectados para terminar
con su mapeo en la secuencia genómica del organismo. La genética inversa empieza con un gen de
función desconocida obtenido de una secuencia genómica; y luego intenta averiguar cuál es su
función. Se sigue haciendo uso de mutaciones en el gen para poder determinar su función,
usualmente haciendo uso de mutagénesis dirigida. No obstante, el orden de pasos cambia porque
primero se obtiene el gene y su secuencia, luego se muta, y de allí se determina su función. Todo
este proceso es facilitado por el clonado de ADN, que implica tomar un fragmento de ADN y
replicarlo muchas veces hasta que haya muchas copias del mismo. Este proceso también se conoce
como amplificación. Se pueden usar sondas de genes, que son fragmentos de una cadena de ADN o
ARN para encontrar genes o secuencias particulares en una mezcla a través del apareamiento de
bases. Es necesario hacer uso de secuencias de ADN separadas a través de enzimas de restricción,
las cuales cortan el ADN blanco en localizaciones y tamaños específicos. Se puede usar Southern
blot para ADN y Northern blot para ARN, pero ambos involucran el movimiento de secuencias
nucleotídicas con velocidad inversamente proporcional a su tamaño a través de una membrana
porosa con una corriente eléctrica. También se puede hacer un western blot, usando anticuerpos o
ligandos específicos para separar una proteína en una mezcla y después transportarla en una
membrana por electroforesis.

Los modelos con animales usan organismos elegidos por su buen ajuste a un problema de
investigación, ser fáciles y baratos de conseguir/mantener, y por la posibilidad de aplicar lo
aprendido con ellos en otras especies.

Resumen de las notas a mano:

E
El hacer copias de ADN=Replicación. El pasar de ADN a ARN=Transcripción. El pasar de ARNm a
Péptidos=Traducción.

El ARN no codificante es cualquiera que no traduce a proteínas. El dogma central de la biología


molecular explica el flujo de información, pasando de ADN o ARNm a ARN-t y finalmente a
proteína. Hay ADN auto catalítico para poder mejorar el proceso de traducción. El Dogma de la BM
fue enunciado en 1958, con la complicación de los priones, que salen a partir de cambios
conformacionales en proteínas prion normales y NO por sintetizar proteínas nuevas. El ARN no
codificante da lugar a ARN-t o ARN-r.

Los priones son diferentes porque NO siguen el dogma de la BM. Tiene proteínas (proteínas prion
mutantes) que permiten cambiar la conformación de proteínas nativas.

El grupo de Celera Genomics, liderado por Craig Venter y el grupo de PGH liderado por Francis
Collins compararon las secuencias del genoma humano que fueron desarrollando individualmente.

SNP=Single Nucleotide Polymorphism. Puede reemplazar nucleótidos específicos o dar lugar a


cambios estructurales más grandes.

CNV=Copy Number Variants.

La estructura del ADN debe leerse de dirección 5’ a 3’. La hélice estabilizadora es antiparalela a la
hélice codificadora. La secuencia de ARNm es complementaria a la codificadora y la secuencia de
la hélice estabilizante es la misma que la del ARN, pero reemplazando los U con T.
En eucariontes, se eliminan los intrones a través del splicing, creando ARN maduro compuesto
únicamente de exones. ARN y ARN están hechos de cadenas de polinucleótidos unidos por enlaces
fosfodiéster. Cada nucleótido tiene una base nitrogenada, un azúcar, y un grupo fosfato. Por ende,
un nucleótido es la unión de un nucleósido y un fosfato (el fosfato da carácter ácido). El
nucleósido, a su vez, está compuesto de un azúcar (neutro) y una base nitrogenada (básica). Las
bases nitrogenadas son moléculas heterocíclicas de un solo anillo (pirimidinas: Citosina y Timina) o
de dos anillos (Purínicas: Adenina y Guanina). Entre A y T se forman 2 puentes de H y entre C y G
se forman 3 puentes de H. Cada 3.4 nm, se da un giro y el ADN tiene 2 nm de ancho. Aquellas
secuencias con muchas repeticiones pueden formar estructuras secundarias como tallo-asa en el
ADN. En el ARN se pueden formar horquillas o bucles. Generalmente hablando, se pueden tener
estructuras de doble hélice intercaladas por uniones entre A y U. El ARN-t también tiene
estructuras secundarias (brazos). En ARN ribosomal también hay estructuras secundarias por
emparejamiento de bases.

Los virus únicamente tienen ADN o ARN. Tienen funciones diversas al transmitir y expresar info
genética que depende de su localización de orden celular y su estructura de orden superior. Los
virus solo tienen ácidos nucleicos en la cápside.

Reglas de Chargaff permiten ver % de composición de bases nitrogenadas en diferentes


organismos. Se notó que la proporción entre A y T era ≅ 1, al igual que la proporción entre C y G.
Hay ciertas preferencias por ciertos codones entre diferentes especies, lo que da lugar a
proporciones diferentes de 1 en otras especies.

La definición de gen se ha ido modificando a lo largo del tiempo. Anteriormente, estos conceptos
eran considerados adecuados para describir un gen: Gen=Enzima, cada gen codifica para una
proteína o cadena polipeptídica. Unidad funcional de herencia. Un gen ocupa un único locus en un
cromosoma. Es secuencia de ADN capaz de hacer una secuencia de ARN funcional. Secuencia del
genoma que puede dar lugar a uno o más productos funcionales, los cuales pueden ser
polipeptídicos o de ARN no codificante. Puede haber genes traslapados, genes dentro de genes,
señales alternativas de poliadenilación de diferentes tamaños con extremos 3’ diferentes con los
cuales se tienen propiedades diferentes. Hay uso de exones alternativos. El 20% de pseudo genes
se transcriben. 70% de ADN humano se transcriben en ambas cadenas. ARN mo o micro ARN. La
proporción de ADN codificante es de 1.1% (Codificante=Dar lugar a proteína).

La definición moderna de gen es la siguiente: Unión de secuencias genómicas que codifican


conjunto coherente de productos funcionales sobrelapados.

En 1920, Hans Winkler propone el genoma como un conjunto de cromosomas haploides que
sirven como base para el material genético de la especie. Es el contenido genético total de un
organismo, tiene la info genética para constituir y mantener al organismo. Incluye a genes y a
genes no codificantes. En eucariontes, eso se denomina genoma nuclear.

Genómica=Contenido, organización, función y evolución del genoma.

Genoma humano compuesto de 3000 millones de pb (3.3 × 109 𝑝𝑏~20,500 𝑔𝑒𝑛𝑒𝑠). 1-2% del
genoma codifica para proteínas. El resto codifica para ARN no codificante, secuencias regulatorias,
intrones, y secuencias no codificantes. Los genes se distribuyen irregularmente en cromosomas
humanos. El genoma nuclear tiene 23 pares de cromosomas. Hay 22 cromosomas autosómicos y
un único par sexual. La porción más grande del genoma nuclear son repeticiones basadas en
transposones. El tamaño del completo del genoma nuclear humano es de 6 gigabases. El genoma

El genoma mitocondrial está compuesto de 16,569 pb y tiene 37 genes (ARN-t y ARN-r). Se hereda
de la madre y tiene miles de copias.

Cariogramas=Esquema de patrones de bandas alternativas en cromosomas mitóticos. Se numeran


los segmentos y las bandas haciendo uso de nomenclatura estándar. En el genoma humano, el
cromosoma 21 es el más pequeño de todos.

Exoma=Parte del genoma formada por exones. Los exones son las partes del ADN que conforman
al ARN maduro y que permiten traducirse a proteínas. El genoma humano tiene 180,000 exones
que representan solamente 1-2% del genoma humano completo, y están dentro de 20,000-25,000
genes totales. En las regiones codificantes es donde ocurren 90% de las mutaciones que dan lugar
a enfermedades.

Genoma mitocondrial humano: Compuesto de 16,569 pb, 37 genes, 22 ARN-t, 2 ARN-r, y 13


proteínas. En comparación, el genoma de E. coli está compuesto de 4,639, 221 pb, 4377 genes
(4290 dan lugar a proteínas) y el resto son ARN.

Genoma procarionte: 0.5-10 𝜇𝑚 de largo. La mayoría están organizados en forma de un


cromosoma circular. Rhodobacter, sphiroides, V. cholerae, son ejemplos de géneros procariontes
que tienen 2 cromosomas circulares. S. griseus tiene solamente un cromosoma, pero es lineal.
Pueden tener ADN extra en forma de plásmidos (Circulares o lineales). La mayor parte del ADN es
codificante y sin ADN repetido. Genes se encuentran en operones (ARN policistrónico). Ser
policistrónico implica que cada unidad de transcripción tiene varios reguladores. Un
operón=Unidad reguladora formada por genes estructurales adyacentes que se transcriben como
ARN m policistrónico para poder dar lugar a estructuras proteicas diferentes. Los operones
solamente tienen un control por operón. El ADN no codificante se organiza en elementos de
inversión, y transposones. El genoma procarionte no tiene intrones, está súper enrollado con
proteína HU (la más abundante para empaquetado de ADN).

Los eucariotes tienen más superenrollado su ADN. Los ARN m son monocistrónicos, por ende,
tienen áreas de regulación o espaciadoras de mayor tamaño. Los genes pueden estar en forma de
clústeres, pero tienen control individual.

El estado de metafase es el que tiene una mayor compactación del ADN.

Cromosoma=Estructura de proteínas y ADN organizada. Tiene un brazo largo y un brazo corto. Los
extremos de los cromosomas se definen como telómeros. El brazo corto es “p” y el brazo largo es
“q”. Los cromosomas 13, 14, y 15 son acrocéntricos, pero no hay cromosomas telocéntricos en el
genoma humano y estos no tienen brazos cortos.

Los patrones de bandeo cromosómico reflejan niveles de compartimentalización del ADN. Las
bandas C producen regiones oscuras (heterocromatina) que están altamente compactadas y con
ADN altamente repetitivo. Se localizan en los centrómeros, en los telómeros, y en el cromosoma Y.
Las Bandas b tienen patrón alterado de comparación de regiones de unión al andamio (SAR). En
resumen, las bandas claras tienen algo de condensación, son ricas en AT y tienen un alto
contenido de genes y se replican en una etapa temprana. Las bandas oscuras tienen un alto grado
de condensación, son ricas en GC y tienen pocos genes y su replicación es mucho más tardía en
comparación. El hecho de que el ADN esté altamente condensado evita que entre la maquinaria
de transcripción y por eso es que hay una menor cantidad de genes.

NOR=Región organizadora de nucléolo. También se conocen como los “satélites” en el


cromosoma. Es una constricción secundaria para los cromosomas que solamente está presente en
los cromosomas 13,14,15, 21, y 22.

En el nucléolo están genes para ADN ribosomal. Aparece y desaparece a lo largo del ciclo celular
porque no siempre se requieren proteínas ribosomales. Nucléolo= Estructura más grande en el
núcleo de células eucariontes que da lugar a ribosomas, partículas de reconocimiento de señales y
dar lugar a las ARN polimerasas pol I y III transcribiendo ARN-r.

A lo largo de los cromosomas puede haber ADN repetitivo disperso (moderadamente repetitivo y
disperso en todo el genoma y entre mezclados con el ADN de copia única).

Cromatina=Complejo de ADN-proteínas que conforma a los cromosomas eucariontes. Está


compuesto 1/3 de ADN, 1/3 de histonas, y 1/3 de moléculas que no son histonas. Las histonas son
H1, H2A, H2B, H3, y H4. Las moléculas que no son histonas son cientos a miles diferentes, 200-
200,000 moléculas diferentes en el genoma diploide. La cromatina empaqueta al ADN en un
volumen menor para que pueda caber en el núcleo celular. También permite condensar
cromosomas durante el proceso de meiosis y mitosis y sirve como un mecanismo de regulación
génica. El nucleosoma da lugar a fibras de ADN alrededor de las histonas y estas a su vez dan lugar
a la fibra de solenoide. La fibra de solenoide con cadenas de nucleosomas mide 30 nm, la cual
permite formar bucles, luego asas, y luego el cromosoma durante la metafase.

Las células sexuales son de naturaleza haploide. Tanto las somáticas como las sexuales llevan a
cabo un proceso de mitosis, pero las sexuales son las únicas que tienen meiosis. En la meiosis se
lleva a cabo la recombinación y entrecruzado de los cromosomas.

En el ciclo celular, tenemos diferentes estados; el estado de descanso (G0), la interfase, y la


división celular (M). En el estado de descanso, o fase G0 no ocurre división celular y el ciclo celular
ya terminó. Una vez iniciado el ciclo, la interfase incluye G1 (Fase de pre-síntesis de ADN donde la
célula aumenta de tamaño, tiene más organelos y puede decidir seguir el ciclo o regresar a G0
para diferenciación), la fase S (síntesis de ADN y replicación del ADN que no cambia la ploidía de la
célula), y G2 (mayor síntesis de proteínas y crecimiento celular para preparar la mitosis). En el
estado de división celular (fase M o mitótica) se tienen diferentes fases secundarias: La profase, la
metafase, la anafase y la telofase. En la profase, la condensación de la cromatina se termina y da
lugar a los cromosomas, desaparece el nucléolo, se separan los centrosomas, y se forma el huso
mitótico. En la metafase, los cromosomas se alinean en medio de la célula. En anafase, los
cromosomas replicados son separados en dos y las cromátidas nuevas se mueven a polos
opuestos de la célula. Es también en anafase donde los cromosomas tienen el máximo grado de
condensación para permitir segregarse y formar el nuevo núcleo. Finalmente, en la telofase, se
vuelve a formar la membrana celular, los núcleos se forman en las dos células divididas, y los
cromosomas se desdoblan para volver a formar cromatina.
Cambios en cromatina: Puede haber metilación en residuos de citosinas localizados en islas CpG
del ADN. CpG=5’-CG-3’. La metilación de estas regiones ocurre en los promotores y por ende es
capaz de inhibir la expresión génica. Puede haber también cambios en la proporción de proteínas
no histonas al ADN. También puede haber una remodelación de la cromatina mediada por el ARN
inactivado (Inactivación del cromosoma X). Puede haber modificación química de las histonas a
través de adición de grupos acetilo en H3, y H4 en residuos de lisinas.

A las bandas centroméricas se les puede resaltar la heterocromatina constitutiva. Están altamente
compactadas, tienen ADN altamente repetitivo, y se encuentran en telómeros y centrómeros.

Eucromatina: Des-condensada en interfase, está en brazos distales, se replica en fase S temprana,


tiene una copia única de las secuencias, alta densidad génica, capacidad de silenciar genes
individuales, se metila en islas CpG hipometiladas, se puede acetilar en muchas histonas y tiene
espaciamiento irregular de nucleosomas.

Heterocromatina: Consensada en interfase, localizada en regiones periféricas y centroméricas, se


replica en fase S tardía, tiene secuencias repetidas, tiene baja densidad génica, se silencian
múltiples genes, tiene espaciamiento irregular de histonas.

En los genomas están codificados ARN, y proteínas. Los genes no codificantes pueden dar lugar a a
ARN-t, ARN-r, etc.

En los procariontes hay una menor distancia entre regiones codificantes y más regiones
espaciadoras. En genes procariontes NO hay intrones.

Nucléolos aumentan al tener una alta demanda de síntesis proteica. El nucléolo biosintetiza
ribosomas para hacer ARN-r.

En ribosomas hay 4 tipos de ARN, un ARN de 18S en subunidad menor y ARN 28S, 5, 8S, y 5S. La
mayoría del ARN en nucléolo son 45S en parte fibrilar y 32S en parte granular Esto implica que el
ARN-R viene de un precursor. Para procesar ARN-r participan ARN nucleolar pequeño. Lo más
importante de esta sección es recordar los componentes y su localización cromosomal.

El proyecto ENCODE identificó 2608 transcritos de 487 locis totales. Encontraron que >50% tienen
2 o más promotores alternativos. Descubrieron los genes con primeros exones alternativos y cada
uno con su propio promotor.

Splicing alternativo da lugar a varias isoformas de una proteína a partir de un mismo transcrito.

Edición de ARN: A veces el ADN no corresponde a la secuencia del transcrito. Estos cambios
implican, inserciones, deleciones, o modificaciones del transcrito primario.

En el proyecto del genoma humano (HGP) se estimaron inicialmente que había de 100 a 20,500
genes. No obstante, es importante recordar que la complejidad de un organismo NO tiene que ver
con el tamaño del genoma. El genoma humano consigue tener una más amplia variedad proteica
gracias al splicing alternativo, extensas modificaciones post-traduccionales, mayor complejidad en
los genes. Los genes humanos tienen mayor # de dominios en comparación a los invertebrados. El
gen de distrofina es el más grande dentro del genoma humano.
Un sitio donador de splicing tiene GU y un sitio receptor de splicing tiene AG. Diferentes tipos de
células tienen diferentes tipos de splicing alternativo.

A veces, dentro de un marco abierto de lectura (ORF=Open Reading Frame) hay otros genes con
sus propios ORF. Por ejemplo, en intrón 26 de gen NFI hay 3 genes internos con 2 exones cada uno
de ellos. La cadena sentido es la cadena 5’ a 3’, tiene la misma secuencia y la misma polaridad que
el ARN-m. La cadena anti sentido o cadena molde va de sentido 3’ a 5’. ARN-m va de 5’-UTR
extremo 5’ hasta antes de ATG (O en su defecto AUG en ARN-m) en cadena sentido. 3’-UTR
extremo 3’ va después de codón de paro (UAA, UGA, o UAG).

ORF=Marco potencial de un producto proteico de ADN. Son potenciales porque por cada hebra de
ADN hay 3 ORF porque puede haber 3 inicios diferentes por cada codón individual. Por ende, ADN
de cadena sencilla tiene 3 ORF y el de doble cadena tiene 6 ORF. NO importa el tamaño del gen
particular con el que se esté trabajando.

Intrones comienzan con GT y los exones comienzan con AG.

Cuando se empieza a transcribir el ADN, las letras se vuelven mayúsculas (esta es la posición +1).
Los promotores pueden estar en posición -25 (es decir, 25 bases atrás de la 1era letra mayúscula).
La gran mayoría de los genes empiezan con el AA de Metionina. Se deben contar los codones a
partir de donde se empieza a transcribir (las primeras letras mayúsculas).

Edición de ARN: Apo-B hepática transporta colesterol en sangre. En el hígado, el ARN-m no


editado da una proteína de 100 kDa. La edición ocurre en el codón #2153, y las modificaciones
post-traduccionales ocurren en forma de desaminaciones. Un mecanismo para generar varios
productos funcionales es la edición de ARN, los promotores alternativos, el splicing alternativo, las
modificaciones post-traduccionales, la presencia de ORFs en ambas hebras, entre otros.

En genes procariontes hay una región regulatoria para iniciar transcripción, región codificante, y
señales de terminación de transcripción. NO tienen intrones.

Los genes mitocondriales representan el 0.3% del ADN total en la célula. Tiene 16,569 pb. La
replicación del genoma mitocondrial ocurre independientemente del genoma nuclear. Genoma
mitocondrial humano codifica para 37 genes diferentes, 21 ARN-t, 13 polipéptidos y 2 ARN-r.
Cadena pesada del genoma es rica en G, y la ligera es rica en C. Tiene una muy alta tasa de
mutación. Se hereda en forma materna y generalmente existen muchas mitocondrias por célula. El
tamaño y contenido varía ente organismos, así como el contenido de genes. N-formil metionina da
inicio a la traducción. La mitocondria se origina conceptualmente de la teoría de endosimbiosis
hecha por Lynn Margulis en los 70’s. Genes en la mitocondria NO tienen intrones.

Densidad génica es medida con el # de gene/millón de pares de base (Mb=Mega bases). Densidad
del genoma humano≅ 12 − 15 𝑔𝑒𝑛𝑒𝑠/𝑀𝑏. La distribución de los genes NO es uniforme a nivel
del genoma humano. El cromosoma 19 es el que tiene la mayor densidad génica. La densidad
génica es mayor en regiones subteloméricas. El gen de la titina es secuencia codificante más larga
del gen, con un total de 80,778 pb y el mayor # de exones (178).
El tamaño de intrones variable, la presencia de genes sin intrones (p.ej. los genes mitocondriales,
neurotransmisores) y la existencia de gene que se traslapan parcialmente; dan lugar a una mayor
variabilidad en proteínas.

Organización del genoma humano: Se pueden clasificar las secuencias del genoma humano es
genes codificantes de proteínas, genes para ARN no codificante, y genes procesados.

Genes codificantes de cadenas polipeptídicas: Mayoría se encuentran en secuencias de copia


única, agrupadas en clústeres o dispersos a lo largo del genoma. Forman familias multigénicas de
dos tipos: Clásicas con alta homología en secuencias y funciones y tienden a estar agrupadas en
genoma (alfa y beta-globina). El otro tipo son súper familias génicas que tienen limitada homología
en secuencia, pero están relacionadas funcionalmente (tienden a estar dispersas en el genoma).

Para poder cuantificar el grado de similitud entre dos secuencias, hay que alinearlas y ver cuántas
sustituciones se pueden encontrar. Una sustitución es un cambio de residuo por otro. Si falta base,
decimos que hay gaps (pueden ser causados por deleciones o inserciones) y se puede calcular el %
de homología entre las secuencias.

Familias multigénicas: Si 2 genes producen proteínas similares, se originaron por un evento de


duplicación y tienden a estar agrupados en clústeres en una localización subcromosómica
específica. Si producen proteínas con secuencias más distintas, el evento de duplicación es mucho
más distante. La familia de genes Hox está altamente conservada.

Súper familia génica: Grupo de genes relacionados en estructura y función con débil homología en
secuencias y sin motivos de AA conservados. Un ejemplo es la súper familia de IgG que forman
dímeros consistentes de dominios extracelulares. Las súper familias de genes con segmentos
altamente conservados se denominan factores de transcripción (esta oración probablemente está
mal).

Relación exones-dominios proteicos: Dominios son bloques de construcción de proteínas


globulares y son uno de los niveles más útiles para entender la función proteica. El dominio es un
componente estructura funcional y evolutivo y tiene un papel importante en la evolución a causa
de sus arreglos específicos.

Genes para ARN no codificante: Los ARN nucleolares pequeños (sno ARN) sirven para procesar el
ARN-r.

Pseudogenes y genes procesados: Los pseudogenes son generalmente raros en el genoma porque
son muy compactos y son menos de 19,000. Han acumulado diversas mutaciones y no son
funcionales. NO tienen ORF. Los pseudogenes no procesados (30%) son copias de genes originados
por duplicación, que no se transcriben por carecer de promotor y por tener mutaciones sin
sentido. Los pseudogenes procesados son copias de ARN-m retro transcritos a cADN o insertados
en el genoma. NO tienen intrones ni promotores. Los pseudogenes solitarios son ortólogos de
genes funcionales en simios.

ADN no codificante altamente repetitivo: Puede venir repetido en tándem (dependiendo del
tamaño puede ser macro satélite o ADN satélite), VNTR (mini satélite), y microsatélite (STR). Puede
ser repetido disperso en forma de retro transposones como LINE, SINE, y elementos de LTR.
ADN satélite: Debido a alta repetición, tienen composición diferente de la del resto gel genoma.
Cuando ADN genómico se fragmenta y analiza en bandas de CsCl.

Se debe ver la cinética de renaturalización o re asociación (Curvas Cot) que ponen de manifiesto la
existencia de diversos tipos de secuencias. La complejidad del genoma es analizable por cinética
de reasociación de ADN.

Secuencias repetidas dispersas forman 45% del genoma humano. Las familias Alu es 12% del
genoma nuclear y se encuentran en zonas ricas en G-C.

Macro satélites (ADN satélite): Largos trechos de ADN repetidos en tándem. Consiste en
secuencias cortas de 50-1000 pb repetidas miles o millones de veces y que son muy ricas en AT.
Transcritos de ADN satélite se procesan en ARNsi que participan en procesos epigenéticos de
remodelamiento de cromatina. Se suele localiza en centrómeros, sobre todo en áreas
pericentroméricas y subteloméricas de heterocromatina constitutiva. Predomina el alfa satélite (3-
5% de cada cromosoma) que tiene secuencias de 171 pb que se unen al cinetocoro.

ADN satélite: Largos trechos de ADN altamente repetitivo que se localizan en centrómeros y son
detectables por FISH (Hibridación fluorescente inmunológica de cromosomas).

Mini satélites: 6-25 nucleótidos en tándem que hacen secuencias de 100-20,000 pb. El genoma
humano tiene 30,000 mini satélites. Se relacionan con procesos de expresión génica, control de
transcripción, splicing alternativo, o impronta. Se asocia a puntos de fragilidad cromosómica,
translocación y recombinación meiótica. Mini satélites teloméricos se encuentran en cromosomas.
Mini satélites hipervariables son altamente mutables (10%) y homólogos. Tienden a ser
polimórficos (VNTRs=Marcadores de ADN). 90% de mini satélite están en telómeros de
cromosomas. TTAGGG se repite hasta 10-15 Kpb en tándem, generando regiones de 5-20 kb que
conforman a los telómeros. Hay gran variabilidad entre individuos multialélicos. Establecen huella
genética de individuos a través de southern blot.

ADN telomérico tiene 100-1500 copias de repeticiones en tándem cortas. Está mantenido por la
telomerasa (un tipo de polimerasa). La actividad de la telomerasa ayuda a evitar el acortamiento
de telómeros.

VNTR se pueden usar para identificar individuos con alelos específicos.

Microsatélites son regiones eucromáticas de genoma de vertebrados, hongos, y plantas. Son


secuencias cortas en tándem (STR) y la unidad repetida es de 1-5 pb (generando secuencias de 100
pb). En genoma, existen al menos 30,000 loci de microsatélites.

Dinucleótido CA/TG es el más común (0.5% del genoma). Son altamente poliméricos. La expansión
de trinucleótidos son responsables de la enfermedad de Huntington, distrofia muscular miotónica,
ataxia de Friedrich, y SxX frágil. Pueden ubicarse dentro de genes o fuera de ellos.

En microsatélites se tienen 20 dinucleótidos CA para un total de 40 pb.

Repetidos dispersos: Son elementos transponibles o elementos móviles dentro del genoma. Son
secuencias que se introducen en nuevos sitios a través de transcripción. Existen transposones que
tienen ADN como intermediarios y retro transposones que son intermediarios de ARN. Algunos
tienen enzimas que median la propia transposición (autónoma).

Elementos transponibles (TE): 45% de ADN humano deriva de TE. Los TE autónomos tienen
maquinaria necesaria para transposición. Los TE no autónomos usan maquinaria de los TE
autónomos. Son el origen de 47 genes, constituyen registro paleontológico de eventos como la
mutación y selección. Han reformulado el genoma al facilitar re-arreglos en cromosomas.

De acuerdo a mecanismo de transposición pueden ser clase I (retrotransposones) intermediarios


de ARN (SINES, LINES). Retrotransposones LTR son para retrovirus. Retrotransposones clase II son
para ADN. Retro transposones sin LTR usan intermediarios de LTR (LINES como L1, L2, y L3).
Tienen 90,000 copias y representan 21% del genoma humano y se transcriben por promotor ARN
pol II, codificando para transcriptasa inversa y endonucleasa (ARN H) y poseen 1 a 201 autosomas.

SINES tienen 100,000 copias y no son autónomos.

La inserción del LI dentro de genes puede causar enfermedades en humanos, pero esto es inusual.

La mayoría de transposones son silenciados por mutaciones a epigenética (metilación,


remodelación de cromatina y micro ARN). Califican ARN para regular expresión génica y afectan el
ARN-t para regular expresión génica.

Variabilidad génica: diferencia individual en 0.1-0.01% y son el resultado de varios millones de


SNP. Hay 99.9% de similitud en secuencia de ADN entre 2 individuos El resto constituye la
variación genética y resulta en una variación fenotípica, personalidad, o enfermedades. La primer
y principal fuente de variación genética son las mutaciones y el hecho de que produzca ventajas,
desventajas o no tenga efecto alguno depende del ambiente. La 2da fuente de variación es la
recombinación y es aquí donde entra en efecto la variación natural.

Mutación genética es alteración permanente en secuencia de ADN que compone al gen y que es
permanente. Un polimorfismo es una variante con frecuencia mayor a 1%. No obstante, se
cambiaron los significados y ahora ambos se conocen como variantes, que pueden ser
patogénicas, probablemente patogénicas, de significado incierto, probablemente benigno, o
benigno. Los polimorfismos de 1% se usa en el análisis de genética de poblaciones.

Alteración en secuencia de nucleótidos de ADN puede ser inducido por factores ambientales (luz
UV o radiaciones ionizantes) o errores en replicación de ADN. Puede haber cambios a pequeña
escala (<10 Kpb) que pueden ser sustituciones, indels, duplicaciones, micro inversiones, o por
expansión de microsatélites. Puede haber SNP en región diferente que no altera la secuencia
(alterando el splicing). O puede haber una SNP en región distante que altera la secuencia. Es
necesario estudiar múltiples SNV dentro de un segmento de ADN para entender la asociación de
un SNV a un efecto de un fármaco. Cada combinación de SNV se llama Haplotipo, el cual es un tipo
de perfil de SNV.

Las variantes estructuras son variantes en número de copias (CNV), grandes segmentos de ADN de
miles a millones de pb. Algunos CNV son causantes de enfermedades como Parkinson o Charcot
Marie Tooth. La variación estructural es visible al microscopio e incluye hetero polimorfismo y re-
arreglos cromosomales balanceados que pueden tener tamaños mayores a 3 Mb. Variantes
microscópicas pueden ser re-arreglos cromosómicos, heteromorfismos.

INDEL: Tienen tamaño de 1-10,000 nt que están eliminados o insertados en la secuencia de tipo
silvestre.

Genómica comparativa: Estudio de la complementación de los genomas de diferentes especies


para identificar regiones similares o diferentes.

Variación genética: Tiene un importante factor evolutivo. En la reproducción sexual se recombinan


genes de ambos progenitores para dar lugar a una progenie diferente.

Homología entre especies: Ortólogos (genes homólogos con función identificada en diferentes
especies). Estos mismos están derivados a partir de un ancestro común. Los parálogos tienen
diferentes funciones en el mismo organismo y son copias duplicadas dentro de un genoma que
pueden ser predichas por diferencias en tinción.

La mayoría de los transposones son silenciados por mutaciones o epigenética (metilación,


remodelación de cromatina y miARN).

Segundo parcial:

Variabilidad genética: Diferencia individual en 0.1-0.01%. Son el resultado de varios millones de


SNP. Hay 99.9% de similitud en secuencias de ADN entre dos individuos. El resto constituye
variación genética y resulta en variación fenotípica, personalidad, y enfermedades. La primer
fuente de variación genética es la mutación y si produce una ventaja/desventaja, o nada; depende
del ambiente. La 2da fuente de variación es la recombinación y es sobre la recombinación que
actúa sobre la variación natural.

Mutación genética: Alteración permanente en secuencia de ADN que compone a un gen


particular. Un polimorfismo es una variante con frecuencia mayor al 1%. No obstante, se
cambiaron los conceptos y ahora ambos términos se conocen como variantes que pueden ser
patogénicas, probablemente patogénicas, de significado incierto, probablemente benignas o
benignas. Polimorfismos de 1% se usan en el estudio de genética de poblaciones.

La alteración en la secuencia de nucleótidos en el ADN puede ser inducida por factores


ambientales (luz UV, radicales libres, partículas ionizantes) o errores en replicación de ADN. Puede
haber cambios a pequeña escala (<10Kpb) que pueden venir en la forma de sustituciones, indels,
duplicaciones, microinversiones, o expansión de microsatélites.

No existe correlación entre el gen codificante y la complejidad de un organismo particular.

Exaptación: Estructura de un organismo que evoluciona y que da lugar a una adaptación a


determinadas condiciones.

Co-optación: Sumar integrantes a módulos específicos.

Respuestas seleccionadas de la 2da serie del curso:

3 elementos que actúan en cis en la estructura de un UTR: Los promotores, aumentadores, e


inhibidores.
¿Qué otros nombres se le pueden dar a ARN no codificante?: ARN, ARNsn (de cadena sencilla),
ARN-r (ribosomal), ARNnc (no codificante). EL ARN Xist participa en la inactivación transcripcional
de un cromosoma X y tiene un tamaño de 17kb y es poco conservado a nivel evolutivo. El
Cromosoma X inactiva su forma en heterocromatina facultativa y permite evitar cambios
fenotípicos.

En ExaC ya participaron más países, y hubo todo un estudio de filogenia para encontrar puntos
calientes de recombinación de ADN.

En el pasado, se tuvieron 6 puntos crack de definición clásica de un gen: 1) Es casi imposible


establecer relaciones simples entre el transcrito y los productos finales de la transcripción.
2)Exones de genes diferentes pueden ser miembros de más de un transcrito. 3) Hay genomas
encriptados que están en piezas y muy separados entre sí. Puede haber fusión de genes en cáncer,
pero la definición clásica de un gen no considera este hecho. 4)Existe evidencia que el estado
funcional de algunos genes se puede heredar de una generación a la siguiente (herencia
epigenética transgeneracional (epimutación)). 5)Restauración genética permite “reparar” alelos
por conversión génica.6) Además de genes codificantes de proteínas, hay muchos genes para
ARNnc.

El ATG es el codón de inicio y de paro. En el intrón debe haber un receptor con GT y un aceptor
con AG.

Los exones pueden tener UTR y promotores. Recordar que siempre se empieza con codón de inicio
ATG y que por ende, de ahí se empiezan a contar los # de codones.

Gen de distrofina: DMD, Xp21.3. Distrofina es una proteína grande como un tubo, presente dentro
de las fibras musculares. Es parte del complejo distrofina-glicoproteína, lo cual cruza un puente de
citoesqueleto interno. El gen es de 2.4 Mb, 79 exones, 8 promotores. El transcrito Dp427m de
13,993 pb de ARN. La distrofina tiene 3685 aa y un PM de 427 kDa. Hay 8 isoformas, que son
producto de diferentes promotores.

El genoma mitocondrial está menos estable porque tiene nula recombinación y porque está
dentro de un ambiente con muchos radicales libres.

Los repetidos acumulados ocurren por eventos de inserción, lo cual da lugar a intrones
considerablemente más largos de lo normal.

Óxido nítrico sintetasa: Gen GULD permite sintetizar vitamina C y la manutención del orden en
línea de segmentos cromosómicos, lo cual da lugar a genes o bloques sinténicos.

A lo largo de la evolución, se acumularon mutaciones en diferentes genes. Se duplica el gen y se


obtienen parálogos. Se da una especiación y esta da lugar a ortólogos. La genómica comparativa
puede comparar polimorfismos, ensamblaje de fragmentos de secuencias en el orden de los
cromosomas, identificación de orden, conservación de genes entre diferentes especies,
conservación de orden lineal de genes en segmentos cromosómicos de diferentes especies. Esto
no debe confundirse con recombinación.

Sintenia implica perseveración del orden en pequeñas regiones del cromosoma. La organización
puede cambiar, pero también pueden conservarse algunos bloques de hasta 2 genes de similitud.
El alineamiento de secuencias no es trivial, pero pueden diferir en tamaño por inserciones o
deleciones de nucleótidos.

Árboles filogenéticos hacen análisis bioestadístico comparativo de secuencias entre especies


diferentes para inferir el árbol genético. Raíz o nodo basal es el punto de partida o base del árbol y
representa un ancestro común. Nodos internos representan eventos de especiación.

Distancia filogenética: Separación de dos organismos en la escala evolutiva. La relación


filogenética está basada en ADN 16s y ADN ribosomal. La comparación entre genes ortólogos es
entre diferentes especies. La comparación entre genes parálogos es en la misma especie y con
árbol genético. Un alelo ancestral está presente en el último ancestro antes del humano. El valor
K=Complejidad no correlaciona con # de cromosomas. Valor C=La complejidad de organismo NO
se correlaciona al tamaño del genoma. Valor N=Complejidad del organismo no se correlaciona al #
de genes.

Transcriptoma y proteoma: El genoma es lo que podría pasar, transcriptoma es lo que podría estar
sucediendo, y el proteoma es lo que verdaderamente está pasando. Se pueden usar métodos de
análisis globales para la genómica, transcriptómica, y metabolómica. La aplicación de nuevos
métodos de perfiles moleculares para diagnóstico de patologías incluyen: tomar tejidos, observar,
al microscopio, y detectar la patología en cuestión. La nueva metodología usa proteómica y
espectrometría de masas y genómica con microarreglos para poder detectar patologías u otros
problemas de salud. Puede haber mapeo, secuenciado y anotaciones de genoma (genómica
estructural), arreglos de ADN y chips (q-PCR, northern blot, y fusiones transcripcionales para
transcriptoma).

Transcriptoma: Población de ARN mensajero expresada por un genoma en un momento dado. Es


la colección completa de ARNm de una célula en un momento particular. El transcriptoma refleja
los genes activos en un momento particular bajo ciertas condiciones fisiológicas. El transcriptoma
cambia de un tejido a otro, y también en diferentes etapas de crecimiento, o en presencia de
tratamientos médicos. Tamaño genoma<Tamaño transcriptoma<Tamaño proteoma. El
transcriptoma está compuesto de 22,000 genes diferentes, 1,100,000 de transcritos de ARN m y
1,000,000 de proteínas.

Las células de un tejido dan lugar a diferentes niveles de expresión génica (perfiles de expresión).
Son patrones de actividad o expresión de genes al mismo tiempo en las mismas células y
condiciones. Esta variación en expresión es base de diferentes procesos bioquímicos en un
genoma. La complejidad informacional aumenta de genoma, a transcriptoma, a proteoma. El
transcriptoma permite cuantificar niveles de expresión de genes con técnicas que analizan miles
de moléculas de ARN al mismo tiempo. Diferentes transcriptomas dan diferentes tipos celulares.

Importancia de estudiar el transcriptoma: Da conocimiento de cuándo y dónde se enciende/apaga


un gen particular. La mayoría de las funciones en los genes son desconocidas. También se puede
comparar el transcriptoma de un tejido sano y enfermo.

El transcriptoma nos dice lo que hace una célula, los genes que se expresan en un momento
específico y permite detectar cambios entre transcriptoma experimental y de referencia. También
permite ver variaciones de tipo celular, entre organismos, etapas de desarrollo, edad, ambiente, o
enfermedad. Permite entender de diferenciación normal si se estudia transcriptoma de células
troncales o de carcinogénesis si se estudia el transcriptoma de células cancerosas. El RNAseq es un
método de análisis masivo.

El transcriptoma da entendimiento de genes y vías involucradas en procesos biológicos (culpables


por asociación), elucidar función de genes desconocidos con base en expresión espacial/temporal,
o identificar genes marcadores de enfermedades.

Transcriptómica: Estudio de transcriptoma con tecnología de gran escala para ver cuándo, cuánto,
y donde se expresa o no un gen. Algunos métodos para analizar expresión de uno o pocos genes.
Primero se hibrida in situ el tejido, se lleva a cabo una transferencia, un northern blot, hibridación
con dot-blot, uso de genes reporteros o RT-PCR. Estos métodos no sirven para transcriptoma.

Para detectar cambios en transcripción de genes múltiples se pueden usar métodos buscados en
hibridación (microarreglos). Portaobjetos pequeños con muchos genes en patrón regular, para
luego marcar los ARNm con fluorescencia e hibridarlos con muestra de portaobjetos, se pueden
determinar niveles de expresión de miles de genes al medir cantidad de ARNm en cada gen del
microarreglo. SAGE (Serial Analysis of Gene Expression) y MPSS para definir “firmas” de un
segmento específico de ARNm de un gen específico. Son transcritos de hasta 25 bases que se unen
por complementariedad.

Se tiene una muestra, se purifica, se hace retrotranscripción, se empareja con ADN codificante, se
hibridiza, se lava y se compara con transcritos de referencia.

Los estudios clásicos de perfiles de transcriptomas en humano fueron realizados en 1999 por
Goles et. Al e hicieron clasificación molecular de cáncer.

Tipos de ARNnc en humanos y funciones: Pueden ser específicos para tejidos o células
particulares. La mirnómica estudia a los miRNA. Los miRNA tienen pares GO en sus estructuras
secundarias. MiRNAs son procesados por las enzimas Drosha y Dicer y esto ayuda a regular
traducción proteica. Las interacciones entre el miRNA y ARNm pueden tener algunos errores de
pareado de bases. Pueden activar o silenciar a ARNm específicos.

Proteoma: Conjunto completo de proteínas expresado por un genoma en una célula o tejido en
tiempos y en condiciones particulares. Se debe conocer una estructura de proteínas del proteoma
y la interacción funcional entre proteomas. El proteoma es más grande que el genoma. El
procesamiento alternativo, la estabilidad proteica, las modificaciones post traduccionales
(fosforilaciones) dan lugar a gran variedad de proteínas.

La proteómica usa SDS-PAGE en 1-D para separar por pI, y en 2-D para separar por PM de
proteína. Identificación y secuencia parcial de proteínas requiere espectrometría de masas.
También se pueden usar microarreglos de proteínas para detectar interacciones proteína-proteína
con anticuerpos. El SDS-PAGE se puede acoplar a citometría para cuantificar niveles de proteínas.

Pasos de espectrometría de masas: Cortar manchas de gel con Ag+, digerir con tripsina para tener
péptidos de 5-10 aa, determinar masa/carga de péptidos en espectrómetro. Se pueden ionizar a
las proteínas por electrospray ionization (ESI) o matrix assisted laser deabsorption/ionization
(MALDI). No olvidar que hay que comparar los resultados con los de la secuencia de referencia.
El genoma tiene la misma concentración y es estático. El transcriptoma y el proteoma son de
naturaleza dinámica. Diferentes transcritos se originan de diferentes genes en un momento y
tejido particular. Puede haber edición, corte, y empalme alternativo para ARN.

En microarreglos se pueden usar Expressed Sequence Tags (EST). Siempre se va a aplicar


estadística para poder probar que existen diferencias significativas. El problema es que hay una
enorme base de datos con ruido técnico y biológico. Es necesario identificar genes específicos y
trazar la relación y función entre ellos. Los heatmaps de agrupamientos jerárquicos son imágenes
de colores con dendrograma superior y lateral usado para ver resultados de microarreglos.
Dendrograma superior da relaciones entre datos y el lateral de relaciones entre genes.

Ontología génica: Función, dónde se localiza, y en qué proceso está involucrado el gen.

Mapa genético: Define distancias relativas entre genes por eventos de recombinación en la región
cromosómica que los contiene. En 90’s hubo esfuerzos para asociar genómicamente a un gen
(cromosomas son objetos físicos con patrones de banda característicos como referencias visibles.
La organización del material hereditario es lineal a lo largo del cromosoma.

Técnicas de mapeo o análisis genético: Define distancias relativas entre genes por eventos de
recombinación ocurridos en región cromosómica. Muestra posición de genes en cromosomas de
especie (relativa). Localiza genes asociados o detecta variaciones entre individuos.

El mapa genético muestra posición de genes en especie y permite buscar genes asociados con una
enfermedad. Debe mostrar posiciones de características distintivas y tiene marcadores genéticos.
Tiene asignación o localización de gen o cromosoma, genes sinténicos están en el mismo
cromosoma. Genes ligados segregan juntos a menos que haya recombinación. La frecuencia de
recombinación entre cromosomas homólogos permite medir distancia entre genes. Entre mayor
sea la distancia entre genes, mayor será la recombinación.

Genes ligados y sinténicos tienen 50% de probabilidad de recombinación. Se pueden usar


marcadores genotipificados para dar mejor seguimiento a recombinación. Permiten explicar
rasgos monogénicos. No sirven para rasgos multifactoriales.

Chiasmas=Rasgo de evento de recombinación. Los centimorgans no son medidas absolutas, pero


se usan en mapas genómicos.

La sordera generalmente es autosómica recesiva, pero los eventos de recombinación dan lugar a
la enfermedad.

Distancia entre genes dependen de frecuencias de recombinación (FR%). FR es el % de progenie


recombinantes. El 1% de FR=1 evento de recombinación/100 meiosis. La distancia entre genes
cuando 1/100 productos es recombinante. Hay diferencia entre hombres y mujeres en mapas
genómicos. 1%=1cM o M.U. (Unidades de mapa). Genes muy lejanos tienen misma probabilidad
de segregar juntos o separados. Una FR=50%=50cM. Si la FR<50% indica ligamiento. Frecuencia de
# 𝑑𝑒 𝑟𝑒𝑐𝑜𝑚𝑏𝑖𝑛𝑎𝑛𝑡𝑒𝑠
recombinación=𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑟𝑒𝑐𝑜𝑚𝑏𝑖𝑛𝑎𝑐𝑖ó𝑛 = %𝑅𝑒𝑐𝑜𝑚𝑏𝑖𝑛𝑎𝑐𝑖ó𝑛 =
𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑔𝑎𝑚𝑒𝑡𝑜𝑠
# 𝑑𝑒 𝑟𝑒𝑐𝑜𝑚𝑏𝑖𝑛𝑎𝑛𝑡𝑒𝑠
( )∗ 100.
𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑔𝑎𝑚𝑒𝑡𝑜𝑠
Amelgenina está en cromosomas sexuales. Todo el método usa electroforesis capilar. También se
pueden emplear marcadores de microsatélites.

La meiosis informativa es cuando se puede determinar qué alelos vinieron de cada progenitor
individual. Para elegir marcadores adecuados, se deben tener heterocigotos en un % mayor o
igual al 70%; para asegurar que se pueda distinguir de qué progenitor se origina cada alelo
individual.

Si los genes están ligados, hay un mayor # de progenie parental que recombinante.

Mapa físico: Determina orden y espacio de segmentos de ADN. Cada uno identificado por
secuencias específicas. Elimina la necesidad de clonas enormes y es adaptable para completar
secuencia completa de ADN humano. Inicialmente se tenía un mapa híbrido del mapa de
restricción y un mapa contiguo que mostraba orden y distancia de sitios de corte.

Marcador genético: Cualquier carácter Mendeliano puede ser un carácter genético. DEBE ser
polimórfico. Harris describió en 1971 la presencia de variantes y el hecho de que muchas proteínas
tienen variantes heredables. Un ejemplo son los antígenos en diferentes grupos sanguíneos, o los
polimorfismos en proteínas séricas. RFLPs ayudan en localización física. STR reemplazan a VNTR y
luego los SNV. El marcador genético debe ser para variación conocida en una población, y se debe
saber su localización en el genoma.

Los polimorfismos son para variantes genéticas con frecuencia>1%.

RFLP=Restriction Fragment Length Polymorphism. SSR=Simple Sequence Repeats incluyen a


minisatélites (VNTR) y microsatellites (STR).

En RFLP, se encuentra un sitio polimórfico de restricción y se corta con enzimas de restricción


específicas. Se usan sondas para fragmentos y así se encuentra la localización en el cromosoma.

Se puede detectar hibridación de microsatélites con ADN, cADN, y Southern Blots. En la


hemoglobina S, un solo cambio de una base da lugar a hemoglobina S y a anemia falsiforme, la
cual es una enfermedad autosómica recesiva.

El hecho de que una enfermedad sea autosómica, implica que no hay distinción de cuáles sexos se
van más o menos afectados por el padecimiento. Si el padecimiento también es dominante, se
transfiere o tiene probabilidad de transferirse en todas las generaciones.

Los RFLP solían hacerse con hibridación ADN-ADN. Ahora se amplifica, se corta fragmento de PCR
amente con enzima y se fraccionan por tamaño con electroforesis en gel. Puede generarse un
nuevo sitio en enzima de restricción. Los RFLP pueden hacerse muy baratos usando solamente
geles.

Los microsatélites como marcadores pueden ser muy útiles para mapeo genético y tienen alelos
múltiples. Son muy comunes a lo largo del genoma. El problema es que tienden a mutar
considerablemente.

Marcadores de SNP: Son ventajosos porque este polimorfismo es sumamente común en los
humanos. Son muy estables, métodos poderosos de genotipificación y son potencialmente
utilizables para mapear el genoma completo. Entre diferentes especies y sexos hay múltiples
diferencias en términos de cM.

En el caso de las SNV, solamente se pueden tener 2 variaciones diferentes. Para microsatélites
puede haber 5 o 7 variaciones diferentes.

Posterior a la realización de una genealogía con una familia grande o varias familias pequeñas. Se
puede ver con los colores de los progenitores individuales, si la herencia es autosómica dominante
o recesiva. Con los números después de la D en los marcadores se puede delimitar con qué
marcadores se transmite la enfermedad.

Para que haya ligamiento, se debe tener un LOD score de 3. Se puede seguir el árbol genealógico
para poder ver dónde hay recombinantes de ciertos marcadores en el árbol genealógico para
determinar que estos NO son transferidos con la enfermedad.

Posteriormente, usando la gráfica de LOD se puede determinar entre qué marcadores hay o no
ligamiento en base a cuál tiene un mayor puntaje de LOD. De esta forma se puede distinguir entre
qué marcadores está el gen mutante. Luego se puede investigar la función del gen, sus efectos por
mutaciones en OMIM, entre otras cosas.

Para los padecimientos autosómicos recesivos, hay que buscar grupos de homocigotos donde se
tengan los mismos marcadores. De nuevo hay que identificar entre qué marcadores está el gen
mutante.

Mapas físicos: Híbridos de células humano/ratón tienden a perder cromosomas humanos al azar y
por ende hay líneas celulares híbridas con menos cromosomas humanos. Si un gen siempre está
presente o ausente cuando un cromosoma desaparece o aparece en las células híbridas; se puede
establecer su localización cromosómica. La célula híbrida formada debe ser estable y después se
puede hibridar con FISH para detectar genes específicos en el cromosoma.

Viendo en qué cromosomas están presentes o ausentes, la actividad enzimática, y otros


parámetros, se puede determinar en qué cromosoma están los genes para ciertas proteínas.
También se pueden determinar bloques sinténicos viendo cuáles genes comparten el mismo
cromosoma.

En la formación de heterocariones con células somáticas de diferentes especies, se pueden usar


marcadores, exponerlos a radiación, y luego medir actividad enzimática o poder llevar a cabo
análisis con FISH.

STS=Sequence Tag Sites. Similares a EST pero las EST si se expresan y fueron usadas para mapeo
genético. STS NO se repiten en el genoma.

La localización de un marcador puede medirse con un mapa genético, mapas ontogenéticos, y


mapas físicos donde podemos tener la posición exacta en el genoma. Las distancias entre estos
tres tipos de mapas y entre hombres y mujeres sí tienen variación.

La meiosis no informática puede ser un producto de que los padres son homocigotos, porque el
genotipo de los padres es igual al de los hijos, o porque hay un genotipo homocigoto en el hijo.
A pesar de que es muy tedioso hacer heterocariontes, el proceso sí tiene utilidad. Los mapas se
complementan entre sí y sólo son para enfermedades causadas por genes individuales (no
múltiples genes).

En humanos, no hay posibilidad de preseleccionar genotipos y hacer cruzas. La mayoría de los


genes que causan enfermedades hereditarias son raros. Los cálculos de FR se obtienen
examinando genotipos de familias existentes en generaciones sucesivas. El problema es que los
datos pueden ser limitados y se requiere tener siempre meiosis informativas entre generación y
generación.

No se puede decir que dos loci estén ligados sólo por análisis de ligamiento en árbol genealógico.
Se pueden tener resultados de varias cruzas y luego usar chi-cuadrada para determinar el puntaje
de LOD, el cual es el logaritmo base 10 de la probabilidad de que 2 loci estén ligados entre sí.
Primero se establece el árbol genealógico, se calcula el valor de teta (fracción de recombinación)
(Recombinantes vs. No recombinantes) y se calcula el valor de LOD. Se asume que los Loci están
ligados entre sí si el valor de LOD es mayor o igual a 3 y por ende la probabilidad de que no estén
ligados es de 1/1000. Entre más marcadores se usen en este análisis, más precisión habrá en la
información obtenida. Si teta=0, no hay recombinación. Si Z (valor de LOD)<-2, implica que no hay
ligamiento entre dos loci específicos, pero también puede significar que no hay datos suficientes.

Las células somáticas híbridas para mapeo se basan en capacidad de células de hámster para
integrar material genético de otra especie. Las células humanas se fusionan con las de hámster y
se seleccionan aquellas con uno o más cromosomas humanos. La situación ideal es un panel
completo de híbridos en el que cada híbrido tiene un único cromosoma humano. Se obtiene una
mejor relación si solo se usan fragmentos de cromosomas.

Respuestas seleccionadas de segunda serie de introducción a la genómica: 9-11. La


monoamino oxidasa A (MAOA) es una enzima codificada en núcleo, pero activa en mitocondria. Esta enzima
cataliza la desaminación oxidativa de diversas aminas biogénicas, incluyendo neurotransmisores
importantes como epinefrina y serotonina. Se sabe que la enzima puede ser inhibida por anfetaminas,
conduciendo al efecto “rush”. En la parte inferior está la secuencia proteica de la MAOA. Conteste:
a) En el navegador de su preferencia, busque ¿cuál es la localización citogenética del gen que codifica la
MAOA?, ¿qué tamaño tiene el gen (pb)?, ¿cuántos transcritos existen y de qué tamaño? Especifique qué
navegador usó con el ID de los archivos.
Es un gen de 91,917 pb. Hay 4 transcritos diferentes de 4015, 2083, 935, y 557 pb. El defecto
genético que causa es el síndrome de Brunner. Tiene herencia recesiva en cromosoma X, y se
manifiesta con agresividad impulsiva y retraso mental moderado por falta de MAO A. Se tiene una
mutación sin sentido que da un codón de paro prematuro. Hay 3 variantes alélicas asociadas a la
enfermedad. C es el alelo normal y por ende es el individuo a seleccionar para elegir el patrón
esperado.

12-14. En relación al gen PMP22 del humano, diga su localización cromosómica, tamaño del gen, tamaño
del transcrito, tamaño de la proteína.
Se localiza en el cromosoma 17, tiene un tamaño de 35,581 pb, una proteína de 160 aminoácidos.
Da lugar a la enfermedad de Charcot-Marie-Tooth. Es un grupo de transtornos hereditarios del
SNP que se caracteriza por la pérdida progresiva de tejido muscular y sensación de tacto en varias
partes del cuerpo. Es el resultado de una trisomía de PMP22. En el síndrome de Charcot-Marie-
Tooth, lo que se tiene es una pérdida de función comúnmente causada por una duplicación de una
gran región en el brazo corto del cromosoma 17. Se pueden detectar las CNV de PMP22 en el
laboratorio, y se puede usar la técnica de FISH (Hibridación in Situ con Fluorescencia). En esta
técnica, cuando hibride una sonda particular y se le incida con una luz de cierta longitud de onda,
va a ser fluorescente. En FISH se busca una secuencia específica con un fluóroforo y cuando haya
hibridación, este va a emitir fluorescencia. FISH se basa en exponer los cromosomas a una
pequeña secuencia de ADN (sonda) que tiene una molécula fluorescente pegada a ella. La
secuencia de la sonda se une a su secuencia correspondiente en el cromosoma. Las sondas se
pueden usar para determinar en qué cromosoma se encuentra el gen para determinar si a un
individuo le falta material genético de un cromosoma en específico o para examinar anomalías
cromosómicas.

Cada vez que se hacen estudios de ontología se ven funciones asociadas a algo. ExPASY es para
info más detallada y UNIPROT es para información más rápida y sencilla.

Alelos=Forma alternativa de un gen o secuencia particular. Genotipo=Alelos en constitución


genética de un organismo (en todos o en un locus determinado). Homocigoto=Mismos alelos en
un gen. Heterocigoto=Diferentes alelos en un gen. Para ver si un alelo es dominante o no, hay que
ver s se expresa en el heterocigoto. Si se expresa, entonces es dominante. Si no, es recesivo.
Fenotipo=Expresión del genotipo y su interacción con el ambiente. Los patrones de herencia
pueden ser clásicos (Mendelianos), multifactoriales, y no clásicos.

Herencia autosómica dominante: Afecta de la misma forma a hombres y mujeres, cada persona
afectada tiene un progenitor afectado. No se salta generaciones y por ende puede haber
generaciones afectadas (todas). Cada hijo de un progenitor afectado tiene 50% de riesgo de ser
afectado. Los individuos no afectados no transmiten la característica afectada a la progenie.
Algunos ejemplos, de padecimientos con este patrón incluyen la hipercolesteremia, osteogénesis
imperfecta, acondroplasia, enfermedad de Huntington, polidactilia, neurofibromatosis, entre
otros. Los individuos afectados generalmente son heterocigotos. Los individuos no afectados no
transmiten la característica a su progenie.

Síndrome de Marfan es causado por mutación en gen FBN1, que causa defectos en visión,
anomalías cardíacas, aracnodactilia. Son mutaciones de novo en 25% de los casos (antes no
presentes). Los grupos ABO son un ejemplo típico de codominancia en genes.

Familia génica PAX está involucrada en múltiples órganos. Las mutaciones capaces de truncar
proteínas pueden ser nonsense, splice, o insDel. Waardenburg es un ejemplo de síndrome donde
existe expresión variable (nivel en el que un genotipo se expresa en el fenotipo de un paciente).
Los pacientes pueden tener diferentes en una enfermedad a pesar de que la mutación se
encuentra en el mismo gen.

En los padecimientos autosómicos dominantes puede haber penetrancia incompleta o completa.


Para que la penetrancia sea completa, debe afectar a TODOS los individuos con el gen mutado. En
los árboles genealógicos se puede notar penetrancia incompleta si una generación no tiene
afectados. La penetrancia=Probabilidad de que un gen mutante se manifieste en todos los
individuos portadores de ese gen. Es la medida de individuos que tienen un gen mutado y
expresan la enfermedad. Un rasgo dominante puede tener diferentes niveles de penetrancia y
expresividad variables. Un ejemplo es el retinoblastoma, con 75% de penetrancia y con la
capacidad de expresarse en uno o los dos ojos.

Expresividad=Severidad de fenotipo atribuida a un alelo particular. La penetrancia y expresividad


variable resultan de interacciones con otros genes y con el medio ambiente.

Mecanismos de dominancia: Haploinsuficiencia, dominancia negativa y ganancia de función son


los 3 mecanismos principales de dominancia. La haploinsuficiencia es cuando la cantidad de
producto de un gen (50%) no es suficiente para que el gen cumpla con su función normal. NO
todos los genes son sensibles a dosis. Un ejemplo es el gen COL1A1 que da lugar a osteogénesis
imperfecta tipo 1 (la cual es la menos grave). La tipo VIII es la más severa. Toda esta serie de
padecimientos se manifiestan con malformaciones en huesos y articulaciones, huesos frágiles, etc.
COL1A1 y COL1A2 codifican para procolágeno tipo I (la cadena alfa 1 y 2, respectivamente).
Mutaciones sin sentido en cualquiera de los genes tienen efecto menos severo que mutaciones de
sentido erróneo, que dan lugar a una triple hélice no funcional por dominancia negativa.
Mutaciones en COL1A1 causan reducciones en la cantidad de colágeno. Las pérdidas de función
por mutaciones en síndrome de Waadenburg son un muy buen ejemplo de haploinsuficiencia.

Dominancia negativa: Producto de un alelo defectuoso que interfiere con el producto del alelo
normal. Tienen efectos más severos que la haploinsuficiencia porque un producto anormal
insertado en un multímero proteico puede destruir la actividad de un complejo proteico. La
dominancia negativa se presenta en osteogénesis imperfecta más severa. El producto del alelo
mutante altera el empaquetamiento de la triple hélice de colágeno. La dominancia negativa se
presente en osteogénesis imperfecta de tipos II,III, y IV.

Ganancia de función: Una alteración de splicing causa que se obtenga una función. Por ejemplo, el
sitio de ruptura del propéptido N-terminal se pierde y se produce colágeno anormal; dando lugar a
síndrome de Ehlers Danlos tipo VII. La ganancia de función implica el desarrollo de funciones
anormales para el producto del gen. No obstante, la mutación no genera un producto
radicalmente diferente al producto nativo. Algunos ejemplos incluyen: Sobreexpresión en PMP22
que da lugar a síndrome de Charcot-Marie-Tooth, agregación de proteínas en HD en síndrome de
Huntington, o gen quimérico en BCR-ABL para leucemia mieloide crónica. Otro ejemplo es la
acondroplasia, causada por mutaciones en gen de receptor 3 de factor de crecimiento de
fibroblastos. Da lugar a crecimiento anormal de huesos que da baja estructura, cabeza grande,
estructura facial característica; pero sin alterar inteligencia y vida media promedio. El 80% de los
casos son mutaciones de novo y el 98% ocurre en FGF3. FGFR activa diferentes factores de
transducción de osteoblastos para iniciar replicación de osteoblastos, su diferenciación, y su
apoptosis.

En las sustituciones, solamente se usa un “>” para indicar que un nucleótido fue reemplazado por
otro. La IUPAC establece un código de ambigüedad que sirve para poder determinar qué
diferentes nucleótidos son reemplazados en una secuencia cuando puede haber más de una
variación. En el ADN codificante, el ORF empieza en la posición 1, y cualquier nucleótido previo es
un número negativo. Si van río abajo, se agrega “*” a la posición. Entonces, se puede decir que
c.9C>T es una sustitución en la citosina en posición 9 por una timina. No obstante, como la
proteína obtenida sigue siendo prolina; no hay efecto directo sobre la proteína final (P:pro3pro ó
P. p3=). Los alfa talasémicos afectan los componentes de la alfa globina en la hemoglobina nativa.
En la herencia dominante ligada al cromosoma X, no hay transición de varón a varón. Un varón
afectado con pareja sana tendrá 100% de sus hijas afectados y 100% de sus hijos sanos. Un
ejemplo es el síndrome de Rett (movimientos estereotipados con las manos y degeneración
motriz). Se puede distinguir entre una enfermedad autosómica dominante y una ligada al
cromosoma X viendo que en la 2da generación, NO hay herencia padre-hijo (varón-varón). En
herencia holóndrica (ligada al cromosoma Y) tiene muy pocos genes y poca relación de herencia.
Un ejemplo es la presencia de vello excesivo en las orejas.

Heterogenicidad genética: En la heterogenicidad alélica hay diferentes mutacione en el mismo


locus. Un ejemplo es la distrofia muscular de Duchenne o Becker. En heterogenicidad de locus, se
dan mutaciones en genes en diferentes loci (otro ejemplo es la osteogénesis imperfecta tipo II,
que puede derivarse mutaciones en cadenas de colágeno alfa 1 y alfa 2. En distrofia de Duchenne
se pierden o desaparecen casi por completo las fibras musculares, y en la de Becker; todavía están
presentes pero están mal conformadas.

La enfermedad de Parkinson son el resultado de mutaciones en gen PARK 1,2, y 3 y es otro


ejemplo de heterogenicidad genética. Los diferentes tipos de enanismo también son un excelente
ejemplo de heterogenicidad en alelos.

Herencia autosómica recesiva: Patrón de herencia horizontal con uno o más hijos afectados, y
dónde la progenie y los progenitores están generalmente sanos. Tiene un riesgo de 25% de que se
presente la enfermedad bajo este patrón de herencia. Puede ser resultado de matrimonios
consanguíneos. Hay 25% de probabilidad de tener afectados, 25% de tener portadores sanos y
50% de tener individuos sanos. Algunos ejemplos de este tipo de herencia incluyen la fibrosis
quística, la anemia de células falsiformes, la fenilcetonuria, o el albisnismo. La hiperfenialanemia
es por deficiencia de PAH. Interviene en el metabolismo de phe, causando acumulación de líquidos
y retraso mental. Las sorderas también suelen tener herencia autosómica recesiva.

Los RFLPs son importantes para identificar alelos responsables de enfermedades monogénicas. Un
ejemplo es la anemia de células falsiformes, que es causada por cambios en cadenas beta de
hemoglobina y da lugar a hemoglobina S.

Herencia recesiva ligada a cromosoma X: Afecta principalmente a los varones. Nunca hay
transmisión de varón a varón. Padres e hijos son normalmente sanos. Puede haber tíos afectados.
Las madres portadoras tienen 50% de probabilidad de tener hijos afectados y 50% de tener hijas
portadoras.

Los alelos recesivos dan lugar a pérdidas de función totales o parciales en proteínas. La proteína
no se sintetiza o se sintetiza alteradamente, o en cantidades menores. Se debe a sustituciones de
un aminoácido por otro, codones de paro prematuros, o deleción/inserción de uno o varios
nucleótidos.

En patologías monogénicas primero hay que hacer análisis de secuencias de nucleótidos y de


secuencias proteicas, revisar la existencia de mutaciones previamente estudiadas o descubiertas,
nuevas características en forma de FQs, comparar aminoácidos wildtype contra los aminoácidos
mutantes, revisar en qué dominio reside la proteína de interés, ver si es un residuo conservado
evolutivamente, analizar los cromosomas control a través de clonación, y hacer estudios
funcionales.
Se puede revisar OMIM para encontrar variaciones de proteínas que den lugar a padecimientos
específicos. O dbSNP para encontrar SNV o indels y sus respectivas secuencias de referencia.
Generalmente hablando, los residuos que son evolutivamente conservados tienden a ser
afectados en padecimientos monogénicos. A veces también puede encontrarse una variante
benigna o de significado incierto.

El hecho de que la proteína se altere o no depende del sitio donde ocurre el cambio, del aa
implicado en el cambio, y del tipo de mutación que origina el cambio. En Blink se puede hacer
comparación de árbol con otras especies. En dominios conservados se puede ver qué efecto tiene
el cambio de residuo en un dominio particular. Se puede usar polyphen para ver si una variación
de aa específica en una proteína da un resultado maligno o no (PSIscore alejado de 1). También se
pueden revisar dominios conservados en UNIPROT.

La pérdida de función se da en la herencia autosómica recesiva. La cantidad de producto del gen


no afecta el funcionamiento normal (esto aplica para heterocigotos en portadores sanos). La
mayoría de los genes codifican para enzimas. El heterocigoto no siempre tiene 50% de actividad y
tiene regulación a alto nivel de transcripción o actividad enzimática. El fenotipo solo se presenta
en homocigotos recesivos. Algunos ejemplos de función incluyen distrofia muscular de Duchenne,
fenilcetonuria clásica (mutaciones en fenil alanina hidroxilasa aumentan la [fenilalanina], fibrosis
quística por gen CT7R (previene procesamiento de aparato de Golgi y es un buen ejemplo de
heterogeneidad alélica).

Genes modificadores: Genes con localización diferente a ala determinada en la enfermedad.


Modifican la expresión de la enfermedad. Para enfermedades monogénicas, existe un gen
primariamente responsable de la patología pero puede haber más genes que influyen sobre el
fenotipo. La fibrosis quística es un padecimiento para ejemplificar genes modificadores. Afecta
glándulas, mucosas, páncreas, pulmones, hígado, intestinos, entre otros; haciendo que las
mucosidades sean espesas y pegajosas.

Mutaciones: Pueden ser germinales, o constitucionales y se pueden adquirir por herencia o ser de
novo en una célula germinal de uno de los padres. En el segundo caso, todas las células del cuerpo
adquieren la mutación. Un ejemplo son las enfermedades hereditarias, donde las mutaciones
somáticas se adquieren únicamente en el transcurso de la vida y son portadas únicamente por la
célula afectada y su descendencia.

Enfermedad de Huntington: Enfermedad neurodegenerativa progresiva, que incluye pérdida


selectiva de neuronas, dando lugar a movimientos anormales involuntarios, alucinaciones,
psicosis, paranoia, cambio de personalidad. Generalmente se da en los 30-40 años.

Las enfermedades de inicio tardío muestran penetrancia relacionada a la edad. El genotipo queda
fijo pero el fenotipo se manifiesta antes de la adultez. En este caso, la penetrancia se asocia a la
edad.

Anticipación: Tendencia de algunas condiciones para ser más severas o tener menor edad de inicio
en generaciones sucesivas. Es frecuente en enfermedades causadas por mutaciones dinámicas
(nucleótidos repetidos en tándem) que son meióticamente inestables (microsatélites). Se pueden
localizar las mutaciones en cualquier parte del gen.