Está en la página 1de 7

UNIVERSIDAD AUTÓNOMA DE

QUERÉTARO

FACULTAD DE QUÍMICA

Laboratorio de Bioinformática

REPORTE DE LA PRÁCTICA 6: INTRONES Y EXONES.

Integrantes del equipo:

Badillo Sanjuanero Saul, Bermudez Silva Maria Jose, Lever Olvera Miguel,
Vargas Peña Raúl Emilio

Presentado a: Dra. Ana Gabriela Hernández Puga

Docente de la materia
SANTIAGO DE QUERÉTARO, QUERÉTARO, 18 de septiembre de 2023.
Introducción

Los exones, los segmentos de secuencia de ADN que codifican proteínas


funcionales, parecen ser los actores principales en la representación genética. Sin
embargo, los intrones, segmentos no codificantes que se intercalan entre los
exones, han resultado ser un componente crucial de la trama. La relación entre
intrones y exones se desvela en un proceso de edición genética conocido como
empalme o splicing, en el cual los intrones son recortados y los exones se
ensamblan para formar un ARN mensajero (ARNm) que guiará la síntesis de
proteínas. Este proceso de empalme alternativo permite que un solo gen genere
múltiples variantes de proteínas con diferentes funciones, añadiendo una capa
adicional de complejidad al mundo genético.

La biotecnología, en su búsqueda por entender y manipular los mecanismos


genéticos, ha encontrado en los intrones y exones una fuente inagotable de
posibilidades. La ingeniería genética, impulsada por el empalme alternativo, ha
permitido la creación de medicamentos más efectivos y la producción de alimentos
genéticamente modificados (OGM) con características mejoradas. La edición del
genoma, una revolucionaria técnica de biotecnología, se basa en la comprensión de
estos elementos para corregir enfermedades genéticas y diseñar organismos a
medida.

En el ámbito de la bioinformática, el estudio de los intrones y exones ha


revolucionado la forma en que analizamos y comprendemos la información
genómica. Los algoritmos de predicción de empalme han permitido la identificación
precisa de estos elementos en secuencias genéticas masivas, lo que resulta
esencial para la anotación de genomas completos y la interpretación de datos
genómicos a gran escala. La bioinformática también ha allanado el camino para la
visualización de estructuras de ARN y ARNm, arrojando luz sobre los misteriosos
intrones.

A medida que desentrañamos la complejidad de los intrones y exones, su papel en


la biotecnología y la bioinformática se vuelve cada vez más prominente. Estos
elementos escondidos en el código genético son la clave para entender la
diversidad de la vida, diseñar terapias genéticas avanzadas y desentrañar los
secretos de la evolución. En un mundo donde la genética se encuentra en la
vanguardia de la ciencia y la medicina, los intrones y exones son los protagonistas
de una historia que está lejos de llegar a su fin.

Objetivos.

● Reconoce y utiliza las herramientas bioinformáticas disponibles en línea para


la identificación de secuencias genéticas y reguladoras.
Métodos

Resultados y discusión

Evidencia 1

1. ¿Qué es una secuencia de referencia (RefSeq)?


Es una referencia estándar no redundante que proviene del INSDC, el cual incluye
cromosomas, moléculas genómicas completas, regiones, ADN, ARN, proteínas y
mucha información sobre los segmentos del código genético de los organismos, es
una base para estudio, funcionalidad y comparativa de información.

2. ¿Qué es el INSDC?
El INSDC, que significa "International Nucleotide Sequence Database Collaboration"
(Colaboración Internacional de Bases de Datos de Secuencias de Nucleótidos), es
un consorcio internacional de bases de datos de secuencias de nucleótidos que se
dedica a la recopilación, almacenamiento y distribución de datos de secuenciación
genómica y molecular. Formado principalmente por GenBank, DNA Data Bank of
Japan y European Nucleotide Archive.

3. ¿Cuál es la diferencia entre los números de acceso XM_ y NM_?


Los números de acceso "NM_" corresponden a secuencias de ARN mensajero
(ARNm) en la base de datos de RefSeq con anotaciones sólidas y respaldo
experimental, mientras que los números de acceso "XM_" representan secuencias
de ARNm predichas computacionalmente que aún no han sido completamente
validadas experimentalmente. Las secuencias "NM_" son fiables y bien
caracterizadas, mientras que las "XM_" son útiles para identificar posibles genes,
pero pueden requerir estudios adicionales para su confirmación y anotación. La
elección entre ellos depende de la calidad de la información genética necesaria para
la investigación.

4. ¿Qué es un número de acceso NG_?


Los números de acceso que comienzan con "NG_" se utilizan en la base de datos
de genes de referencia llamada "Gene" en RefSeq, mantenida por el NCBI. Estos
números identifican y proporcionan acceso a información detallada sobre genes
específicos, incluyendo su estructura genética, ubicación en el genoma, variantes
genéticas y otros datos relacionados con ese gen en particular. Sirven como una
referencia organizada para investigadores y científicos que desean acceder y
estudiar información genética específica en el contexto de esta base de datos de
genes de referencia.

5. ¿Qué secuencia se usa para definir una RefSeq?


La secuencia utilizada para definir una RefSeq puede variar según la disponibilidad
y anotación de los datos en el INSDC (International Nucleotide Sequence Database
Collaboration). En algunos casos, la RefSeq se basa en los números de acceso del
INSDC que representan secuencias genéticas o proteicas específicas, mientras que,
para otros organismos, la RefSeq puede basarse en información genómica anotada
o identificadores de locus tag del genoma. Las RefSeq se seleccionan
preferiblemente a partir de secuencias del INSDC que tengan una secuencia de
codificación completa, y en casos de múltiples opciones, se prefiere la secuencia
con una región UTR más larga. Estas secuencias RefSeq están diseñadas para
reflejar el estado actual del conocimiento proporcionado por la comunidad de
investigación y pueden construirse a partir de múltiples secuencias del INSDC, pero
su objetivo es proporcionar estándares de calidad y precisión en la genómica y la
biología molecular.

6. ¿Cuál es la diferencia entre RefSeq y GenBank?


La principal diferencia entre RefSeq y GenBank radica en su función y enfoque.
GenBank es una base de datos archival que almacena secuencias de ADN públicas
enviadas por laboratorios individuales y proyectos de secuenciación a gran escala, y
forma parte de INSDC. Puede ser redundante y los registros son propiedad de los
remitentes originales. Por otro lado, RefSeq, aunque se deriva de secuencias de
INSDC, proporciona datos curados no redundantes que representan nuestro
conocimiento actual de genes conocidos. Puede incluir información adicional y es
propiedad del NCBI, lo que permite actualizaciones para mantener la anotación
actual. Además, RefSeq instancia transcriptos y proteínas como registros
separados, mientras que GenBank solo instancia proteínas anotadas en secuencias
genómicas.

7. ¿Cómo puedo identificar rápidamente los registros de RefSeq?


Revisando el número de acceso: Un registro de RefSeq se identifica fácilmente
porque incluye un guión bajo (_) en el número de acceso. Por ejemplo:
NM_000202.5. Utilizando Entrez Nucleotide o Protein: Cuando realizas una
búsqueda en Entrez Nucleotide o Protein (las bases de datos del NCBI), los
resultados se muestran en el formato predeterminado "Summary". En la parte
superior derecha de la página, encontrarás una opción de "Filter" que te permite
restringir los resultados para que solo muestren registros de RefSeq.
Revisando el formato FASTA: Si estás trabajando con secuencias en formato
FASTA, los registros de RefSeq incluyen el término "ref" antes del número de
acceso y versión, lo que indica que provienen de la base de datos de RefSeq.

Evidencia 2.
Compara los exones de tu proteína de interés reportados en las bases de datos
NCBI vs ENSEMBL. ¿La información es similar, de lo contrario en qué difiere?.
Indica número de exones reportados, secuencia y tamaño. Puntualiza las
diferencias de forma gráfica.

Proteína de interés. Miostatina Humana Homo sapiens myostatin (MSTN), mRNA


NM_005259.3

Exon NCBI NM_005259.3 Ensembl NM_005259.3

1 Del nucleótido 1 al 506 ENSE00001001150


Longitud 506 190,062,729
-190,062,224
Longitud 506

2 Del nucleótido 507 al 880 ENSE00000783895


Longitud 374 190,060,435 190,060,062
Longitud 374

3 Del nucleótido 881 al ENSE00001001151


2819 190,057,638 -
Longitud 1939 190,055,700
Longitud 1939

NCBI muestra los exones en un transcripto de RNA mensajero, de esta manera


solo se encuentran los exones presentes, no está la presencia de intrones, dado a
esto la información de ensemble al respecto es más informativa, sin embargo la
información de NCBI es igual de utilidad al mostrar los axones que conforman al gen
en respecto al mRNA mensajero.

Evidencia 3.
Investiga el símbolo oficial de los genes que codifican para las siguientes proteínas
en ratón: insulina, catepsina b y en pez cebra: laminina alfa, receptor a de la
hormona de crecimiento. En una tabla reporta el locus, contexto genómico, número
de exones que lo componen y RefSeq (no. de referencia) de mRNA y proteínas.

Ratón Insulina

Símbolo Ins 1

Locus 19 D2; 19 46.76 cM

Contexto
genómico

Exones 2
RefSeq mRNA NM_008386.4 →
y proteína NP_032412.3
https://www.ncbi.nlm.nih.gov/gene/16333#reference-sequences

Gen de ratón Catepsina B


que codifica

Símbolo oficial Ctsb

Locus 14 D1; 14 33.24 cM

Contexto
genómico

Exones 10

RefSeq mRNA NM_007798.3 →


y proteína NP_031824.1
https://www.ncbi.nlm.nih.gov/gene/13030

Gen en pez Receptor A de la hormona


que codifica de crecimiento

Símbolo oficial Ghra

Locus chromosome: 8

Contexto
genómico

Exones 9

RefSeq mRNA NM_001083578.1 →


y proteína NP_001077047.1
https://www.ncbi.nlm.nih.gov/gene/100001424

Conclusión

El conocer cómo podemos obtener información importante dentro de las secuencias


de genes tanto como para proteínas como para mRNA nos permiten aplicarlos en
muchos ámbitos como la clonación y diseñar RNA de interferencia.

Referencias
● Sharp, P. A. (1985). On the origin of RNA splicing and introns. Cell, 42(2),
397-400.
● Black, D. L. (2003). Mechanisms of alternative pre-messenger RNA splicing.
Annual Review of Biochemistry, 72(1), 291-336.
● Kornblihtt, A. R., Schor, I. E., Allo, M., Dujardin, G., Petrillo, E., & Muñoz, M. J.
(2013). Alternative splicing: a pivotal step between eukaryotic transcription
and translation. Nature Reviews Molecular Cell Biology, 14(3), 153-165.
● Wang, E. T., Sandberg, R., Luo, S., Khrebtukova, I., Zhang, L., Mayr, C., ... &
Burge, C. B. (2008). Alternative isoform regulation in human tissue
transcriptomes. Nature, 456(7221), 470-476.

También podría gustarte