Documentos de Académico
Documentos de Profesional
Documentos de Cultura
E.A.P.:
Biotecnologa
Facultad:
Ciencias
Docente:
Gustavo Sandoval
Curso:
Bioinformtica
Tema:
Bsqueda de secuencias y alineamiento local
y mltiple
Integrantes:
Marquez Paredes Paul Erik
Morales Alvarado Leslie Stefania
Morillo Pallara Baddy Jhonatan
Soria Galvez Manuel Eduardo
Velasquez Mejia Pedro Lee
Vigo Rivera Lucero
Ciclo:
VI
Desde finales de los aos 70, se han decodificado miles de secuencias de ADN de
diferentes organismos, siendo finalmente almacenadas en bases de datos. Esta
informacin es posteriormente analizada para determinar qu genes codifican:
determinadas protenas, RNA, etc. No obstante, debido al crecimiento exponencial
de las bases de datos, el anlisis manual de estas secuencias de ADN pronto se
convirti en un proceso impracticable. Afortunadamente, en la actualidad, este
proceso ha sido automatizado mediante el uso de programas de ordenador (como
BLAST), permitiendo el anlisis del genoma de miles de especies (billones de
nucletidos de informacin). La misin de estos programas consiste en llevar a cabo
el alineamiento entre dos secuencias, es decir, obtener el conjunto de operaciones
de edicin (insercin, deleccin y sustitucin) que logran transformar una secuencia
en la otra, con el fin de identificar secuencias relacionadas, pero no idnticas.
Puesto que el alineamiento de secuencias constituye el caso de uso utilizado en
esta tesis, apartados posteriores profundizarn en esta cuestin.
Alineamiento de secuencias
Definicin
NOTA:
Los cdigos de nucletidos degenerados en rojo se tratan como desapareamientos
en la alineacin de nucletidos. Demasiados de tales cdigos degenerados dentro
de una consulta de nucletidos de entrada harn que la pgina web BLAST rechace
la entrada. Para las consultas de protenas, demasiados cdigos parecidos a
nucletidos (A, C, G, T, N) tambin pueden causar un rechazo similar.
La pgina web de BLAST no aceptar "-" en la consulta. Para representar huecos,
use una cadena de N o X en su lugar
1. S la secuencia es de nucletidos el formato permite los siguientes
smbolos:
Smbolo Significado
A Adenina
C Citosina
G Guanina
T Timina
U Uracilo
R Purina
Y Pirimidina
K GoT
N A, C, G o T
- Hueco
Tipo de bsqueda
BLAST Descripcin
Un tipo de bsqueda BLAST en la que la secuencia de
nucletidos se compara con el contenido de una base de
datos de secuencias de nucletidos para encontrar
secuencias con regiones homlogas a las regiones de la
BLASTn secuencia original.
Un tipo de bsqueda BLAST en la que la secuencia de
aminocidos se compara con el contenido de una base de
datos de secuencias de aminocidos para encontrar
secuencias con regiones homlogas a las regiones de la
BLASTp secuencia original.
Un tipo de bsqueda BLAST en la que la secuencia de
nucletidos se compara con el contenido de una base de
datos de secuencias de aminocidos para encontrar
secuencias con regiones homlogas a las regiones de la
secuencia original. La secuencia de la consulta est
traducida en los seis marcos de lectura y cada una de las
secuencias resultantes se utiliza para buscar en la base de
BLASTx datos de secuencias.
Un tipo de bsqueda BLAST en la que la secuencia de un
aminocido se compara con el contenido de una base de
datos de secuencias de nucletidos para encontrar
secuencias con regiones homlogas a las regiones de la
secuencia original. Las secuencias de la base de datos de
secuencias estn traducidas en los seis marcos de lectura y
se busca en las secuencias resultantes regiones homlogas
tBLASTn a las regiones de la secuencia de consulta.
Tipo de bsqueda
BLAST Descripcin
Un tipo de bsqueda BLAST en la que la secuencia de
nucletidos se compara con el contenido de una base de
datos de secuencias de nucletidos para encontrar
secuencias con regiones homlogas a las regiones de la
secuencia original. En una bsqueda de tBLASTx, tanto la
secuencia de consulta como la base de datos de
secuencias estn traducidas en los seis marcos de lectura y
las secuencias resultantes se comparan para descubrir
tBLASTx regiones homlogas.
RESULTADOS
Ilustracin 6: Tabla obtenida de la ilustracin 5 muestra los diferentes grupos de aminocidos por
su grupo de nucletidos.
II PARTE
Ilustracin 2.1 luego el microorganismo de estudio, se tienen que obtener l la secuencia de ADN en
formato FASTA
Ilustracin 2.6 estos son los resultados BLAST, las puntuaciones de alineaciones
Ilustracin 2.7 Seleccionamos 3 organismos con identificacin al 100%, 95% y 92% y descargamos
en Formato FASTA con secuencias alineadas
Ilustracin 2.8 Descargado las secuencias, eliminamos el nombre del organismo y solo dejamos el
cdigo de identificacin, para luego copiar estas secuencias y colocarlo en CLUSTAL OMEGA. Que es
un programa de alineamientos de secuencias.
Ilustracin 2.9 Una vez ingresado a la pgina, colocamos nuestra secuencia de ADN.
Ilustracin 2.10 secuencias de ADN ya alineadas, mostrando ** que significan conservacin al 100%,
es decir que nuestra secuencia estn altamente conservada.
III PARTE
Ilustracin 2.10 secuencias de ADN ya alineadas, mostrando ** que significan conservacin al 100%,
es decir que nuestra secuencia estn altamente conservada.
Ilustracin 3.1 repetimos todo lo que es alineamiento local y mltiple para secuencia de protenas.
Ilustracin 3.1 Ingresamos a Protein BLAST. Pegamos la secuencia de protena del ORFs
Ilustracin 3.2 Seleccionamos 3 organismos con identificacin al 100%, 95% y 92% y descargamos
en Formato FASTA con secuencias alineadas
Ilustracin 3.3 Eliminamos el nombre del organismo y solo dejamos el cdigo de identificacin, para
luego copiar estas secuencias y colocarlo en CLUSTAL OMEGA.
Ilustracin 3.3 Alineamos.