Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bio Inform Á Tica
Bio Inform Á Tica
Se genera su desarrollo debido a que actualmente en Biología el número de datos es mucho mayor
a la capacidad de análisis del investigador
Características:
National Center for Biotechnology Information (servidor ubicado en USA, pero que actualiza
información diariamente con el servidor EMBL de Europa y con el servidor DDBJ de Japón)
Posee una interfaz denominada Entrez que permite visualizar una sola búsqueda en muchas bases
de datos y acceder a muchas herramientas bioinformáticas.
Las recomendadas para el curso de biología para ingenieros químicos: Pubmed central,
Nucleotide, Protein, Blast, PubChem, Taxonomy. Conserved domains.
Nucleotide, al igual que protein y EST presenta el esquema anterior, el cual muestra:
Los resultados ordenados de forma alfabética indicando el origen (organismo o virus), la longitud
de la secuencia, tipo de secuencia, un número de acceso que empieza con dos letras del alfabeto y
es único para cada entrada (accession )., y un identificador secuencial de la base de datos GI que
se asigna a una nueva entrada, o modificación de un entrada antigua.
Un campo al lado superior (advanced) para limitar la búsqueda o filtros también para limitar la
búsqueda (lado izquierdo) y los organismos relacionados (parte derecha).
En el resultado de Nitrogenase en nucleotide filtrar con mRNA, y filtrar con Rhizobium como
organismo
Por otro lado se puede limitar la buscada en advanced, incluir en esa búsqueda pero solo para el
titulo los términos nitrogenase y complete manteniendo el organismo Rhizobium pero ya sin tener
en cuenta mRNA
Muestra al lado derecho todas las demás entradas en Entrez para el organismo en cuestión.
Búsqueda de secuencias de interés
Se puede buscar en nucleotide o protein la secuencia del gen o proteína de interés, en el cso de
buscar por nucleotide se recomienda filtrar los reultados con mRNA pues si los resultados hacen
referencia a ADN genómico se presenta demasiada información dificultando encontrar el gen de
interés.
Ya escogido el resultado específico, es decir ya teniendo una página con una secuencia con
número de accesión definida y para adquirir dicha secuencias de forma rápida y verla únicamente
se usa el formato fasta (justo debajo del título y número de referencia de la secuencia se
encuentra)
Cuando se tiene la secuencia de nucleótidos del gen de interés se debe especificar en donde inicia
la secuencia codificante (CDS), está se encuentra en la página completa (formato genbank y no
fasta). Adicionalmente se indica también en el formato genbank la presencia de exones. En el
campo correspondiente al CDS se encuentra también un link (protein id) para ir a la página de la
secuencia de aminoácidos correspondiente al gen.
Definir la proteína de trabajo (los números de accesión de la secuencia de ADN o mRNA que
codifica la proteína y la secuencia de aminoácidos), junto con el nombre del plásmido de trabajo
(ver abajo la sección de base de datos vectores) y se debe enviar por e-mail.
Análisis de secuencias
Alineamientos
Alineamiento local: permite identificar similitudes de una secuencia establecida con las
secuencias depositadas en una base de datos universal
Clustal W
Permite identificar que enzimas de restricción cortan en determinada posición una secuencia de
ADN.
https://www.addgene.org/vector-database/
Seleccionar el plásmido de trabajo que presente MCS y enviar su nombre por e-mail junto con los
números de accesión de su ADN o mRNA y proteína de trabajo.
El plásmido escogido debe tener un MCS de por lo menos 5 enzimas de restricción y debe servir
para expresar proteínas.
http://emboss.bioinformatics.nl/