Está en la página 1de 9

Uso de técnicas computacionales, matemáticas y estadísticas para el análisis, interpretación y

generación de datos biológicos.

Se genera su desarrollo debido a que actualmente en Biología el número de datos es mucho mayor
a la capacidad de análisis del investigador

Características:

Interdisciplina y colaboración entre grupos.


Interoperatividad e interdependencia de los datos.
Formación de redes

¿Qué personas pueden hacer Bioinformática?

Necesario: Conocimiento y entendimiento del Dogma Central de la Biología molecular.


Conocimiento en Biología Molecular (bioquímica, biología molecular, biofísica molecular).
Muy recomendado: Conocimiento en el manejo de sistemas de cómputo.
Recomendado: Manejo básico de línea de comandos en ambientes UNIX (GNU/Linux).
Muy deseable: Experiencia con algún lenguaje de programación .
NCBI

National Center for Biotechnology Information (servidor ubicado en USA, pero que actualiza
información diariamente con el servidor EMBL de Europa y con el servidor DDBJ de Japón)

Posee una interfaz denominada Entrez que permite visualizar una sola búsqueda en muchas bases
de datos y acceder a muchas herramientas bioinformáticas.

Las recomendadas para el curso de biología para ingenieros químicos: Pubmed central,
Nucleotide, Protein, Blast, PubChem, Taxonomy. Conserved domains.

Ej: Buscar Nitrogenase

¿Cuántos resultados se tienen en cada uno de los anteriores ítems?


NUCLEOTIDE, PROTEIN, EST.

Nucleotide, al igual que protein y EST presenta el esquema anterior, el cual muestra:

Los resultados ordenados de forma alfabética indicando el origen (organismo o virus), la longitud
de la secuencia, tipo de secuencia, un número de acceso que empieza con dos letras del alfabeto y
es único para cada entrada (accession )., y un identificador secuencial de la base de datos GI que
se asigna a una nueva entrada, o modificación de un entrada antigua.

Un campo al lado superior (advanced) para limitar la búsqueda o filtros también para limitar la
búsqueda (lado izquierdo) y los organismos relacionados (parte derecha).

Ej: Buscar Nitrogenase tanto en nucleotide como protein

En el resultado de Nitrogenase en nucleotide filtrar con mRNA, y filtrar con Rhizobium como
organismo

¿Cuantos resultados se obtienen?

Por otro lado se puede limitar la buscada en advanced, incluir en esa búsqueda pero solo para el
titulo los términos nitrogenase y complete manteniendo el organismo Rhizobium pero ya sin tener
en cuenta mRNA

¿Cuantos resultados se obtienen?


TAXONOMY BROWSER

Menciona la clasificación taxonómica de los organismos, aunque no es la autoridad en el tema.

Indica las diferencias del código genético.

Muestra al lado derecho todas las demás entradas en Entrez para el organismo en cuestión.
Búsqueda de secuencias de interés

Se puede buscar en nucleotide o protein la secuencia del gen o proteína de interés, en el cso de
buscar por nucleotide se recomienda filtrar los reultados con mRNA pues si los resultados hacen
referencia a ADN genómico se presenta demasiada información dificultando encontrar el gen de
interés.

Con el resultado de la búsqueda avanzada en Entrez anterior seleccionar el número de accesión


EF165535.

Ya escogido el resultado específico, es decir ya teniendo una página con una secuencia con
número de accesión definida y para adquirir dicha secuencias de forma rápida y verla únicamente
se usa el formato fasta (justo debajo del título y número de referencia de la secuencia se
encuentra)

Cuando se tiene la secuencia de nucleótidos del gen de interés se debe especificar en donde inicia
la secuencia codificante (CDS), está se encuentra en la página completa (formato genbank y no
fasta). Adicionalmente se indica también en el formato genbank la presencia de exones. En el
campo correspondiente al CDS se encuentra también un link (protein id) para ir a la página de la
secuencia de aminoácidos correspondiente al gen.

Cuando se tiene la secuencia de aminoácidos y se quiere llegar a la secuencia de nucleótidos del


gen se busca el link del número de accesión localizado en el renglón DBsource (está casi al inicio de
la página en formato genbank). En caso de que la secuencia de nucleótidos que aparece es el
genoma completo del organismo, se debe buscar con el número de accesión de la proteína de
trabajo dentro de todo el genoma la secuencia que corresponde al gen (se debe tipear el número
con el teclado en el cuadro de búsqueda de la página web). Ya ubicado el gen darle click a gene y
en la parte inferior derecha seleccionar fasta o genbank para tener la información correspondiente
a solo ese gen.

NOTA PARA EL PARCIAL:

Definir la proteína de trabajo (los números de accesión de la secuencia de ADN o mRNA que
codifica la proteína y la secuencia de aminoácidos), junto con el nombre del plásmido de trabajo
(ver abajo la sección de base de datos vectores) y se debe enviar por e-mail.
Análisis de secuencias

Alineamientos

Alineamiento local: permite identificar similitudes de una secuencia establecida con las
secuencias depositadas en una base de datos universal

La interfaz se encuentra en el NCBI , permite identificar similitudes entre secuencias, en el caso de


proteínas el resultado indica dominios.
Alineamiento global: Dado un conjunto pequeño de secuencias relacionadas entre ellas
(seleccionadas luego de realizar un alineamiento local) permite establecer fragmentos de dichas
secuencias que son conservados o presentan alta similitud.

Clustal W

Análisis de sitios de restricción

Permite identificar que enzimas de restricción cortan en determinada posición una secuencia de
ADN.

Base de datos vectores

https://www.addgene.org/vector-database/

NOTA PARA EL PARCIAL:

Seleccionar el plásmido de trabajo que presente MCS y enviar su nombre por e-mail junto con los
números de accesión de su ADN o mRNA y proteína de trabajo.

El plásmido escogido debe tener un MCS de por lo menos 5 enzimas de restricción y debe servir
para expresar proteínas.

Software para procesar datos

Emboss explorer online

http://emboss.bioinformatics.nl/

CLC sequence viewer, descargable

También podría gustarte