Está en la página 1de 10

Herramientas Bioinformticas: Una Introduccin

Diego Antonio Leonardo Cabrejos

BLAST para identificar una protena


Obtenemos por Secuenciamiento parcial o completo la secuencia de aminocidos X . Esta secuencia la escribimos en formato FASTA. Ejemplo:
>Protena X
VIMAVSMEKKLHNATNYFLMSLAIADMLVGLLVMPLSLLAILYDYVWPLPRYLCPVWISLDVLFSTASIMHL CAISLDRYVAIRNPIEHSRFNSRTKAIMKIAIVWAISIGVSVPIPVIGLRDEEKVFVNNTTCVLNDPNFVLIGSF VAFFIPLTIMVITYCLTIYVLRRQALMLLHGHTEEPPGLSLDFLKCCKRNTAEEENSANPNQDQNARRRKKK ERRPRGTMQAINNERKASKVLGIVFFVFLIMWCPFFITNILSVLCEKSCNQKLMEKLLNVFVWIGYVCSGI

Ingresamos al servidor NCBI (www.ncbi.nlm.nih.gov/) y damos clic en BLAST (Se encuentra en la parte inferior de la pgina) Buscamos la opcin protein blast. Ingresamos la secuencia obtenida en formato fasta ( >). Debemos de escoger bajo que condiciones se trabajar como: Job title (nombre del anlisis); en Choose Search Set podemos escoger la base de datos con que se trabajar como el PDB, Swiss prot protein, etc. Adems del organismo con el que se realizar el blast entre otros. Y por ltimo escogeremos el algoritmo con el que se trabajar. Nosotros trabajaremos de moto automtico, es decir con las opciones ya sealadas por el servidor. *Por medio del algoritmo se analizarn todas las secuencias idnticas a la nuestra. Al final se mostrarn todas las secuencias que son idnticas a la nuestra mostrando adems el organismo de donde provienen y mucha informacin que con un anlisis minucioso nos puede dar valiosa informacin.

Una descripcin de la probabilidad de reconocimiento Indica el % de identidad. Qu significado tiene? La longitud determina el porcentaje de identidad, es decir la El alineamiento entre cuan semejante es secuencia problema y una a la secuencia de las secuencias idnticas reconocidas por el problema BLAST Al tener listo los parmetros damos clic en BLAST

Las lneas rojas representan las secuencias con las que coinciden

CLUSTAL para reconocer variabilidad entre secuencias

Ingresamos al servido NCBI y obtenemos las secuencias disponibles del receptor 5-HTR2c en formato FASTA.

Guardamos las secuencias en el Block de notas. (El block de notas quita el formato HTML de la web)

Ingresamos al servidor ClustalW2: http://www.ebi.ac.uk/Tools/msa/clustalw2/

Agregamos el archivo guardado (Examinar) y damos clic en Submit. Esperamos los resultados. En el anlisis debemos de tener en cuenta los smbolos: (*),(:), (.) y (-). El asterisco significa una identidad del 100% mientras que (:) indica que al menos un aminocido es diferente. El punto es un equivalente en la funcin ( una lisina por una arginina) y el guin indica un gap. Si queremos establecer vnculos entre especies, gneros por secuencias de aminocidos entonces tenemos que ver la proximidad entre las secuencias implicadas usando el rbol filogentico (opcin Guide Tree).

Las distintas opciones

Esto se observa en la parte inferior

Luego clic en Submit

Si ustedes han entendido las aplicaciones que les he mostrado ahora ustedes: Identifiquen a que protena corresponde la siguiente secuencia: GSGSQLFDHVAECLGDFMEKRKIKDKKLPVGFTFSFPCQQSKIDEAILITWTK RFKASGVEGADVVKLLNKAIKKRGDYDANIVAVVNDTVGTMMTCGYDDQ HCEVGLIIGTGTNACYMEELRHIDLVEGDEGRMCINTEWGAFGDDGSLEDI RTEFDREIDRGSLNPGKQLFEKMVSGMYLGELVRLILVKMAKEGLLFEGRITP ELLTRGKFNTSDVSAIEKNKEGLHNAKEILTRLGVEPSDDDCVSVQHVCTIVS FRSANLVAATLGAILNRLRDNKGTPRLRTTVGVDGSLYKTHPQYSRRFHKTL RRLVPDSDVRFLLSESGSGKGAAMVTAVAYRLAEQHRQIEETLAHFHLTKD MLLEVKKRMRAEMELGLRKQTHNNAVVKMLPSFVRRTPDGTENGDFLAL DLGGTNFRV Hagan un Clustal de al menos 12 secuencias de alfa amilasa de diferentes especies desde bacterias al hombre y determinen los aminocidos implicados en el sitio activo.

>Secuencia 1:
MGDVEKGKKIFIMKCSQCHTVEKGGKHKTGPNLHGLFGRKTGQAPGYSYTAANKNKGIIWGEDTLMEYLE

>Secuencia 2:
IPDGSEKGDFIALDLGGSSFRILRVQVNHEKNQNVHMESEVYDTPENIVHGSGSQLFDHVAECLGDFMEK RKIKDKKLPVGFTFSFPCQQSKIDEAILITWTKRFKASGVEGADVVKLLNKAIKKRGDYDANIVAVVNDTVG TMMTCGYDDQHCEVGLIIGTGTNACYMEELRHIDLVEGDEGRMCINTEWGAFGDDGSLEDIRTEFDRE

>Secuencia 3:
YLDMEYFGTIGIGTPAQDFTVVFDTGSSNLWVPSVYCSSLACTNHNRFNPEDSSTYQSTSETVSITYGTG SMTGILGYDTVQVGGISDTNQIFGLSETEPGSFLYYAPFDGILGLAYPSISSSGATPVFDNIWNQGLVSQ DLFSVYLSADDQSGSVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIVDTGT

>Secuencia 4:
VAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTPAVHASLDKFLASVSTVLTSK YR

También podría gustarte