Sequenciamento

1.1. Porque importante conhecer a sequncia de um gene?
Pesquisas com sequenciamento de DNA foram aceleradas depois do desenvolvimento do Mtodo de Sanger nos anos 70. Esta tcnica foi se tornando mais eficiente e automatizada possibilitando o mapeamento do genomas de milhares espcies desde bactrias at seres eucariotos. Ao sequenciar genes possvel fazer diagnstico molecular de um grande nmero de doenas hereditrias, entender a interao parasito-hospedeiro de doenas infecciosas, caracterizar microrganismos resistentes e at auxiliar na pesquisa de novas formas de tratamento e drogas para essas patologias. possvel identificar a filogenia do gene relacionando as espcies que possuem genes parecidos com o analisado e, consequentemente, onde podem ser encontradas protenas parecidas com a de interesse; possibilitando assim fontes diferentes que podem ser mais atrativas para, por exemplo, produzir essa protena em larga escala. 1.2. Vantagens e limitaes da anlise computacionais de sequncia. Utilizar bioinformtica para a anlise de sequencias gnicas possibilita o processamento de quantidades massivas de dados de forma muito mais rpida e precisa. So aplicados algortimos, bancos de dados, softwares, modelagem matemtica e estatstica, entre outras ferramentas para gerar informaes que podem ser mais facilmente manipulados e entendidas pelos usurios. Porm, existem ainda algumas limitaes nessas ferramentas. Por exemplo na tcnica de sequenciamento shotgun ainda preciso aperfeioar o processo de juno dos fragmentos que muito complexo em genomas grandes, o humano pode levar vrios dias.A disseminao dessas tecnologias fez tambm com que o nmero de informao publicado seja to grande que pesquisas redundantes acabam desperdiando tempo e esforo acadmico. preciso melhorar a interao da comunidade cientfica para evitar essas perdas. Os programas existentes tambm so incapazes de diferenciar as reiges intron e xon do DNA eucarioto, dificultando a anlise de DNA codificador eficiente.
A sequncia analisada foi a sequncia 3:
tccccgccgtgttcgacgccttcagcgagtaccggctgggcggcacccacatgtcgaagaccggactggaggtcgtgaagcgcctg ctctccggcgaggccgtgacccaggaggccagcggcctgtccaagcgcgaatggcgggagctgatggaccagctcggccgcgcc gagtaacgcccgttccaatcttcgaaggatcaccgccatgacgccgcccccgatgactccgcacgaggccgatggacttcaccgcca gggtctcgtcgcggcgcaggccgggcggttcgacgaggcgctggagctgatcgggcgggccatcgccgcctatccctcggtcccc gtctggtgggccaactatgggctggtgatggaaagcctgggcgacgtcgccggggcggccaacgcctatgccggggcgctgaacc tcgatccgtcgctggagatggcgatggacgggctgctctccatggcggaggcggtgcgccgggccggcgattcggcccgcgcgga ggccttcttccgccgtgccatcgcgctgaacccgaagacgctggtggccgttgccaatctgggcgtgctgctgcgcgcccaggcgcg gcgggcggaggcggtgacgctctatgagagggccgggcggctcgatccggccaactgggcgcacccctacaacctcggcaacgc gctggccgaaatgaaccggctgggcgaggccgacgacgcctatggggcggcgctcgccctggcgccgggccgggcggaggtgc gggcgaaccgcgccacccgcgtgctcgccatgcaggggcgggcggcggaggccctagcggaaatcgaagccgtggtggcgcag cacggcaccgtcgattcgctgcacgcctcgcgcctctacctgatgcagttcgtgccggggttggccatgccggccatcgcccaggcc cacgcggattggggcgcccgctaccccgaccgcccggcgcccgcggtggccgctccggccccgaagatccgcatcggctatgtct cgccggacttccgcgcacaccccgtgggcttcttcctggagccggtgctggcgaaccacgaccgctcggccttcgaggtcgtctgct atgccaacaccgccaacccggactggaagaccgagcggctgatggcccacgccgaccactgggtctggaccaccggcatggacg acgcggctctggcccagcgcatccaggcggacggcatccacatcctggtcgatctggccggccagaccttcggcaaccgcctgccg gtcttcgcacgccgcgcggcgccggtgcaggcgacctgggcgggctatgtcggcaccaccggcctgccggccatggactatctgat ttccgattcgcggcagagcccgccgggatcggacggctggtgcatcgagggcgtcgtgcgcatgcccgacgcctacgtcccctggg cgccgcccgaggacgcgccggccgtggctccgctgccgctggtgacgcgcggccacaccaccttcgggtctttcaacgcgctgcc caagctgaacgcggaagtcgcggcgctgtgggcgcgcgtgctgggcgccgtccccggttcccgcctgctgctgcgcacgccgggg ctggacgacgccggcaccgccgcgcgcacgctggccctgttcgaacgggccgggctggacccggcgcgggtcgatctgcgggg cggggcgccgcaccgggagttcctggccggctatggggaggtcgacgtggcgctcgacccctttccctattccggcggtctgacga ctttggaggcgctgtggatgggcgtgccggtggtgacgctggacggcgaccgcttctgcgcccgccattcggtgacgcacctcgcct cggcggggttgtccgatctggtggccgacggaccggacggctacgttgccaaggcggcggcgctggtggccgacccggcggtgct ggcggccctgcgcggcgggctgcgggaccggctggcggcatccccggcgctgaacggcgtgcgcttcacccgcgcgctggagg ccgccttcggcgtgatgtggcagcgcttccaggccgggcaggggcgggcgagcttcgccctcagtttcgactgaagaggatcaggc gcgctccgaccccggcgcgccggtgctccacagcagccccagcaccacgcccttgcagcgcggcagcagcaggccggtcagca acagggtcagcaacggccagatggtgagatgcacccaggtcgccggctcgtagcgctgctcgaccgacagcaccgccgggatgat gatgtggccgacgatcaggatggtcatccagggcggggcgtcgtcggcgcgcagatggccgaacgcctcgccgcaatgggcgca gtggtcgaccggcttcaggtagttccgcagcaggcgcccgcgtccgcaggccgggcattgccccatcagcccgcgcacgccgccg tcgtcttcgaccgcgcgccgtcctgagtgccgtcttccaccgtcctgtcttccgccgtcatgaccgtacctctgcgatccgctccccgaa gggcctcatatggggagggagcgaccgatcgtcacgccgttccgtcgcccgcaccccggggttgcgccgcgcgcagggcctccac gcggcgggcgatgttctccagccgcatctgaagctcatgggcgcacagcgcgtgcgcggcggcgcgggcctccgcctcgatgtcg gcgatggcggattcgagggcttggagtcgggcgtggagtcgggcgtcgtgcgggtcttcgctcatcggattcctgctccggcagttga cggaccggcccctgggcgtctacgggatgcacaaaccccctccgggagcctggagccatgacgatcacccgcctgtttctcgccgc cgccacagcggctgtcgcgctgaccagcgccgccgccttcgcccagaccaagaccgtcgcgatcaccgccatcgtcgagcatccg gcgctggacgccacgcgcgacggcgtgatcgaggcgctgaaggccgcgggctacacgccgggtgacaccctgaaggtcgagca gagcgcccagggcaaccccgcgaccgccgcgcagatcgcgcgccagttcgccggcgcccgtccggacgtgatcgttccgatctcc accccctccgcccaggccgtcgtcgcctcga
Anlise da Sequncia: Inicialmente foi utilizado o programa Frameplot 2.3.2 para identificar as possveis ORFs (open reading frame), que so as regies da sequncia onde existe maior possibilidade de se codificar uma protena. O programa utiliza a procura por codons iniciadores e de parada
para localizar as ORFs assim como avaliar a porcentagem Guanina e Citosina. Essas bases possuem trs pontes de hidrognio entre elas, e portanto esto mais fortemente ligadas e so mais estveis. O resultado encontrado no Frameplot est na Figura 1.
2. Anlise da seqncia e construo de plasmdio virtual(Programas (~5 pg 70 pontos) 2.1. Identificador de ORF (p.ex. Frameplot) 2.2. BlastP (procura em banco de dados) ORF1- (1426. .2115) 230 aa vermelha1 do meio 3rd-Letter GC: 92.2% Base Composition: 65 A 248 C 273 G 107 T
Protena :glycosyltransferase and TPR domains
ORF2 -
(223. .2115) 631 aa primeira vermelha1 3rd-Letter GC: 91.6% Base Composition: 225 A 679 C 713 G 279 T
ORF3:(2874. .3185) ultima azul1
3rd-Letter GC: 92.4% Base Composition: 47 A 131 C 96 G 41 T
2.3. Clustal (compara 2 ou mais seqncias permitindo a identificao de resduos conservados e permite inferir filogenia) orf1 orf2 orf3
2.4. String (anlise vizinhana do gene) orf1 Tetratrico peptide repeat (TPR) 2.5. Mapa de restrio (encontre um programa) A enzima Sgr AI corta a 1299 e a 2149 deixando a orf 1 intacta, assim como a parte anterior orf que contem stios importantes para a expresso da protena. 2.6. Identificao de promotores (compare com sequencia consenso) promotores previstos =0 2.7. Identificao de terminadores ???? 2.8. Identificao de sitio de ligao de ribossoma 2.9 Descrever a organizao do fragmento de sequencia com uma figura mostrando os motivos estruturais identificados (promotores, RBS, terminadores, stio de ligao de fatores de transcrio, etc) 2.9 Descrever estratgia de clonagem para expressar a protena do fragmento (se houver mais de um gene, escolher e justificar a escolha), com estratgia de triagem clones, protocolo de transformao, etc. Preparar figura mostrando um esquema do plasmdios que seria obtido incluindo stios de restrio relevantes, origem de replicao, posio do gene, marcador de seleo, etc. 3. Funo do gene ou operon (mesmo que parcial) (2-3 pg 20 pontos) 3.1. Importncia fisiolgica do produto do gene. A heterogeneidade fenotpica do sistema sangneo ABO devido diferena estrutural do gene das glicosiltransferases, que so responsveis pela transferncia dos resduos especficos de acar, a13-N-acetil-galactosamina transferase ou a 1 3-N-galactosil transferase ao substrato H, e os convertem ao antgeno A ou B respectivamente.5,6,7,8,9 As glicosiltransferases so enzimas que catalisam as reaes de transglicolizao entre o substrato aceptor e o acar receptor. A ao das transferases nessas reaes depender de sua estrutura conformacional que permitir ou no sua ligao ao substrato. A atividade das glicosiltransferases dos antgenos A e B varia nos diversos subgrupos do sistema ABO. A sua heterogeneidade tem sido confirmada constantemente e suas diferenas podem ser refletidas na composio bioqumica dos antgenos produzidos.13 O grupo sangneo AB apresenta a atividade das duas transferases (A e B), enquanto que o grupo O no possui as transferases A e B, mas apresenta o antgeno H em grande quantidade na superfcie das hemcias.
Glycosiltransferases esto envolvidas na biosntese de cadeiais glicosdicas lineares e ramificada, pricipalmente as do complexo de Golgi. Elas adicionam monossacardeos, um por vez em posies especficas de precursores formando intermedirios sintticos. Elas tambm atuam secretando os novos glicoconjugados sintetizados no Complexo de Golgi para o Retculo Endoplasmtico.
3.2. Outros genes relevantes que podem fazer parte do operon ou vizinhana 3.3 Se disponvel, fentipo do mutante em outros organismos 4. Referncias http://www.unigran.br/interbio/vol4_num2/arquivos/editorial.pdf http://www.fea.br/Arquivos/Biotecnologia/Material%20Prof%20Cristina%20%20Biologia%20Molecular/sequenciamento_DNA_metodos_e_principios.pdf 5. Figuras e tabelas obtidas durante a anlise da seqncia.
putative ABC brasilense Sp245] transporter; substrate-binding component [Azospirillum
ORF1 3rd-Letter GC:92.2% Base Composition: 65 A, 248 C, 273 G, 107 T
>f1_(1426. .2115) 230 aa 17-Dec-2011 MPDAYVPWAPPEDAPAVAPLPLVTRGHTTFGSFNALPKLNAEVAALWARV LGAVPGSRLLLRTPGLDDAGTAARTLALFERAGLDPARVDLRGGAPHREF LAGYGEVDVALDPFPYSGGLTTLEALWMGVPVVTLDGDRFCARHSVTHLA SAGLSDLVADGPDGYVAKAAALVADPAVLAALRGGLRDRLAASPALNGVR FTRALEAAFGVMWQRFQAGQGRASFALSFD
ORF2 3rd-Letter GC: 91.6% Base Composition: 225 A, 679 C, 713 G, 279 T >f1_(223. .2115) 631 aa 17-Dec-2011 MTPHEADGLHRQGLVAAQAGRFDEALELIGRAIAAYPSVPVWWANYGLVM ESLGDVAGAANAYAGALNLDPSLEMAMDGLLSMAEAVRRAGDSARAEAFF RRAIALNPKTLVAVANLGVLLRAQARRAEAVTLYERAGRLDPANWAHPYN LGNALAEMNRLGEADDAYGAALALAPGRAEVRANRATRVLAMQGRAAEAL AEIEAVVAQHGTVDSLHASRLYLMQFVPGLAMPAIAQAHADWGARYPDRP APAVAAPAPKIRIGYVSPDFRAHPVGFFLEPVLANHDRSAFEVVCYANTA NPDWKTERLMAHADHWVWTTGMDDAALAQRIQADGIHILVDLAGQTFGNR LPVFARRAAPVQATWAGYVGTTGLPAMDYLISDSRQSPPGSDGWCIEGVV RMPDAYVPWAPPEDAPAVAPLPLVTRGHTTFGSFNALPKLNAEVAALWAR VLGAVPGSRLLLRTPGLDDAGTAARTLALFERAGLDPARVDLRGGAPHRE FLAGYGEVDVALDPFPYSGGLTTLEALWMGVPVVTLDGDRFCARHSVTHL ASAGLSDLVADGPDGYVAKAAALVADPAVLAALRGGLRDRLAASPALNGV RFTRALEAAFGVMWQRFQAGQGRASFALSFD ORF3 3rd-Letter GC: 92.4% Base Composition: 47 A, 131 C, 96 G, 41 T >f3_(2874. .3185) 104 aa 17-Dec-2011 MTITRLFLAAATAAVALTSAAAFAQTKTVAITAIVEHPALDATRDGVIEA LKAAGYTPGDTLKVEYQSAQGNPATAAQIARQFAGARPDVIVPISTPSAQ AVVA ORF4 3rd-Letter GC: 97.0% Base Composition: 24 A, 67 C, 72 G, 38 T
>f1c_(2325. .2128) 66 aa 17-Dec-2011 MTILIVGHIIIPAVLSVEQRYEPATWVHLTIWPLLTLLLTGLLLPRCKGV VLGLLWSTGAPGSERA
REFERNCIAS http://www.scielo.br/scielo.php?script=sci_arttext&pid=s1516-84842003000100008 http://www.ncbi.nlm.nih.gov/books/NBK20718/

Sequenciamento

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Sequenciamento

Cargado por

Copyright:

Formatos disponibles

1.1. Porque importante conhecer a sequncia de um gene?

A sequncia analisada foi a sequncia 3:

ORF3:(2874. .3185) ultima azul1

3rd-Letter GC: 92.4% Base Composition: 47 A 131 C 96 G 41 T

ORF1 3rd-Letter GC:92.2% Base Composition: 65 A, 248 C, 273 G, 107 T

>f1_(1426. .2115) 230 aa 17-Dec-2011 MPDAYVPWAPPEDAPAVAPLPLVTRGHTTFGSFNALPKLNAEVAALWARV LGAVPGSRLLLRTPGLDDAGTAARTLALFERAGLDPARVDLRGGAPHREF LAGYGEVDVALDPFPYSGGLTTLEALWMGVPVVTLDGDRFCARHSVTHLA SAGLSDLVADGPDGYVAKAAALVADPAVLAALRGGLRDRLAASPALNGVR FTRALEAAFGVMWQRFQAGQGRASFALSFD

>f1c_(2325. .2128) 66 aa 17-Dec-2011 MTILIVGHIIIPAVLSVEQRYEPATWVHLTIWPLLTLLLTGLLLPRCKGV VLGLLWSTGAPGSERA

REFERNCIAS http://www.scielo.br/scielo.php?script=sci_arttext&pid=s1516-84842003000100008 http://www.ncbi.nlm.nih.gov/books/NBK20718/

También podría gustarte