Está en la página 1de 105

Bioinformtica y Biologa Molecular Computacional

1 DE DICIEMBRE DA DEL QUMICO Felicidades estimados COLEGAS

Arcadio Maldonado Rodrguez

Qu es la bioinformtica?
Es el campo de la ciencia en la cual la biologa, las ciencias computacionales y la tecnologa de la informacin se unen para constituirse en una sola disciplina.
Objetivo Descubrir significados biolgicos en las macromolculas. Mediante El uso y desarrollo de algoritmos con los cuales evaluar relaciones significativas entre nuestra pregunta y la informacin contenida en en las bases de datos. Para Analizar e interpretar los datos generados.. Los datos y la consulta de la literatura cientfica pertinente, poder hacer inferencias y/o disear estudios especficos.

El desarrollo de las Computadoras


Primera generacin 1944 a 1956: Tubos de vaco Segunda generacin 1956 a1963: Transistores Tercera generacin 1964 a 1971: Circuitos integrados Cuarta generacin 1971 al presente: Microprocesadores Quinta generacin - Presente y futuro: Inteligencia Artificial

Fuente: http://www.webopedia.com/DidYouKnow/Hardware_Software/2002/FiveGenerations.asp

Las herramientas de Bioinformtica

Pueden

Las herramientas de Bioinformtica

Las herramientas de Bioinformtica


Antheprot Modeller DeepView StadenPackage SeqVerter Mega 3.1 RNA Draw Phylodraw Phylip ReadSeq Java

Las herramientas de Bioinformtica


Algunas caractersticas
Sin ellas no se podran hacer el anlisis de macromolculas in silico, ya que hacerlas manualmente es imposible. Le ahorran meses de trabajo de laboratorio. Pero, necesita saber qumica, bioqumica, biologa celular y molecular.

Biologa Celular y Molecular


Objetivo
Entender y manipular los procesos biolgicos, para explicar y aplicar la relacin entre la estructura y funcin de las macromolculas biolgicas.

Bases de Datos

Bases de Datos
Genmica Protemica

Genbank

Junio, 1994

Fuente: http://www.ncbi.nlm.nih.gov/

Los diez mandamientos cuando trabajamos con herramientas de Bioinformtica

01) Sus datos nunca estn seguros en la RED. 02) Registre el servidor, la base de datos y la versin del programa que us. 03) Anote cada paso que haya ejecutado. 04) Registre el nmero de identificacin de la secuencia estudiada. 05) Anote los parmetros de los programas. 06) Respalde sus resultados de la RED. 07) Use E-values para tomar sus decisiones durante sus trabajos. 08) Asegrese que usted pueda confiar en sus alineamientos. 09) Use diferentes programas para checar resultados dudosos. 10) No haga uso de mtodos no publicados. 11) Las bases de datos no son como el buen vino.

Recomendaciones y consejos prcticos

Haga ejercicios o trabajos cotidianamente. Si desconoce el significado de algo investguelo. Hay muchos programas de bionformtica conzcalos y aprenda su uso. Haga respaldos frecuentemente.

Sea ordenado y disciplinado.

Vocablos Tcnicos
FASTA BLAST SIMILITUD IDENTIDAD RECOMBINACIN HOMOLOGA
>Mus musculus AACTAACGCTATTATTGATACAGTTTCTGTAC TATATTGTAGTCACGGAGCATACAACAAAAG

Basic Local Alignment Search Tool

ALINEAMIENTO

BLAST NCBI

ALINEAMIENTO
LGPSSKQTGKGC-SRIWDN | | ||| | | LN-ITKSAGKGAIMRLGDA
GLOBAL

-------TGKG-------||| -------AGKG--------

LOCAL

ALINEAMIENTO
Gen araBAD araC lacI GalP2 trp trpR his hisA aroH deoP1 malK TnaA TTAGCGGATCCT GCAAATAATCAA GACACCATCGAA CACTAATTTATT TCTGAAATGAGC TGGGGACGTCGT ATATAAAAAAGT GATCTACAAACT GTACTAGAGAAC CAGAAACGTTTT CAGGGGGTGGAG AAACAATTTCAG Regin -35 ACCTGACGC TGTGGACTT TGGCGCAAA CCATGTCAC TGTTGACAA TACTGATCC TCTTGCTTT AATTAATAA TAGTGCATT ATTCGAACA GATTTAAGC AATAGACAA Regin -10 (Caja Pribnow) TTTTTATCGCAACTCTC TACTGT TTCTCCA TTCTGCCGTGATTATA GACACT TTTGTTA ACCTTTCGCGGTATGG CATGAT AGCGCC ACTTTTCGCATCTTTGT TATGCT ATGGT TTAATCATCGAACTAG TTAACT AGTACG GCACGTTTATGATATGC TATCGT ACTCTT CTAACGTGAAAGTGGTT TAGGTT AAAAGA ATAGTTAATTAACGCTCAT CATTGT ACAATG AGCTTATTTTTTTGT TATCAT GCTAAC TCGATCTCGTCTTGTGT TAGAAT TCTAA CATCTCCTGATGACG CATAGT CAGCC AAACTCTGAGTGTAA TAATGT AGCCTC inicio (+1) TAC CCGTTTTT CGC GTTTTTGT CGG AAGAGAGT TAT TTCATACC CAA GTTCACGT TAG CGAGTACA CAT CAGTTGAA AAC TGTACAAA CAC CCGGCGAG CAT ACGGTTGC CAT CATGAATG GTG TCTTGCG A 51 T C T T G A C A T 11-15pb T A T A A T 5-8pb C 55 G T 48

Secuencia consenso:

42 38 82 84 79 64 53 45 41

79 95 44 59 51 96

Regin -35

Caja Pribnow

42

Sitio de inicio

RECOMBINACIN

RECOMBINACIN

Anotacin
Locus
Palabras claves

No. de acceso
Referencias

Definicin
Comentarios

Registro de protena o DNA

Referencias
Origen

Caractersticas
Secuencia

Tamao y composicin

Margaret Oakley Dayhoff

En la dcada de los 60s ide las primeras tcnicas matemticas para analizar datos de secuencia. Desarroll tcnicas computacionales para reconstruir la secuencia de protenas a partir de la secuencia de fragmentos generados por los mtodos de digestin parcial (Ribonucleasa). Estableci el Atlas of Protein Sequence and Structure. Desarroll la Matriz de Porcentajes de Mutacin Aceptados (PAM) para evaluar la probabilidad de que un aminocido sea substituido por otro durante el transcurso de un proceso evolutivo.

Referencia: Doolittle R. F., et al (1983): Simian sarcoma virus onc gene, v-sis, is derived from the gene (or genes) coding a platelet-derived growth factor. Science, 221(4607):275-277.

R.F. Doolittle, realiz una bsqueda de similitudes entre la secuencia del PDGF y una base de da tos de protenas personal, encontrando concordancias entre esta secuencia y la del v-sis. Por los aos 70s se saba que el virus del sarcoma del simio causaba cncer en ciertas especies de primates. El oncogene responsable (v-sis) fue aislado y se determin su secuencia en 1983. Ese mismo ao se obtuvo la secuencia parcial del factor de crecimiento derivado de plaquetas (PDGF).

Cdigo Estndar del DNA

AAs

= FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG

Starts = ---M----------------M---------------M---------------------------Base1 = TTTTTTTTTTTTTTTTCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG Base2 = TTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGGTTTTCCCCAAAAGGGG Base3 = TCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAG

LIMN

NCBI
National Center of Biotechnology Information
National Library of Medicine National Institutes of Health

InterPro Home
Scan

Universal Fingerprint Cheap (UFC)


Emplea 15264 sondas de 13 mer

Objetivo
Identificar cualquier ser vivo de manera diferencial (aun sus variaciones).
Esta en fase de Prueba experimental del Gobierno de los EUA
Patente de Mexicanos registrada en EUA.

en la

Universidad de Thenesse con financiamiento

Buen Provecho Les agradezco su atencin

amiba@ucol.mx

También podría gustarte