Está en la página 1de 42

Introducción a la Bioinformatica

Universidad Nacional Mayor de San Marcos


Facultad de Farmacía y Bioquímica

INTRODUCCIÓN A LA
BIOINFORMÄTICA

CHRISTIAN SOLIS CALERO


Biofaral@hotmail.com

Lima- Perú
2005
Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú
Facultad de Ciencias Biológicas. UNMSM, Junio 2005
Introducción a la Bioinformatica

INDICE
• Introducción
• Bioinformática
• Dominio de
aplicación
• Áreas de interés
• Tecnologías base
• Perspectivas

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

INTRODUCCIÓN

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

ERA GENÓMICA

ACTCGTCGTCGTCAATCCCGA
CTCGTCGTCGTCAATCCCGGT
ACTCGTCGTCGTCAATCCCGA
ACTTCGACGTCACTGCGTACT
CTCGTCGTCGTCAATCCCGGT
ACTCGTCGTCGTCAATCCCGA
TCGACGTCACTGCACTCGTCG
ACTTCGACGTCACTGCGTACT
CTCGTCGTCGTCAATCCCGGT
ACTCGTCGTCGTCAATCCCGA
TCGTCAATCCCGGTACTTCGA
TCGACGTCACTGCACTCGTCG
ACTTCGACGTCACTGCGTACT
CTCGTCGTCGTCAATCCCGGT
CGTCACTGCACTCGTCGTCGT
TCGTCAATCCCGGTACTTCGA
TCGACGTCACTGCACTCGTCG
ACTTCGACGTCACTGCGTACT
PDB
NR CAATCCCGGTACTTCGACGTC
CGTCACTGCACTCGTCGTCGT
ACTGC
TCGTCAATCCCGGTACTTCGA
TCGACGTCACTGCACTCGTCG
CAATCCCGGTACTTCGACGTC
CGTCACTGCACTCGTCGTCGT
ACTGC
TCGTCAATCCCGGTACTTCGA
CAATCCCGGTACTTCGACGTC
CGTCACTGCACTCGTCGTCGT
ACTGC
CAATCCCGGTACTTCGACGTC
ACTGC

Secuencias de DNA Estructuras de Proteínas


(16 770 000 registros) (18 283 registros)
EBI
>3913308-
Steroldemethylase
>3913308- MSAVALPRVSGGH
DEHGHLEEFRTDPIGLMQRVRDECGDVGTFQLAGKQ
Steroldemethylase
>3913308- MSAVALPRVSGGH
VVLLSGSHANEFFFRAGDDDLDQAKAYPFMTPIFGE
DEHGHLEEFRTDPIGLMQRVRDECGDVGTFQLAGKQ
GVVFDASPERRKEMLHNAALRGEQMKGHAATIEDQV
Steroldemethylase
>3913308- MSAVALPRVSGGH
VVLLSGSHANEFFFRAGDDDLDQAKAYPFMTPIFGE
RRMIADWGEAGEIDLLDFFAELTIYTSSACLIGKKF
DEHGHLEEFRTDPIGLMQRVRDECGDVGTFQLAGKQ
GVVFDASPERRKEMLHNAALRGEQMKGHAATIEDQV
SteroldemethylaseMSAVALPRVSGGH
RDQLDGRFAKLYHELERGTDPLAYVDPYLPIESFRR
VVLLSGSHANEFFFRAGDDDLDQAKAYPFMTPIFGE
SWISS RRMIADWGEAGEIDLLDFFAELTIYTSSACLIGKKF
DEHGHLEEFRTDPIGLMQRVRDECGDVGTFQLAGKQ
RDEARNGLVALVADIMNGRIANPPTDKSDRDMLDVL
GVVFDASPERRKEMLHNAALRGEQMKGHAATIEDQV
RDQLDGRFAKLYHELERGTDPLAYVDPYLPIESFRR
VVLLSGSHANEFFFRAGDDDLDQAKAYPFMTPIFGE
IAVKAETGTPRFSADEITGMFISMMFAGHHTSSGTA
RRMIADWGEAGEIDLLDFFAELTIYTSSACLIGKKF
RDEARNGLVALVADIMNGRIANPPTDKSDRDMLDVL
MED
PROT GVVFDASPERRKEMLHNAALRGEQMKGHAATIEDQV
SWTLIELMRHRDAYAAVIDELDELYGDGRSVSFHAL
RDQLDGRFAKLYHELERGTDPLAYVDPYLPIESFRR
IAVKAETGTPRFSADEITGMFISMMFAGHHTSSGTA
RRMIADWGEAGEIDLLDFFAELTIYTSSACLIGKKF
RQIPQLENVLKETLRLHPPL
RDEARNGLVALVADIMNGRIANPPTDKSDRDMLDVL
SWTLIELMRHRDAYAAVIDELDELYGDGRSVSFHAL
RDQLDGRFAKLYHELERGTDPLAYVDPYLPIESFRR
IAVKAETGTPRFSADEITGMFISMMFAGHHTSSGTA
LINE
RQIPQLENVLKETLRLHPPL
RDEARNGLVALVADIMNGRIANPPTDKSDRDMLDVL
SWTLIELMRHRDAYAAVIDELDELYGDGRSVSFHAL
IAVKAETGTPRFSADEITGMFISMMFAGHHTSSGTA
RQIPQLENVLKETLRLHPPL
SWTLIELMRHRDAYAAVIDELDELYGDGRSVSFHAL
RQIPQLENVLKETLRLHPPL

Secuencias-aminoácidos Bibliografia (documentos)


(109 798 registros) (10 millones)

ERA POST-GENÓMICA

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

¿Qué hacer ante esa información?

Enfoque
Traditional Enfoque a gran
•Consume escala
tiempo –Rápido
•Labor- –Eficiente
Intensiva
•Costoso –Económico
•Enfocado a –Basada en
la molécula Modelos
•Intuitivo –Sistematizado

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

Bioinformatica en las Noticias

Proteomica?
Genomica?
Bioinformatica?
Qué significa?
Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú
Introducción a la Bioinformatica
Qué es la Bioinformática?

Bioinformatica = Biología + Tecnología de la


Informacion

La Biología se está convirtiendo en una


Ciencia Informática?

Los métodos computacionales son


necesarios para analizar una
cantidad masiva de información que
proviene de los proyectos genómicos
y proteómicos.

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

BIOLOGÍA

Física &
La Química, 1950s
Bioinformática
es parte de una
nueva Biología Molecular
revolución en la Bioquímica
Biología Biofísica

Informática &
Estádistica, 1970s

BIOINFORMATICA

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

Bioinformática...

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica
Qué es la Bioinformática?
Respuesta fácil -
Usar computadoras para
resolver problemas
biológicos

Respuesta complicada -
Técnicas computacionales para
manejar y análizar datos biológicos
y obtener conocimiento.

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

Biología in silico
in vivo, in vitro, …….. in silico

La Bioinformatica no es precisamente almacenar


información en el computador, o hacer más
rápido el procesamiento de datos en Biología

Con la bioinformatica, tu puedes hacer Hipótesis


Biológicas y probarlas in silico

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

Tradicionalmente...

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

Un Bioinformático simplemente...

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

La Bioinformática comprende tres subespecialidades:

-Desarrollo de Bases de datos / Dataminig


-Redes de Información
BIOINFORMATICA -Desarrollo de software para el procesamiento
de la información (imágenes)

Modelización y Simulación
BIOLOGIA !Sistemas de Vida Artificial
COMPUTACIONAL !Algoritmos genéticos
!Redes de neuronas artificiales

Sistemas computacionales basados en modelos


y materiales biológicos
BIOCOMPUTACIÓN
!Biochips
!Biosensores
!Algoritmos
!Redes neuronales
genéticos
!Computadoras basadas en DNA

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

DOMINIO DE APLICACIÓN

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica
A nivel de DNA

Secuenciadores Cromatogramas
Secuencias

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


AIntroducción a la Bioinformatica
nivel de Proteína

>3913308-Sterol 14-alpha demethylase- (P450-14DM)


Secuencia MSAVALPRVSGGHDEHGHLEEFRTDPIGLMQRVRDECGDVGTFQLAGKQVVLLSGSHANE
FFFRAGDDDLDQAKAYPFMTPIFGEGVVFDASPERRKEMLHNAALRGEQMKGHAATIEDQ
de VRRMIADWGEAGEIDLLDFFAELTIYTSSACLIGKKFRDQLDGRFAKLYHELERGTDPLA
Aminoácidos YVDPYLPIESFRRRDEARNGLVALVADIMNGRIANPPTDKSDRDMLDVLIAVKAETGTPR
A) FSADEITGMFISMMFAGHHTSSGTASWTLIELMRHRDAYAAVIDELDELYGDGRSVSFHA
LRQIPQLENVLKETLRLHPPLIILMRVAKGEFEVQGHRIHEGDLVAASPAISNRIPEDFP
DPHDFVPARYEQPRQEDLLNRWTWIPFGAGRHRCVGAAFAIMQIKAIFSVLLREYEFEMA
QPPESYRNDHSKMVVQLAQPACVRYRRRTGV

ATOM 1 C ORG 1 0.506 -0.466 0.058 0.00 0.00


ATOM 2 C ORG 1 0.788 0.741 0.980 0.00 0.00
ATOM 3 C ORG 1 1.474 0.563 2.203 0.00 0.00
Estructura ATOM 4 C ORG 1 1.827 1.659 3.008 0.00 0.00
ATOM 5 C ORG 1 1.537 2.965 2.585 0.00 0.00
3D ATOM 6 C ORG 1 0.912 3.166 1.345 0.00 0.00
(Formato ATOM
ATOM
7
8
C
C
ORG
ORG
1
1
0.561
-0.620
2.065
-0.165
0.545
-0.950
0.00
0.00
0.00
0.00
PDB) ATOM 9 C ORG 1 -0.536 -0.528 -2.311 0.00 0.00
ATOM 10 C ORG 1 -1.604 -0.303 -3.195 0.00 0.00
ATOM 11 C ORG 1 -2.796 0.271 -2.728 0.00 0.00
ATOM 12 C ORG 1 -2.915 0.607 -1.371 0.00 0.00

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

Estructura 3D de
Proteina del
Estructuras
Mycobacterium
Secundarias
tuberculosis

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción
Información a lade
Bioinformatica
Expresión: MICROARRAYS

Información de
Intensidades en
cada chip de DNA
por cada spot

Estádistica

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción
Información a lade
Bioinformatica
Expresión: PROTEÓMICA
Información de
Intensidades en
cada spot del gel

pI, PM,
secuencias
N-terminal

Bases de
Db
Datos

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

¿Dónde esta
esa
información?

Bases de Datos
Biológicas

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

http://www.ncbi.nlm.nih.gov/

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

http://www.ddbj.nig.ac.jp/

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

http://srs.ebi.ac.uk/

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

http://www.ebi.ac.uk/

EBI

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

Información actualizada
(GenBank)

Crecimiento
del GenBank

Year Base Pairs Sequences

2004 44,575 ’745,176 40’604,319

Revised: February 16, 2005.

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

Información
actualizada (Pdb) Crecimiento de PDB

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

Datos del día


PDB Holdings List:
31-May-2005

Molecule Type
Proteins,
Protein/Nucleic
Peptides, and Nucleic Acids Carbohydrates Total
Acid Complexes
Viruses
X-ray
Diffraction 24574 1172 806 11 26563
and other

NMR 3791 114 653 2 4560

Total 28365 1286 1459 13 31123

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

ÁREAS DE INTERÉS

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica
Tópicos en Bioinformatica

Biología Computational

Aplicaciones Post-genómicas:
Bioinformatica y medicina
Bioinformatica y biodiversidad
Bioingenieria
Expresión geníca
Redes de genes (Gene Network)
Análisis de secuencias
Bioinformática estructural
Redes de estructuras (Structure Network)
Evolución Molecular
Gene finding.
Etc, etc…

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica
¿Aplicaciones en la Biotecnología?

La Biotecnología al igual que la Bioinformática no es una


Ciencia, sino un conjunto de aplicaciones de
conocimientos procedentes de distintas áreas de las
ciencias y las ingenierías para la manipulación de los
organismos vivos con fines de interés humano.

Es una tecnología horizontal, ya


que la Biotecnología se aplica a
distintos sectores económicos,
tan diversos como la Sanidad
Humana y Animal, Suministros
para la Industria, la Agricultura y
Energético, entre otros.

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica
Datos

INVESTIGACIÓN BIOINFORMÁTICA
BIOTECNOLÓGICA

Genómica Data mining

Algoritmia
Transcriptómica •Gene Finding
•Predicción de estructuras 3D

Proteómica •Búsqueda de mótivos


•Alineamiento Múltiple
•Filogenía molecular
Metabolómica
Desarrollo de la
Celómica estadística

Conocimiento
Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú
Introducción a la Bioinformatica

TECNOLOGÍAS BASE

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica
Procesamiento Computacional

Procesamiento Procesamiento Procesamiento de


de SEÑALES de DATOS CONOCIMIENTO

MUESTRAS DATOS INFORMACION PREDICCION

Secuencia de Secuencia Secuencia de Estructura 3D


nucleótidos correspondiente aminoácidos de Proteína
(DNA) a un gen

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

Gestión de Datos:

Bases de datos;

Mediación-Integración de
bases de datos.

Reconocimiento de patrones.

Aprendizaje Automático
(machine learning):

Redes Neuronales,

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

Estadística:

Sistemas Expertos;

Minería de datos biológicos y


Texto;

Procesamiento de Imagen.

Procesamiento de Señales.

Computación de alto
rendimiento: Paralelismo y
mallas.

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica
Un Ejemplo....
Minería de datos
Definición del Base de Selección
problema Datos de datos

Preprocesamiento

Análisis

Descubrimiento Interpretación y
generación de
de conocimiento conocimiento

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción
LIMITES DE a laLA
Bioinformatica
BIOINFORMÁTICA

-Data Mining
-Bases de datos relacionadas
•Secuencias de nucleótidos y de
Demasiada proteínas
•Vías metabólicas
Información •Referencias Bibliograficas
-Software especilaizado en linea

-Incrementar las velocidades de los


ordenadores (Se requieren grandes
Velocidad de las capacidades de cálculo)
Computadoras -Algoritmos eficientes
-Clusters de Computadoras

- Nuevos Algoritmos
*Agrupamineto de datos
(clustering)
Capacidad Predictiva *Tamizaje de datos
discutible -Desarrollo de la estadística
-Mejora de la tecnología experimental

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

PERSPECTIVAS

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción
RECURSOS a laGENÉTICOS
Bioinformatica

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

El Primer paso.....
- Generación de Marcadores
Moleculares
- Información de secuencia

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú


Introducción a la Bioinformatica

AGRADECIMIENTOS

Universidad Internacional de Centro


Anadalucía Internacional de la Papa

Por: CHRISTIAN SOLIS CALERO – Centro Internacional de la Papa – Lima - Perú

También podría gustarte