Documentos de Académico
Documentos de Profesional
Documentos de Cultura
APLICACIN DE HERRAMIENTAS
BIOINFORMTICAS EN EL ESTUDIO DE LAS
ENFERMEDADES GENTICAS HUMANAS
INTRODUCCIN
Tradicionalmente, la investigacin en Biologa Molecular se ha realizado en el
laboratorio experimental, pero la inmensa cantidad de datos generados en los ltimos
aos con la conclusin del Proyecto Genoma Humano y desarrollo subsiguiente de
otros grandes proyectos de genotipado (HapMap Project, 1000 Genomes Project)
destinados a explorar la relacin entre variantes genticas y la predisposicin a las
enfermedades, diagnstico y respuesta a los frmacos, requiere el desarrollo de
herramientas computacionales que permitan extraer toda la informacin contenida en
las bases de datos para generar nuevo conocimiento. Conjuntamente los continuos
avances tecnolgicos en la Biologa Molecular, unidos al desarrollo informtico, han
aumentado las posibilidades de conocer el funcionamiento de los seres vivos a nivel
molecular y celular. Es necesario unificar toda esta informacin para alcanzar un
cuadro completo de la biologa de la clula para comprender cmo se alteran distintos
procesos en distintas enfermedades. Por eso, hoy en da es difcil entender la
investigacin en el rea de las enfermedades genticas humanas sin la Bioinformtica.
Segn la definicin del National Center for Biotechnology Information (NCBI) la
Bioinformtica es la disciplina cientfica que combina biologa, computacin y
tecnologas de la informacin. El objetivo de esta disciplina es investigar y desarrollar
herramientas tiles para llegar a entender el flujo de informacin. Inicialmente, la
bioinformtica se ocupaba sobre todo de la creacin de bases de datos de informacin
biolgica, especialmente secuencias, y del desarrollo de herramientas para la
utilizacin y anlisis de los datos contenidos en esas bases de datos. La
Bioinformtica ha ido evolucionando para ocuparse cada vez con mayor profundidad
del anlisis e interpretacin de los distintos tipos de datos (secuencias de genomas,
proteomas, dominios y estructuras de protenas, etc).
Para qu se utilizan las bases de datos? Las bases de datos utilizadas en
biologa molecular son archivos de datos que provienen de diferentes reas
almacenados de modo eficaz y uniforme y de uso pblico para la comunidad cientfica.
Hay que tener en cuenta los siguientes aspectos:
-
Curso Mitolab-Ciberer 09
BASES DE DATOS
Curso Mitolab-Ciberer 09
portal
del
genoma
de
gusano
C.
elegans:
Curso Mitolab-Ciberer 09
de
PROSITE/PRINTS:
Curso Mitolab-Ciberer 09
Curso Mitolab-Ciberer 09
de DNA que afecta a una sola base de una secuencia del genoma. Sin embargo,
algunos autores consideran que cambios de unos pocos nucletidos, como tambin
pequeas inserciones y deleciones pueden ser consideradas como SNP. Una de estas
variaciones debe darse al menos en un 1% de la poblacin para ser considerada como
un SNP. Los SNP forman hasta el 90% de todas las variaciones genmicas humanas,
y aparecen cada 100 a 300 bases en promedio, a lo largo del genoma humano. Dos
tercios de los SNP corresponden a la sustitucin de una citosina por una timina.
a) Single Nucleotide Polymorphism: dbSNP:
http://www.ncbi.nlm.nih.gov/projects/SNP/
Herramientas de bsquedas de SNPs funcionales:
Pupasuite: http://pupasuite.bioinfo.cipf.es/
F-SNP: http://compbio.cs.queensu.ca/F-SNP/
SYSNPs: http://www.sysnps.org
HERRAMIENTAS
Alineamientos globales y locales de secuencias. Alineamientos mltiples usando
Clustalw http://www.ebi.ac.uk/Tools/clustalw2/index.html en el EBI (leer antes el tutorial
sobre ClustalW disponible en: http://www.ebi.ac.uk/2can/tutorials/protein/clustalw.html
Bsqueda de secuencias en bases de datos mediante alineamientos (bsqueda de
secuencias similares): http://blast.ncbi.nlm.nih.gov/Blast.cgi y todas sus variantes
explicadas
en
la
gua
de
seleccin
de
programas:
http://www.ncbi.nlm.nih.gov/BLAST/producttable.shtml
Curso Mitolab-Ciberer 09
OBJETIVOS
El objetivo de esta prctica es la utilizacin de las herramientas bioinformticas para la
exploracin del genoma humano y para la bsqueda de informacin relacionada con
enfermedades genticas. Para ello se plantean los siguientes objetivos especficos:
-
PRCTICA
Actividades 1-6: Exploracin de bases de datos biolgicos y comparacin
de secuencias. En estas actividades exploraremos varias bases de datos de
secuencias de DNA, de protenas y de genomas. A partir de secuencias
annimas de DNA realizaremos bsquedas en las bases de datos, por
ejemplo para identificar con que tipo de gen o protena estamos trabajando.
Realizaremos alineamientos de secuencias y bsquedas de secuencias
homlogas. Imparte: Eva Richard
Actividades 7-9: Anlisis de secuencias de DNA. Se analizarn distintas
secuencias de DNA de pacientes con enfermedades metablicas hereditarias
y se identificarn las mutaciones aprendiendo las normas para su
nomenclatura. Realizaremos un estudio del efecto de mutaciones de splicing
y de polimorfismos. Imparte: Lourdes Ruiz.
Las bases de datos de cidos nucleicos y protenas son prcticamente las mismas en
las 3 instituciones, ya que intercambian registros cada 24 horas. Las tres bases de
datos se diferencian en los distintos servicios que ofrecen, y en el modo en que se
ofrecen dichos servicios.
Hay muchas formas de realizar una bsqueda en GenBank. Se puede hacer usando
slo texto o calificadores. La bsqueda es altamente sensitiva a lo que se escriba, es
decir, a tu "query".
Curso Mitolab-Ciberer 09
OMIM (Online Mendelian Inheritance in Man), que refleja estudios sobre las
causas moleculares de las enfermedades humanas.
Curso Mitolab-Ciberer 09
Curso Mitolab-Ciberer 09
10
Curso Mitolab-Ciberer 09
http://www.uniprot.org/uniprot/P22033
Ejercicio 6.1. Calcula el peso molecular y el pI de la protena methylmalonic aciduria
cblB
type
human
(MMAB),
con
la
base
de
datos
de
http://www.expasy.ch/tools/pi_tool.html
Ejercicio 6.2. Predice el pptido lder de la secuencia de la protena methylmalonic
aciduria
cblB
type
human
(MMAB)
con
la
base
de
datos
de
http://www.cbs.dtu.dk/services/SignalP/
Existe otra web que es especfica de pptido seal de protenas mitocondriales:
MITOPROT http://ihg2.helmholtz-muenchen.de/ihg/mitoprot.html
Existe
una
base
de
datos
http://www.signalpeptide.de/index.php?m=intro
de
los
pptidos
lderes:
Nomenclatura de mutaciones:
Cada tipo de mutacin requiere una definicin precisa del cambio predecible a nivel de
protena, a nivel del DNA genmico y del mRNA, si corresponde. Las normas
internacionales
de
nomenclatura
de
mutaciones
se
recogen
en:
http://www.hgvs.org/mutnomen/ . En el caso de sustituciones de aminocidos se utiliza
normalmente el cdigo de una letra para stos, apareciendo primero el cdigo del
aminocido que cambia, la posicin y el aminocido mutante con una p. delante para
indicar que se trata de la nomenclatura a nivel de protena (p. ej. p.R176L, indica un
cambio de arginina por leucina en la posicin 176 de la protena). En el caso de
11
Curso Mitolab-Ciberer 09
Nombre sistemtico
Efecto
Insercin
p.K452fsinsA
c.1355insA
Delecin
p.P211fsdelC
p.Y198fs
c.632delC
c.593_641del22pb
c.1315+1ga
12
Curso Mitolab-Ciberer 09
para
13
Curso Mitolab-Ciberer 09
Ejercicio 8.1: Analiza las secuencias 3 y 5 de splicing del exn 11 con los programas
1, 2, 3 Tienen un score alto, es decir, son buenas secuencias para ser reconocidas
por la maquinaria de splicing?. Analiza la secuencia 3 de splicing con las mutaciones
IVS10-3g>c y IVS10-11g>a. Qu efecto ves sobre el score?. Qu ocurre con la
mutacin IVS10-11g>a?.
Ejercicio 8.2: Analiza la mutacin IVS10-3g>c con el programa 4. Qu efecto
predice?.
Ejercicio 8.3: Analiza con los programas 5 y 6 el cambio c.1155G/C (L385L) en el
mismo exn 11, para analizar si podra afectar al splicing (ya que no cambia aa).
Ejercicio 9.1: Analiza los SNPs anotados en el gen MMAB utilizando el ENSEMBL y el
servidor SYSNPs: http://www.sysnps.org/, que utiliza la informacin integrada de las
siguientes bases de datos (ltima versin actualizada): Ensembl 53, Hapmap release
24, Haploview 4.1 y Pupasuite. Abrir la pgina del servidor Pupasuite
http://pupasuite.bioinfo.cipf.es/
para ver las opciones de asignacin de funciones a los SNPs.
Qu efecto predice el programa para cada SNP?. Estn validados los SNPs?.
Cuntos tag-SNPs hay?.
14