Está en la página 1de 11

22/11/2011

Localizacin y enmascaramiento de secuencias repetidas. RepeatMasker


En genomas eucariotas, las zonas de secuencias repetidas es poco probable encontrar elementos reguladores y secuencias codificantes. Las zonas de secuencias repetidas pueden ser entonces descartadas a la hora de ejecutar otros tipos de anlisis, o enmascaradas, mediante la sustitucin de los caracteres que representan los cuatro nucletidos por otro smbolo arbitrario, por ejemplo "N" o "X".

Programas para localizar y modelar genes


1) Mtodos ad hoc de seales o motivos (Signalbased methods) Estos mtodos se basan en la identificacin de motivos de secuencia caractersticos de los elementos que forman parte de los genes, tales como promotores, codones de inicio y terminacin, sitios de procesamiento del ARN (en Eucariotas), terminadores de transcripcin (en Procariotas), etc.

22/11/2011

Programas para localizar y modelar genes


2) Mtodos de comparacin. Bsqueda en bases de datos de secuencias expresadas
dbEST http://www.ncbi.nlm.nih.gov/dbEST Standford SOURCE http://smd.stanford.edu/cgibin/source/sourceSearch

Gene prediction methods Based on similarity

Abril et al., 2003

22/11/2011

Comparisons of Genomes at Different Phylogenetic Distances Objetivo Genoma humano vs. Fugus rubripes: Caracterizar secuencias no codificantes altamente conservadas en genomas de vertebrados. Divergimos de un ancestro comn hace 450 millones de aos, por ello consideran que secuencias conservadas en ambos sern probablemente fundamentales para la vida en vertebrados.

Hardison RC (2003) Comparative Genomics. PLoS Biol 1(2): e58

Human-Mouse-Fugu Sequence Comparison


Over 1,000 human/mouse CNS (Conserved non-coding sequences)

1,500 Kb

DACH

Human-Mouse: >1,000 CNS

Human-Fugu: 13 CNS

Fugu:
5 Kb

Dachshund

30 Kb

22/11/2011

Programas para localizar y modelar genes


2) Mtodos de comparacin. Bsqueda en bases de datos de secuencias expresadas
BLAST (NCBI), varios programas para buscar secuencias relacionadas en bases de datos de proteinas y de secuencias de ADN, incluyendo ESTs. Procrustes (USC), modelizacin de genes en eucariotas mediante el "spliced alignment algorithm", que utiliza la secuencia aminoacdica de protenas similares (homlogas) a las que codifica la secuencia genmica analizada, para reconstruir la estructura de genes en cuanto a intrones y exones.

Programas para localizar y modelar genes


2) Mtodos de comparacin. Programa Procrustes
El programa Procrustes est diseado para intentar deducir la estructura de un gen, en cuanto a intrones y exones, basndose en la secuencia de aminocidos de una serie de protenas homlogas a las que supone est codificada por el fragmento de ADN que se est analizando. La secuencia de dichas protenas homlogas tiene que ser facilitada por el usuario del programa, que podra haberlas identificado mediante bsquedas con BLASTX, por ejemplo. Si la secuencia aminoacdica facilitada es la que codifica el fragmento de ADN, Procrustes es capaz de reconstruir la estructura del gen con un 99% de exactitud.

22/11/2011

Programas para localizar y modelar genes


2) Mtodos de comparacin. Programa Procrustes

http://www.ebi.ac.uk/Tools/Wise2/advanced.html GeneWise or Wise2 Program has an exhaustive (slow) algorithm to align a protein to a DNA sequence, allowing for splice site recognition.

Genome Databases
Ensembl (EBI)
http://www.ensembl.org/index.html

Map viewer (NCBI)


http://www.ncbi.nlm.nih.gov/mapview/

UCSC Genome Browser


http://genome.ucsc.edu/cgi-bin/hgGateway

Son herramientas de visualizacin No sacas conclusiones, simplemente integrna en forma grfica toda la informacin que se posee sobre una regin, dejando la exploracin y la interpretacin al usuario.

22/11/2011

~ 50 species

mRNA and protein sequences from Interpro and NCBI RefSeq are aligned to the genome. For some species such as human, Ensembl includes manual curated transcripts from the Vega-Havana project. Also available: -Sequence variations -Comparative genomics -Functional genomics Search for gene region, probeset or disease (Hugo Gene Nomenclature Committee)

22/11/2011

The human genome is housed at the CRG Genome Reference Consortium http://www.ncbi.nlm.nih.gov/projects/genome/assembly/grc/

Bioinformtica Tema 2

Ensembl

Bioinformtica Tema 2

22/11/2011

CDKN2B gene

Identifiers: ENSG gene ENST transcript ENSP protein ENSE exon ENSR regulatory elements

CCDS Consensus CoDing Sequences

Bioinformtica Tema 2

22/11/2011

Bioinformtica Tema 2

Bioinformtica Tema 2

22/11/2011

Ensembl

CDKN2B gene

Bioinformtica Tema 2

Configure this page

Bioinformtica Tema 2

10

22/11/2011

Bioinformtica Tema 2

Bioinformtica Tema 2

http://www.ensembl.org/Help/Movie?id=188

11

También podría gustarte