Documentos de Académico
Documentos de Profesional
Documentos de Cultura
navegador de
Ensembl
genome
INTRODUCCIÓN
¿Por qué necesitamos navegadores genómicos?
• 1977: primer genoma en ser secuenciado (5 kb)
• 2004: secuencia humana terminada (3 Gb)
¿QUÉ ES ENSEMBL?
§ Ensembl es un proyecto que trata de "desarrollar un sistema
de software que produzca y mantenga anotaciones
automáticas en genomas seleccionados".
§ Toda la información y software generados en el proyecto es de
libre uso y acceso.
www.genome.ucsc.edu
www.ncbi.nlm.nih.gov/genome/gdv/
www.ensembl.org
www.ensemblgenomes.org
ENSEMBL - Características
§ Información genéticas para > 200 especies.
§ Árboles filogenéticos.
§ Información regulatoria (ENCODE).
§ Variantes y VEP.
§ Visualización de los datos del usuario.
§ BioMart (exportación de datos).
§ Acceso programático a través de las APIs.
§ Completamente de código abierto (Open source).
Especies de vertebrados
en ENSEMBL
No vertebrados en
ENSEMBL Genomes
http://ensemblgenomes.org/
Bacterias Protistas
99
(Enero 2020)
Ensamblado de Genomas
GENOMA
“ADN dentro de la célula”
La actualización
Tutoriales de las principales
más reciente y
Lista de todas las especies características de ENSEMBL
sus novedades
cuyo genoma está disponible
Versiones previas
Click en “humano”
Ya en humanos…
Información y
estadística
Novedades
Cada taxa tiene con
un código de color
diferente…
Bacterias Protistas
Información de
la web
Buscar por especie
Novedades
Información de
la web
Buscar por especie
Novedades
Overview de la región
Herramientas
Información de la región en
detalle (ampliado)
Haplotipos y Bandeo
Nuestra posición
parches cromosómico
Cada bloque
representa
genes (leyenda
abajo)
Transcriptos
forwards
Leyendas
Genes y
Transcriptos
Intrón,
Forward strand
Intrón, Exón,
Exón, NO Reverse strand codificante
codificante
Transcripto NO codificante
Unión de transcripto
Transcripto codificante
Anotación ENSEMBL -
AUTOMÁTICA MANUAL
“Golden transcripts”
§ Se denominan “transcriptos dorados” a aquellos que poseen
anotación idéntica en y
§ Los modelos de transcripción se comparan y fusionan cuando
su estructura de “splicing” es idéntica.
§ Si los extremos difieren entre los dos modelos, se utilizan
aquellos anotados en
§ Alta calidad y confiabilidad.
Anotación AUTOMÁTICA de Genes
http://training.ensembl.org/events
Transcriptos MANE
(Matched Annotation from the NCBI and EBI)
http://training.ensembl.org/events
Visualización de Genes
Exón, codificante Exón, NO codificante
Intrón
http://training.ensembl.org/events
¿Cuál transcripto debería usar?
http://training.ensembl.org/events
Ejemplo • Vamos a buscar el gen ESPN en Humanos.
http://training.ensembl.org/events
Ejemplo • Vamos a buscar el gen ESPN en Humanos.
Resultados
Filtros Links
http://training.ensembl.org/events
Qué puedo hacer con ese gen en Ensembl?
Ventana del Gen
Localización
Con que FENOTIPOS
está asociado este gen
Información (ej: enfermedades)
general del gen Cuántos Transcriptos
tiene este gen
Visualización
http://training.ensembl.org/events
Qué puedo hacer con ese gen en Ensembl?
Tabla de
transcriptos
Transcriptos
forwards
La barra azul es
el genoma
Transcriptos http://training.ensembl.org/events
reverse
Opciones: BLAST o descargar la sec.
Región upstream
Links a las
diferentes
variantes
Predicción del efecto y posición de las
variantes, relativo a la estructura del transcripto
Más información:
https://www.ensembl.org/info/genome/variation/prediction/predicted_data.html
Si quieren ver cuál es la función
de ese gen, en donde participa
(lugar de la célula) y proceso
biológico en el que está
involucrado…
¿Por qué GO (Gene Ontology)?
http://training.ensembl.org/events
Los términos GO son jerárquicos
http://training.ensembl.org/events
• Volvamos al gen ESPN… ahora queremos encontrar
Ejemplo información sobre él y sus transcriptos.
Categorías de
GO: lugar de la
célula donde
actua este gen
Evidencia
Categorías de
GO: Función
molecular
Categorías de
GO: proceso
biológico
• Si buscamos información sobre dónde se expresa dicho
Ejemplo gen…
Tejidos
Experimentos
Nivel de expresión
Tejidos
Experimentos
Nivel de expresión
Tabla de
transcriptos
Evidencias
Evidencia
Evidencia ENSEMBL VERDE: Sec. flanqueantes Exon
HAVANA
GRIS: Intrón
Protein summary
Click en…
cDNA
Protein summary
http://www.ensembl.org/info/genome/variation/species/sources_documentation.html
Proyecto HapMap
§ Genotipado de 1301 individuos de 11 poblaciones.
Proyecto 1000 Genomas
§ Secuenciación de 2500 individuos con una cobertura 4X.
“Variation consequences”
§ Para cada variante que se asigna al genoma de referencia,
ENSEMBL identifica todas las transcripciones superpuestas.
§ Se predicen los efectos que cada alelo puede tener en cada
transcripto.
“Consequence terms”
§ Conjunto de términos definidos por “Sequence Ontology” (SO),
para facilitar la comparación cruzada en las anotaciones.
Ejemplo • Vamos a buscar el gen MCM6 en Humanos.
• Vean la secuencia.
http://training.ensembl.org/events
Ejemplo • Vamos a buscar el gen MCM6 en Humanos.
• Vean la secuencia.
http://training.ensembl.org/events
Click en…
Filtros
Evidencia de la variante
(mover cursor)
http://training.ensembl.org/events
Filtrar por término de
“Consequences”
http://training.ensembl.org/events
Click en…
Pequeñas SVs se
muestran en forma
independiente
http://training.ensembl.org/events
Click en…
Fenotipo asociado con el gen
http://training.ensembl.org/events
Ejemplo • Vamos a buscar la variante (SNP) rs4988235 en Humanos.
http://training.ensembl.org/events
Información de la variante
Diferentes
opciones con Iconos de variantes. Los
inf. variantes números indican que
tienen información
http://training.ensembl.org/events
http://training.ensembl.org/events
Gráficos de las
frecuencias alélicas
http://training.ensembl.org/events
Ejemplo • Vamos a buscar una enfermedad (Huntington disease) en
Humanos.
• Trataremos de identificar genes (y sus variantes)
asociados con esta enfermedad.