Está en la página 1de 5

Práctica 1. Teoría y programas utilizados.

EMBL: (Base de datos)


 Mantiene la gama más completa del mundo de recursos de datos
moleculares actualizados y de libre disponibilidad.
https://www.ebi.ac.uk/

NCBI: (Base de datos)


 Alberga una serie de bases de datos relevantes para la biotecnología y la
biomedicina y es un recurso importante para las herramientas y servicios de
bioinformática.
 Las principales bases de datos incluyen GenBank para secuencias de ADN
y PubMed, una base de datos bibliográfica para la literatura biomédica.
 Otras bases de datos incluyen la base de datos NCBI Epigenomics. Todas
estas bases de datos están disponibles en línea a través del motor de
búsqueda Entrez.
https://www.ncbi.nlm.nih.gov/

Bioedit: (Programa)
 Es un editor de alineación de secuencias
 Está destinado a proporcionar un programa único que pueda manejar la
mayoría de las funciones simples de edición y manipulación de secuencias
y alineación que los investigadores probablemente realicen diariamente, así
como algunos análisis básicos de secuencias.
http://webcache.googleusercontent.com/search?
q=cache:ipA2MKX8MFEJ:www.mbio.ncsu.edu/BioEdit/page2.html+&cd=2&hl=es-
419&ct=clnk&gl=mx

Quick Go (Ontología génica y anotaciones GO) alias AmiGO2


 Es un navegador rápido basado en la web de los datos de anotación Gene
Ontology y Gene Ontology.
 Nos da información de su ontología génica: La función molecular de los
productos génicos, su rol en los procesos biológicos de múltiples
direcciones y su localización en componentes celulares.
 La segunda parte es la anotación, la caracterización de los productos
génicos usando términos de la ontología. Los miembros del Consorcio GO
(GO Consortium en inglés) entregan su información y se hace disponible
públicamente a través del sitio web GO.
 Cada término GO consiste en un único identificador alfanumérico, un
nombre común, sinónimos (si son de aplicación), y una definición. Cuando
un término tiene múltiples significados dependiendo de las especies, el GO
usa una etiqueta "sensu" para diferenciarlos entre ellos. Los términos son
clasificados en solo una de las tres ontologías, las cuales están
estructuradas, cada una de ellas, como un grafo dirigido acíclico.
https://www.ebi.ac.uk/QuickGO/

UniProt:
 Es proporcionar a la comunidad científica un recurso integral, de alta
calidad y de libre acceso de secuencia de proteínas e información funcional.
https://www.uniprot.org/

Visor de datos del genoma:


 Es un navegador genómico que admite la exploración y el análisis de
ensamblajes de genomas eucarióticos RefSeq.
 Permite a los usuarios visualizar diferentes tipos de datos asociados a la
secuencia en un contexto genómico.
 El visor de datos del genoma también es utilizado por diferentes recursos
de NCBI, como GEO, para mostrar conjuntos de datos asociados con
experimentos específicos o muestras en un contexto de navegador
genómico. Las notas de la versión están disponibles para cada versión del
navegador, que describen nuevas características y correcciones de errores.
https://www.ncbi.nlm.nih.gov/genome/gdv/
Pfam:
 Es una gran colección de familias de proteínas, puede realizar búsqueda
por familia, entrada, clan, ver secuencia, estructura o por clave.
 Nos brinda información sobre la familia a la que pertenece una secuencia.
 Pfam es una base de datos de familias de proteínas que incluye sus
anotaciones y alineaciones de secuencias múltiples generadas utilizando
modelos ocultos de Markov .
http://pfam.xfam.org/

InterPro:
 InterPro es un recurso que proporciona análisis funcional de secuencias de
proteínas clasificándolas en familias y prediciendo la presencia de dominios
y sitios importantes.
 Para clasificar las proteínas de esta manera, InterPro utiliza modelos
predictivos, conocidos como firmas, proporcionados por varias bases de
datos diferentes (denominadas bases de datos miembro) que conforman el
consorcio InterPro
https://www.ebi.ac.uk/interpro/about/interpro/

SCOPe:
 Casi todas las proteínas tienen similitudes estructurales con otras proteínas
y, en algunos de estos casos, comparten un origen evolutivo común.
 La base de datos SCOP, creada mediante inspección manual e impulsada
por una batería de métodos automatizados, tiene como objetivo
proporcionar una descripción detallada y completa de las relaciones
estructurales y evolutivas entre todas las proteínas cuya estructura se
conoce.
 Proporciona una encuesta amplia de todos los pliegues de proteínas
conocidos, información detallada sobre los parientes cercanos de cualquier
proteína en particular y un marco para futuras investigaciones y
clasificaciones.
https://scop.berkeley.edu/
Ensembl:
 Exportar funciones o secuencias directamente desde páginas web
 Extraiga datos de nuestra base de datos pública utilizando scripts de
Perl
 Minería de datos utilizando la herramienta BioMart
 Descarga FTP de conjuntos de datos completos
 Acceda a los datos de nuestro servidor REST utilizando cualquier
lenguaje de programación
 El proyecto Ensembl produce bases de datos del genoma para
vertebrados y otras especies eucariotas, y hace que esta información
esté disponible gratuitamente en línea.
http://www.ensembl.org/index.html

PANTHER: (Geneontology)

 El sitio PANTHER tiene información de función integral sobre genes, y fue


diseñado para facilitar también el análisis de grandes cantidades de
genes. Para obtener más información sobre las relaciones de datos, visite
la figura "Resumen de datos de PANTHER". Las herramientas y los datos
del sitio PANTHER se pueden usar para:

 Obtener información sobre un gen de interés

 Explorar familias de proteínas, funciones moleculares, procesos


biológicos, componentes celulares y vías.

 Generar listas de genes que pertenecen a una familia o subfamilia de


proteínas dada, tienen una función molecular determinada o
participan en un proceso o ruta biológica dada, por ejemplo, generan
una lista de genes candidatos para una enfermedad.

 Analizar una lista de genes, proteínas o transcripciones según


categorías basadas en la familia, la función molecular, el proceso
biológico, el componente o la vía celular, por ejemplo, analice datos
de microarrays de ARNm.

http://www.pantherdb.org/

Clustal Omega:
 Es un programa de alineación de secuencias múltiples que utiliza
árboles guía sembrados y técnicas de perfil-perfil HMM para generar
alineaciones entre tres o más secuencias.
 Produce alineamientos de secuencias múltiples biológicamente
significativas de secuencias divergentes.
 Las relaciones evolutivas se pueden ver a través de Cladogramas o
Filogramas.
https://www.ebi.ac.uk/Tools/msa/clustalo/

ClustalW
 Es un programa de alineación de secuencia múltiple de propósito
general para ADN o proteínas.
 DDBJ proporciona tanto la última versión como la versión original de
DDBJ
http://clustalw.ddbj.nig.ac.jp/

También podría gustarte