Está en la página 1de 6

UNIPOT : www.pir.uniprot.

org

UniProt (de universalt protein) es el recurso de proteínas universalt conocido por ser un
repositorio central de datos sobre proteínas creado por la combinación de Swiss-Prot, TrEMBL
y PIRt. Esto lo ha convertido en el recurso líder mundial almacenando información sobre
proteínas.

UniProt consta de los siguientes componentes:

La base de conocimiento de UniProt (UniProtKB) es el centro central para la recopilación de


información funcional sobre proteínas, con una anotación precisa, consistente y rica. Además
de capturar los datos básicos obligatorios para cada entrada de UniProtKB (principalmente, la
secuencia de aminoácidos, nombre o descripción de la proteína, datos taxonómicos e
información de citas), se agrega tanta información de anotación como sea posible.

Los clústeres de referencia de UniProt (UniRef) proporcionan conjuntos agrupados de


secuencias de la base de conocimiento de UniProt (incluidas las isoformas) y los registros de
UniParc seleccionados. UniRef: clusters de proteínas similares para acelerar búsquedas: 50%,
90% ó 100% de similitud
UniParc es una base de datos completa y no redundante que contiene la mayoría de las
secuencias de proteínas disponibles públicamente en el mundo. Las proteínas pueden existir
en diferentes bases de datos fuente y en copias múltiples en la misma base de datos. UniParc
evita dicha redundancia almacenando cada secuencia única solo una vez y dándole un
identificador único y estable (UPI).

Un proteoma es el conjunto de proteínas que se cree que son expresadas por un organismo.
UniProt proporciona proteomas para especies con genomas completamente secuenciados.

Sobre los datos de apoyo:


Enfermedades: Las enfermedades humanas en las que están implicadas las proteínas se
describen en las entradas de UniProtKB con un vocabulario controlado.

Por defecto, la búsqueda de enfermedades buscará coincidencias en el nombre y la


descripción. Consultas de ejemplo para buscar enfermedades solo por nombre: nombre:
trastorno · nombre: síndrome.

Taxonomía: Los organismos se clasifican en una estructura de árbol jerárquica. Nuestra base de
datos de taxonomía contiene todos los nodos (taxón) del árbol.

Archaea · Bacteria · Eukaryota · Virus

Ubicaciones subcelulares: Consultas de ejemplo para buscar ubicaciones subcelulares solo por
nombre: nombre: "membrana celular"; nombre: "aparato de Golgi"

Base de datos de referencias cruzadas: La sección de referencias cruzadas de las entradas


UniProtKB muestra enlaces explícitos e implícitos a bases de datos tales como bases de datos
de secuencias de nucleótidos, bases de datos de organismos modelo y recursos de genómica y
proteómica. Una sola entrada puede tener referencias cruzadas a varias docenas de bases de
datos diferentes y tener varios cientos de enlaces individuales.

GENBANK: www.ncbi.nlm.nih.gov./Genbank/ base de datos de secuencia genética, colección


de secuencia de nucleótidos y sus traducciones
Aquí se presenta información referente a publicaciones de índole biomédica (1), de secuencias
de nucleótidos (2) y proteínas (3), y de la estructura tridimensional de moléculas (4).

1. ENLACES A PUBLICACIONES DE ÍNDOLE BIOMÉDICA.

Pubmed: comprende más de 24 millones de citas de la literatura biomédica, revistas de


ciencias biológicas, y los libros en línea.

Bookshelf: Proporciona acceso gratuito a textos en línea y documentos en ciencias de la vida y


de la salud.

PubMed Central: Es un archivo de revistas de carácter biológico y biomédico, de libre acceso, y


depositado en la Biblioteca Nacional de Medicina, de los Institutos Nacionales de Salud.

PubMed Health: Proporciona información a médicos y público en general sobre la prevención y


tratamiento de enfermedades y afecciones.

En el numero 1 podemos incluir los términos de búsqueda (generalmente, en inglés):


eukaryotic promoter organization, lo que nos da una relación de más de 250 artículos en los
que aparecen cualquiera de los términos anteriores, en el numero 2 podemos tenr una
búsqueda avanzada: tipo de artículo (revisiones, descripciones completas de un paciente o
enfermedad, carta, noticia, etc.), periodo de publicación en años, etc. etc.

2. BÚSQUEDA Y OBTENCIÓN DE SECUENCIAS NUCLEOTÍDICAS

El procedimiento es muy similar al indicado para buscar información en PubMed, sólo que
ahora se trabaja con una base de datos del NCBI diferente; en este caso será la base datos de
“Nucleotide”. En la página principal de NCBI pinchamos en el enlace correspondiente a
Nucleotide y entramos en la página inicial de NUCLEOTIDE.
Lo que se obtiene es una secuencia en formato FASTA, bien de nucleótidos o de aminoácidos.

3. BÚSQUEDA Y OBTENCIÓN DE SECUENCIAS DE PROTEÍNAS

El procedimiento de búsqueda es totalmente similar al anterior sólo que la base de datos del
NCBI sobre la que se ha de trabajar es la de “Protein”.

Lo que se obtiene:
4. BÚSQUEDA Y OBTENCIÓN DE ESTRUCTURAS TRIDIMENSIONALES

El punto partida para obtener la estructura tridimensional de macromoléculas es el enlace


“Domains & Structures” situado la página principal del NCBI, en la columna de la izquierda.

Estas dos bases de datos que vemos recuadradas en la figura, se refieren a la colección de
estructuras 3D de una serie de dominios de proteínas conservados a lo largo de la evolución
(CDD), y a la colección de estructuras 3D de macromoléculas. Búsqueda similar a las anteriores.

PROGRAMA DE VISUALIZACIÓN DE ESTRUCTURAS: Cn3D

La descarga del programa Cn3D se realiza desde la misma página “Domains & Structures”.

También podría gustarte