Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ingeniería Genética.
INTEC: Nombre:
EXPLORANDO NCBI
Pero tienes que saber a) lo que estás buscando, y b) lo que estás buscando para obtener
algo de estas bases de datos. Esto es lo que este primer laboratorio te va a ayudar a
hacer. Tenga en cuenta que Google y otros motores de búsqueda generalmente no
indexan sitios web basados en bases de datos, por lo que no se puede usar para buscar
información almacenada en NCBI.
El portal principal para acceder a los datos en NCBI se llama GQuery. Pero primero,
comencemos visitando el sitio web de NCBI y examinando la interfaz, que sufre uncambio
constante.
Figura 2. La página del portal Buscar bases de datos NCBI con bacterias utilizadas como palabra de
búsqueda.
3. Por lo general, al buscar en estas bases de datos, tiene una región de ADN o una
proteína (o función de proteína) de interés. Para este laboratorio, utilizará un gen de
Arabidopsis thaliana, una pequeña planta con flores que es como la mosca de la fruta del
mundo vegetal, ya que tiene un ciclo de vida comparativamente rápido y requiere poco
espacio para crecer. El producto proteico de este gen se registra bajo el número de acceso
NP_001318308, y es una ligasa E3, implicada en la ubiquitinación de las proteínas, que es
una señal para su degradación.
4. Vuelva a la página del portal NCBI GQuery e intente una búsqueda más enfocada.
Utilice los términos de búsqueda encontrados asociados con la secuencia de genes que
usaremos con los calificadores de campo de GenBank que se muestran a continuación (se
presenta una lista completa de calificadores en el Apéndice 1). Pruebe las cuatro
búsquedas diferentes que se presentan a continuación:
• palabras clave de genes
por ejemplo, constituyente estructural del ribosoma
• palabra clave de gen Y organismo
por ejemplo, constituyente estructural del ribosoma Y Arabidopsis thaliana
Además, el uso de comillas también puede afectar dramáticamente su búsqueda (es decir:
16s rRNA vs. "16s rRNA").
5. Busque su número de acceso dado a través de la página del portal GQuery (por ejemplo,
NP_001318308 desde arriba). Debería darle un golpe de secuencia de proteínas. Haga
clic en él y en el siguiente enlace para obtener su descripción completa de GenBank.
...
• Si es así, ¿puede encontrar la adhesión para la secuencia completa o uno de los cromosomas?
Si, es posible encontrar la secuencia.
Para obtener mucha más información sobre la estructura del archivo GenBank en
http://www.ncbi.nlm.nih.gov/Sitemap/samplerecord.html
• ¿Cuáles son los nombres de los genes que lo rodean (contexto genómico)?
• ¿En qué proceso biológico (términos de ontología génica) está involucrado este
gen (de nuevo, desplácese hacia abajo)?
Figura 5. Página de GenBank Gene para AT2G28830.
10. En la página De genes, también hay otros enlaces (ver la barra lateral a la derecha)
para examinar más a fondo la estructura, función y relaciones filogenéticas de un gen.
• Haga clic en Enlaces adicionales. un. ¿Qué tipo de información le dice esta sección?
• Vuelva a la página Gen y haga clic en Map Viewer en el menú Información
relacionada.
• Utilice el selector en el lado izquierdo de la pantalla para acercar y alejar. Desplácese
a lo largo del genoma para ver el orden de los genes. Use la etiqueta de locus del gen
(que se encuentra en la página Gen) para encontrar su gen de esta manera utilizando
la función de búsqueda. NCBI parece haber hecho que el nivel de zoom
predeterminado sea tal que solo vea el gen. Puede desplazarse a lo largo del genoma
haciendo clicen las pequeñas flechas hacia arriba y hacia abajo en la parte superior e
inferior del gráfico del genoma Genes_seq .
• Haga clic en la pequeña caja negra señalada por la etiqueta de locus del gen.
b. ¿Cuántos exones ves en este gen? Consejo: esto también se puede
determinar a partir de la entrada del visor de secuencias de la página Gene...
¿Cuántas barras verdes hay?
Vuelva al Visor de mapas.
Haga clic y explore la variedad de formas en que los datos están
interconectados y se muestran (no se preocupe, no puede romper nada).
Figura 6. Visor de mapas NCBI para parte del cromosoma 2 de Arabidopsis thaliana.
Tenga en cuenta que es muy importante entender que estas son solo suposiciones, y hay
muchas razones e instancias en las que estas suposiciones resultan ser falsas. Sinduda, son
un punto de partida razonable.
Definiciones:
• Secuencias similares : secuencias que comparten un número significativo de
residuos (nucleótidos o aminoácidos). Las secuencias pueden ser similares debido a
la homología o simplemente por casualidad. Cuanto mayor sea la similitud entre las
secuencias, más probable es que sean homólogas.
• Secuencias homólogas: secuencias que se relacionan a través de la ascendencia
común. La homología es cualitativa: dos secuencias están o no relacionadas a través
de la ascendencia común. Las secuencias homólogas pueden variar mucho en su
nivel de similitud
– del 100% al 0%.
• Secuencias ortólogas: secuencias que se relacionan a través de un evento de
especiación pasado. Se supone que las secuencias ortólogas comparten
funciones comunes.
• Secuencias parálogas : secuencias que están relacionadas a través de un evento de
duplicación de genes pasado. Los genes a menudo divergen en función después de
la duplicación; por lo tanto, no se supone que las secuencias parálogas compartan
una función común.
• Secuencia de consultas: su secuencia; la secuencia sobre la que está interesado
en encontrar más.
• Par de segmentos de alta puntuación (HSP): 'visitas' a la base de datos. Una
coincidencia de subsecuencia entre la secuencia de consulta y una secuencia
de base de datos devuelta por BLAST.
• Alineación local : una alineación de secuencia que se extiende solo a través
de una parte de la secuencia.
• Alineación global : una alineación de secuencia que se extiende a lo largo de
toda la secuencia (de extremo a extremo).
• Intente hacer clic en el enlace Gen. ¿La página de genes le da la secuencia de genes
sola? ¿Qué obtienes en su lugar? Tenga en cuenta los menús de enlace específicos del
contexto que aparecen cuando pasa el cursor sobre el gráfico del gen con el puntero del
mouse. Puede hacer clic en el icono en el pop
menú para obtener enlaces a varias secuencias y análisis asociados con el gen. Tenga en
cuenta que la pista verde es un compuesto de las pistas de ARNm y CDS: haga clic en el
número NM_ o NP_ para ver la deconvolución de la pista verde (Figura 8).
Figura 8. Parte de la página Gene para NP_001318308, que muestra ventanas emergentes para
secuenciar enlaces.
a. Dados tus conocimientos de biología, ¿por qué crees que estos son diferentes?
Porque son totalmente diferentes, se trata de ADNr y el otro es un aminoacido.
b. Una vez más, ¿por qué son diferentes? Consejo: recordemos el Dogma Central de la Biología
Molecular.
A pesar del tamaño que posea el gen, existen regiones codificantes como nucleótidos, y a pesar de que
ambos se encuentran en el gen, estos no son lo mismo.
Figura 9. Registro de GenBank para NM_128442 ARNm (registro incompleto).
2. Hagamos un poco de BLASTing. Utilice el vínculo Ejecutar BLAST en la parte "Analizar esta
secuencia" de la página web. [O abra una nueva pestaña o ventana en su navegador y
vuelva a la página de inicio de NCBI (www.ncbi.nlm.nih.gov), luego seleccione BLAST en el
menú desplegable Recursos en la parte superior, en la subsección DNA &RNA ].
Hay muchas opciones aquí. Discutiremos algunos de estos próximos laboratorios, pero
ahora mismo trabajemos con los más simples. Queremos hacer una explosión de
nucleótidos.
• En la página BLAST, tenga en cuenta que en la sección Introducir secuencia de
consulta, el sistema NCBI ha introducido automáticamente el número de acceso (pero
también puede introducir un número gi o secuencia FASTA). También puede copiar y
pegar la secuencia de ARNm de FASTA formatted que encontró en el paso anterior en el
cuadro de consulta.
Figura 11. La página de consulta blastn , con la optimización para "Secuencias algo
similares" seleccionada.
• Escanee las secciones de la página. Tiene bastante control sobre cómo se ejecuta el
algoritmo (especialmente si hace clic en Parámetros del algoritmo cerca de la parte
inferior.
• Queremos consultar la base de datos completa del NCBI; el sistema de enlace NCBI
ha cambiado automáticamente la base de datos predeterminada (que es Humana) a
Otra y Colección de nucleótidos (nr/nt) porque nuestra secuencia no es humana. La
base de datos nr es la colección no redundante de secuencias en GenBank.
• Cambie el programa seleccionado / optimizado para a Secuencias algo
similar (blastn).
• Tenga en cuenta todos los pequeños iconos de signos de interrogación alrededor de
la página. Haga clic en cualquiera de ellos para obtener más información sobre el
parámetro asociado. Por ejemplo, al hacer clic en el signo de interrogación en la
sección Selección de programas, se obtiene un resumen muy breve de los diferentes
métodos. Al hacer clic en más, salta a una nueva página con documentación
completa para los algoritmos.
a. ¿Cuándo querrías usar megaBLAST? ¿Qué pasa con el megaBLAST discontinuo? (si
tiene tiempo, pruebe cada uno y vea cómo difieren sus resultados).
El megaBlast lo utilizamos cuando queremos indentificar unas secuencias que son semejantes una con la otra; en
cuento al discontinuos megaBlast lo usamos para hacer comparaciones, principalmente cuando tenemos organismos
diferentes.
• El siguiente es el resumen gráfico. Desplácese con el ratón sobre las barras de colores.
¿Qué significan las barras de colores?
Identifican las coincidencias que presentó.
• ¿Qué información se muestra en el cuadro cerca de la parte superior del resumen gráfico?
• ¿Cómo se ordenan? (puede ordenar estos segmentos de otras maneras, como por
identidad, puntuación y posición de inicio de consulta ).
Se ordenan depediendo de distintas opciones, eso queda a opción del
investigador.
• ¿Qué sucede si hace clic en el enlace directo adhesión?
Se abre una página de la secuencia elegida.
o. Juega con las opciones de formato se para tener una idea de lo que significan.
• Devuelva el formato al formato original de Pairwise. Vuelve al resumen gráfico. Si hay
segmentos de baja puntuación (es decir, bloques codificados en verde o azul), haga clic en
uno.
• ¿Cuál es su valor E?
• ¿Tiene un alto porcentaje de identidad? Si es así, ¿por qué BLAST le daría un valor
E tan pobre?
• ¿Crees que estos éxitos son homólogos? ¿Por qué o por qué no?