Está en la página 1de 7

UNIVERSIDAD DE SANTIAGO DE CHILE

FACULTAD DE INGENIERÍA
DEPARTAMENTO DE INGENIERÍA QUÍMICA

Informe n°1
“Conceptos y herramientas web”

CURSO: Bioinformática
INTEGRANTES: Vicente Ribera Silva
Thiaris Martinez Quezada
PROFESOR: Jonathan Maldonado Soto
FECHA DE ENTREGA: 07/06/2023
INTRODUCCIÓN
Se escogieron dos especies para comparar la información presente en diversas bases de
datos para cada una, estableciendo una hipótesis dependiendo de la información
encontrada. Dichas especies fueron Octopus bimaculoides escogida por ser el primer
octópodo con un genoma secuenciado y por características fisiológicas tales como su
sistema nervioso muy distinto al del humano y su capacidad de cambiar de aspecto
rápidamente para camuflarse; y la Orcinus orca escogida por ser la única especie del
género Orcinus que perdura en la actualidad, además por que las características sociales y
fisiológicas varían según su grupo (Transiente o Residente) y según su vaina, a pesar de las
diferencias no se ha comprobado especiación.
De ambas se escogió finalmente O. bimaculoides bajo la hipótesis de que al comparar el
genoma entre dicha especie y otras presentes en el mismo género se encuentran relaciones
entre los genes responsables de la capacidad de cambiar su aspecto. A pesar de que en el
presente no se comprueba ni refuta la hipótesis, se establecen las herramientas y la
información existente en diversas bases de datos para evaluar si es posible seguir una línea
investigativa bajo dicha hipótesis.
OBJETIVOS

Objetivo general:
● Aprender a utilizar bases de datos para encontrar información que ayude en un
análisis o estudio.

Objetivos específicos:
● Utilizar la página web del NIH y sus filtros de búsqueda para encontrar datos de las
especies O. bimaculoides y O. orca.
● Comparar cantidad de datos presentes para O. bimaculoides y O. orca de forma
cuantitativa.
● Establecer bases de datos y criterios de búsqueda útiles para encontrar datos de O.
bimaculoides y especies del mismo género.
COMPARACIÓN DE INFORMACIÓN SOBRE LAS ESPECIES PRESENTE EN BASES DE
DATOS
NIH es el centro nacional de información biotecnológica, donde se encuentra la totalidad de
los datos conocidos sobre genoma, proteoma, e investigaciones asociadas a especies
conocidas, aparte de contener su información filogenética.
A partir de la base de datos generales para O. bimaculoides y O. orca se hizo un cuadro
comparativo cuantificando la cantidad de datos asociados a diversos puntos de interés,
tales como investigaciones asociadas, número de ensambles del genoma, los genes y
proteínas conocidas, entre otros. Donde PubMed es una base de datos de más de 35
millones de citas y resúmenes de literatura en biomedicina, no presenta textos completos de
artículos de revistas y facilita la búsqueda en recursos de la Biblioteca Nacional de Medicina
(NLM), MEDLINE, PubMed Central(PMC) y Bookshelf. En cambio, PubMed Central es un
archivo que contiene más de 8 millones de textos completos de artículos (que abarcan
desde finales 1700 hasta la actualidad), manuscritos de autores y versiones preliminares de
artículos que se han hecho públicos.
El número de genomas indica si se ha secuenciado o no el genoma y los números de
ensambles indican la cantidad de veces que se ha secuenciado a partir de distintos
individuos de la misma especie. El número de genes indica la cantidad de genes
secuenciados, respectivamente lo mismo para el número de proteínas; y finalmente el
número de proteínas idénticas indica dicho número para proteínas secuenciadas de
distintos individuos de la misma especie.

Especie PubMed PubMed Número Número Número Número Grupos


Central de de de genes de de
ensamb- genomas proteína- proteína-
les s s
idénticas

Octopus 63 452 1 1 20145 25169 23503


bimaculo
ides

610 2936 3 1 31450 65579 50820


Orcinus
orca
De tal comparación se evidencia que es posible encontrar mayor información a nivel general
de la O. orca que de O. bimaculoides, a pesar de ello se escoge esta última debido al
interés personal que despierta dicha especie y la hipótesis formulada en un comienzo.
Cabe destacar que el linaje encontrado para O. bimaculoides es “cellular organisms;
Eukaryota; Opisthokonta; Metazoa; Eumetazoa; Bilateria; Protostomia; Spiralia;
Lophotrochozoa; Mollusca; Cephalopoda; Coleoidea; Octopodiformes; Octopoda; Incirrata;
Octopodidae; Octopus” desde la clasificación más general a la más específica, esto
encontrado bajo el filtro de Taxonomy en la misma página web del NIH.
Bajo el filtro de genoma en la misma página web del NIH se encontraron 2 especies del
género Octopus con el genoma secuenciado, O. sinensis y O. vulgaris, los 3 a nivel
cromosomal. Al interiorizar en los detalles de O. bimaculoides mediante el filtro GenBank
accession se extrae que su genoma es haploide con 30 cromosomas más uno mitocondrial
y que en sus genes el 90,1% están presentes en 1 copia pero que hay un 6,6% que están
desaparecidos, es decir, que no pudieron ser ensamblados en el genoma. El genoma se
considera completo a pesar de que no esté el 100% secuenciado con una única copia,
porque ya se contiene la información confiable suficiente para lograr armar los cromosomas
de la especie. Los datos mencionados se encuentran a partir del filtro Genomas en la
página web del NIH, donde la información se resume en el gráfico mostrado a continuación:

A pesar de que los ensambles pueden generarse en base también del genoma secuenciado
de un organismo filogenéticamente cercano, no se puede sin al menos tener los reads de la
extracción del DNA del organismo, por lo tanto no solo se necesita un organismo con
identidad cercana sino que amerita más trabajo en el organismo de interés.
Comparando con la información encontrada mediante el filtro Genomes Datasets, también
se encontró 1 secuenciación de genoma del O. bimaculoides, además de O. sinensis y O.
vulgaris, pero también indica que se encuentran a nivel de scaffold O. maya, O. mimus, O.
rubescens, O. americanus. Scaffold es que un genoma no se encuentra cerrado, es decir,
que hay fragmentos largos, pero que no se han logrado unir para formar cromosomas.
En el buscador de la página web del NIH se pueden utilizar operadores lógicos para
discriminar la búsqueda, tales como intersección entre datos de cierta cantidad de especies
o una especie y no la otra por ejemplo. Utilizando tales herramientas se buscaron datos que
relacione al O. bimaculoides y a O. orca, no encontrándose relación en dicha base de datos.
Sin embargo, al utilizar la herramienta para identificar datos en común entre O.
bimaculoides, O. sinensis y O. vulgaris se encontraron 32 publicaciones en PubMed Central
y 333 proteínas en común, lo que entregaría un punto de inicio en la línea investigativa, para
verificar la hipótesis planteada, ya que podemos identificar si las proteínas en común se
relacionan al parámetro de camuflaje e investigar si se conocen los genes que codifican
para tales proteínas, para ser comparados finalmente. Es recomendado para compararlas
(en caso de ser conocidas) mediante un BLAST, que es un algoritmo de alineamiento de
secuencias, capaz de comparar la secuencia en cuestionamiento con una gran cantidad de
secuencias presentes en alguna base de datos, para ello se podría utilizar la página web
Ensembl o la del NIH.
A pesar de que existen más bases de datos para encontrar artículos académicos sobre la
especie como “Web Of Knowledge (WOS)”, PubMed Central del NIH es el que alberga
mayor cantidad de papers disponibles, por lo que es recomendable al momento de buscar
información a nivel general utilizar tal base de datos.
CONCLUSIÓN

Se lograron cumplir los objetivos general y específicos, por que se aprendieron a utilizar
bases de datos, comparando los resultados bajo diversos filtros y criterios de búsqueda,
además se compararon la cantidad de datos presentes para las 2 especies escogidas, O.
bimaculoides y O. orca.
El conocimiento sobre las bases de datos entregan la posibilidad de establecer
planteamientos relacionados a genética, genómica y proteómica, tal como la hipótesis
planteada al comienzo del presente documento, que si bien no se verificó, se lograron
establecer las herramientas presentes para continuar una línea investigativa.

También podría gustarte