Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FACULTAD DE INGENIERÍA
DEPARTAMENTO DE INGENIERÍA QUÍMICA
Informe n°1
“Conceptos y herramientas web”
CURSO: Bioinformática
INTEGRANTES: Vicente Ribera Silva
Thiaris Martinez Quezada
PROFESOR: Jonathan Maldonado Soto
FECHA DE ENTREGA: 07/06/2023
INTRODUCCIÓN
Se escogieron dos especies para comparar la información presente en diversas bases de
datos para cada una, estableciendo una hipótesis dependiendo de la información
encontrada. Dichas especies fueron Octopus bimaculoides escogida por ser el primer
octópodo con un genoma secuenciado y por características fisiológicas tales como su
sistema nervioso muy distinto al del humano y su capacidad de cambiar de aspecto
rápidamente para camuflarse; y la Orcinus orca escogida por ser la única especie del
género Orcinus que perdura en la actualidad, además por que las características sociales y
fisiológicas varían según su grupo (Transiente o Residente) y según su vaina, a pesar de las
diferencias no se ha comprobado especiación.
De ambas se escogió finalmente O. bimaculoides bajo la hipótesis de que al comparar el
genoma entre dicha especie y otras presentes en el mismo género se encuentran relaciones
entre los genes responsables de la capacidad de cambiar su aspecto. A pesar de que en el
presente no se comprueba ni refuta la hipótesis, se establecen las herramientas y la
información existente en diversas bases de datos para evaluar si es posible seguir una línea
investigativa bajo dicha hipótesis.
OBJETIVOS
Objetivo general:
● Aprender a utilizar bases de datos para encontrar información que ayude en un
análisis o estudio.
Objetivos específicos:
● Utilizar la página web del NIH y sus filtros de búsqueda para encontrar datos de las
especies O. bimaculoides y O. orca.
● Comparar cantidad de datos presentes para O. bimaculoides y O. orca de forma
cuantitativa.
● Establecer bases de datos y criterios de búsqueda útiles para encontrar datos de O.
bimaculoides y especies del mismo género.
COMPARACIÓN DE INFORMACIÓN SOBRE LAS ESPECIES PRESENTE EN BASES DE
DATOS
NIH es el centro nacional de información biotecnológica, donde se encuentra la totalidad de
los datos conocidos sobre genoma, proteoma, e investigaciones asociadas a especies
conocidas, aparte de contener su información filogenética.
A partir de la base de datos generales para O. bimaculoides y O. orca se hizo un cuadro
comparativo cuantificando la cantidad de datos asociados a diversos puntos de interés,
tales como investigaciones asociadas, número de ensambles del genoma, los genes y
proteínas conocidas, entre otros. Donde PubMed es una base de datos de más de 35
millones de citas y resúmenes de literatura en biomedicina, no presenta textos completos de
artículos de revistas y facilita la búsqueda en recursos de la Biblioteca Nacional de Medicina
(NLM), MEDLINE, PubMed Central(PMC) y Bookshelf. En cambio, PubMed Central es un
archivo que contiene más de 8 millones de textos completos de artículos (que abarcan
desde finales 1700 hasta la actualidad), manuscritos de autores y versiones preliminares de
artículos que se han hecho públicos.
El número de genomas indica si se ha secuenciado o no el genoma y los números de
ensambles indican la cantidad de veces que se ha secuenciado a partir de distintos
individuos de la misma especie. El número de genes indica la cantidad de genes
secuenciados, respectivamente lo mismo para el número de proteínas; y finalmente el
número de proteínas idénticas indica dicho número para proteínas secuenciadas de
distintos individuos de la misma especie.
A pesar de que los ensambles pueden generarse en base también del genoma secuenciado
de un organismo filogenéticamente cercano, no se puede sin al menos tener los reads de la
extracción del DNA del organismo, por lo tanto no solo se necesita un organismo con
identidad cercana sino que amerita más trabajo en el organismo de interés.
Comparando con la información encontrada mediante el filtro Genomes Datasets, también
se encontró 1 secuenciación de genoma del O. bimaculoides, además de O. sinensis y O.
vulgaris, pero también indica que se encuentran a nivel de scaffold O. maya, O. mimus, O.
rubescens, O. americanus. Scaffold es que un genoma no se encuentra cerrado, es decir,
que hay fragmentos largos, pero que no se han logrado unir para formar cromosomas.
En el buscador de la página web del NIH se pueden utilizar operadores lógicos para
discriminar la búsqueda, tales como intersección entre datos de cierta cantidad de especies
o una especie y no la otra por ejemplo. Utilizando tales herramientas se buscaron datos que
relacione al O. bimaculoides y a O. orca, no encontrándose relación en dicha base de datos.
Sin embargo, al utilizar la herramienta para identificar datos en común entre O.
bimaculoides, O. sinensis y O. vulgaris se encontraron 32 publicaciones en PubMed Central
y 333 proteínas en común, lo que entregaría un punto de inicio en la línea investigativa, para
verificar la hipótesis planteada, ya que podemos identificar si las proteínas en común se
relacionan al parámetro de camuflaje e investigar si se conocen los genes que codifican
para tales proteínas, para ser comparados finalmente. Es recomendado para compararlas
(en caso de ser conocidas) mediante un BLAST, que es un algoritmo de alineamiento de
secuencias, capaz de comparar la secuencia en cuestionamiento con una gran cantidad de
secuencias presentes en alguna base de datos, para ello se podría utilizar la página web
Ensembl o la del NIH.
A pesar de que existen más bases de datos para encontrar artículos académicos sobre la
especie como “Web Of Knowledge (WOS)”, PubMed Central del NIH es el que alberga
mayor cantidad de papers disponibles, por lo que es recomendable al momento de buscar
información a nivel general utilizar tal base de datos.
CONCLUSIÓN
Se lograron cumplir los objetivos general y específicos, por que se aprendieron a utilizar
bases de datos, comparando los resultados bajo diversos filtros y criterios de búsqueda,
además se compararon la cantidad de datos presentes para las 2 especies escogidas, O.
bimaculoides y O. orca.
El conocimiento sobre las bases de datos entregan la posibilidad de establecer
planteamientos relacionados a genética, genómica y proteómica, tal como la hipótesis
planteada al comienzo del presente documento, que si bien no se verificó, se lograron
establecer las herramientas presentes para continuar una línea investigativa.