Está en la página 1de 23

Bioinformática: una mirada epistemológica y conceptual

Presentación

Uno de los aspectos fundamentales que hace a las matemáticas una disciplina o
ciencia muy cautivante, es el hecho de que sus procesos y algoritmos derivados de
las modelaciones matemáticas son transversales a las demás ciencias y disciplinas
del conocimiento; de allí se contemplan las herramientas cuantitativas que son
indispensables en la biología moderna, como una de sus múltiples aplicaciones, y
que para el presente escrito es base argumental para la intencionalidad de la
incidencia que presenta la bioinformática. En la actualidad, un alto número de
procesos investigativos de la rama biológica implican el uso de algún tipo de
desarrollo matemático, estadístico, y/o de herramientas computacionales. Esto con
el fin de ayudar a sintetizar y sistematizar los datos registrados y generados de las
observaciones; como también integrar diversos tipos de información en el proceso
de responder a una pregunta o a una situación problémica de tipo biológico. Por
citar un ejemplo, los métodos de conteo y la estadística son necesarios para
evaluar las prácticas experimentales cotidianas de laboratorio, como contar
colonias de bacterias, o vectores de propagación de algún virus. Un uso más
formal de modelos matemáticos e instrumentos cuantitativos está relacionado con
la implementación de cálculo diferencial, por ejemplo para establecer un modelo
cinético de la catálisis enzimática, modelos de ecuaciones diferenciales para
representar el crecimiento de bacterias. O el uso de un gran número de ecuaciones
diferenciales parciales no lineales para modelar el flujo sanguíneo cardíaco. Es de
mencionar estos ejemplos para justificar una de las esencias teóricas de la
bioinformática y es que uno de los insumos principales para su existencia son las
ciencias exactas, enmarcadas éstas en las matemáticas, estadística y la ingeniería
de sistemas; pues es un fortunado suceso contar con herramientas
computacionales para ilustrar y simular procesos arduos por emdio de software
especializado, como por ejemplo Matlab, una herramienta computacional que es
maravillosamente útil para sistematizar la información científica.

Ahora bien, la bioinformática es el área de los procesos computacionales que


evidencia un mayor potencial para transformar el estado de los seres humanos a
corto y medio plazo. Su divulgación pública es mínima entre los medios de
comunicación, probablemente porque no se cuenta con productos de consumo
masivo que impliquen la inversión en publicidad. Una de las intencionalidades de
este documento de trabajo es invitar al lector a que navegue por los aspectos
epistemológicos e historia del arte que acá se comenta, como también las
conceptualizaciones esenciales, para que se pueda difundir la información y
motivar a la sociedad a que se incorporen en un área que deslumbra innumerables
beneficios, como por ejemplo en el sector agropecuario, y es de recordar que
todos los seres humanos de una u otra forma estamos relacionados con el
ambiente agropecuario, como cultivadores, proveedores o consumidores. En
palabras sencillas, la bioinformática toma todo lo relacionado con los seres vivos y
articula dichos sucesos con procesos de las ciencias exactas y lo sistematiza
computacionalmente y lo incorpora con sistemas de información. Para cerrar esta
presentación, se cita uno de los ejemplos más incidentes de la bioinformática, y
consiste en el ejemplo clásico en la historia de la genética desarrollado por Gregor
Mendel (Austria, 1866) y Thomas Morgan (USA, 1910); ellos al realizar el conteo
variaciones genéticas de plantas y moscas de la fruta, lograron descubrir los
principios de la herencia genética. Esto permite establecer en este escrito algunas
situaciones del manejo de a base de datos, los análisis de secuencias del ADN, la
simulación de la vida (la inteligencia artificial) y la incidencia de la bioinformática
en el sector agropecuario.

Aspectos nocionales de la bioinformática

Actualmente se está difundiendo el hecho de la importancia que está teniendo la


bioinformática, es una de las ciencias con mayor proyección en la adquisición de
conocimiento científico. Esta ciencia tuvo sus inicios en la década de los 50, sin
embargo, fue sólo hasta los años 80 cuando tuvo su verdadero auge con la
creación de las primeras bases de datos y el desarrollo de algoritmos
computacionales enfocados para el análisis de secuencia. A nivel mundial es
notable el desarrollo científico y tecnológico como ha ido creciendo fuertemente, y
como se articulan ambos para generar nuevas alternativas de solución a las
necesidades y problemáticas de la sociedad misma; lo que constantemente
conlleva a evaluar las posibilidades de transferencia de esos logros a la sociedad
científica. Infortunadamente, la bioinformática carece de una plataforma de
socialización que permita su difusión de manera eficaz, ya que aún faltan
fortalecerse los procesos de investigación en muchas partes del mundo, por
ejemplo en Colombia la investigación se ha incrementado, pero en esta ciencia en
particular aún se está en sus inicios. No obstante, las nuevas proyecciones y
políticas de investigación y desarrollo logradas en países como Colombia, están
permitiendo a la comunidad académica y científica aventurarse en la aplicación y
desarrollo de la bioinformática en diferentes ámbitos de la sociedad, como por
ejemplo en el sector agropecuario. Otro aspecto que se ha convertido en un
reforzador para la implementación de la investigación en bioinformática a nivel
mundial y que estaá favoreciendo a Colombia, son las nuevas políticas de
desarrollo y sostenibilidad del ecosistema, que apunta a todo lo relacionado con los
seres vivos y con base en la biotecnológica, se ha logrado dar un avance tanto de
forma como de fondo en la investigación computacional en Colombia y en un
periodo a largo plazo, la trazabilidad objetiva de la implementación de la
bioinformática busca que la investigación de la comunidad colombiana esté con
unos índices de favorabilidad como lo es en países como Chile, Argentina, Brasil y
México, referentes inmediatos de América Latina.

Con un sentido nocional, la bioinformática cuenta con tres objetivos claramente


definidos, los cuales son: En primer lugar, desarrollar recursos y herramientas que
permitan el análisis de datos. En segunda instancia, organizar sistémicamente la
información en las denominadas bases de datos o BBDD; de tal forma, el
investigador contará con la facilidad no solo acceder a la misma sino analizar y
trabajar con ella en beneficio de sus proyectos para llegar a nuevos resultados y
conclusiones. Finalmente, realizar una interpretación de los resultados obtenidos al
analizar la información procesada por medio de los recursos y herramientas. El
comentario siguiente es una muestra de la implementación de la bioinformática
según los objetivos definidos:

…, Nunca antes los científicos han tenido la capacidad de recopilar,


compartir y analizar datos como la que tienen hoy. Por tanto, las Bases de
datos Biológicas (bioDBs) desempeñan un papel cada vez más importante
en la era post-genoma. Con esta explosión de datos moleculares y
capacidades biotecnológicas, las industrias farmacéuticas y de la salud
dependen de profesionales con conocimientos de tecnología
bioinformática, para aprovechar plenamente estos recursos y traducir los
datos moleculares y celulares en los nuevos descubrimientos genéticos y
terapéuticos, así como desarrollar nuevas biotecnologías que afecten
positivamente a la salud humana. (Méndez, E, & Rivas, R. 2014, p. 28)

Es claro que a nivel mundial la bioinformática se está aplicando fuertemente en los


procesos de la genética, para resolver situaciones y necesidades de todos los seres
vivos, y el poder utilizar la internet, es favorable para que toda la sociedad mundial
pueda acceder a esta información, de ahí la importancia de la articulación de los
sistemas de información con las diferentes áreas del conocimiento. Por ejemplo en
la agricultura:
…, Es así que, los sistemas de información ayudaran a tomar
decisiones adecuadas en cuanto a la productividad y comercialización
de los productos y su competitividad en un mundo de globalización y
que permitirán integrar de manera efectiva toda información tanto
de los consumidores como los productores en todo el globo
terráqueo. Existe un organismo internacional creado por La
Organización de las Naciones Unidas para la Agricultura y la
Alimentación al cual se lo ha denominado Agricultural Market
Information System, AMIS, que su principal función es mejorar la
transparencia del mercado de alimentos y fomentar la coordinación
de medidas normativas en respuesta a la variabilidad de los precios
internacionales. (Sepulveda, Yulian, 2019, p. 4)

Finalmente para dar cierre a estos preliminares de la bioinformática, queda claro


que es una ciencia que requiere de las llamadas ciencias exactas para su
fundamentación y su funcionalidad está en la biología molecular, la genética y la
biología genética, como pilares para ser aplicada en otros ámbitos, como lo es el
agrícola. Es importante resaltar que la llamada genómica funcional ha surgido
recientemente, y que intenta dar respuesta a la pregunta de cuál es la función de
cada gen y como interactúan para definir un fenotipo determinado. Y con base el
dogma central de la biología se ha definido distintas áreas de estudio del material
hereditario. Por lo cual, la genómica hace referencia al estudio del propio ADN; por
su parte la transcriptómica a los perfiles de ARNm y la proteómica a los perfiles de
proteínas. De esta manera en el presente documento de trabajo, se establecen
tres unidades temáticas de la bioinformática, correspondientes a las bases de
datos y análisis de secuencias de ADN y proteínas, la simulación d ela vida y la
aplicabilidad ene l sector agropecuario.

La Bioinformática y su estado del arte

La bioinformática evidencia su desarrollo como resultado de los avances tanto en


biología molecular como en ciencias computacionales a lo largo de las últimas tres
décadas. Sin embargo, es importante establecer que durante la última mitad de la
década de los años 50, se inició la carrera por la secuenciación de pequeñas
moléculas biológicas. El deseo innato del ser humano por saber de qué está hecho
inició oficialmente en el año 1956 con la secuenciación de la primera proteína; por
lo cual, Margaret O. Dayhoff describió la secuencia de la insulina bovina, un
pequeño péptido, es decir un compuesto formado de 51 aminoácidos. Es entonces
en esta década de los años 50 que se logró comprender la estructura
tridimensional del ADN, la molécula responsable de transmitir la herencia genética.
Fue Margaret Oakley Dayhoff, quien junto con David Lipman, director del Centro
Nacional de Información Biotecnológica, considerados como la madre y el padre,
de la bioinformática. Dayhoff con su creación de una de las primeras bases de
datos de secuencias de proteínas, en un comienzo publicada como un libro,
permitió que ella luego desarrollara métodos de alineamiento de secuencias y
evolución molecular.

Sin embargo unos años antes de el gran aporte de Margaret O. Dayhoff, se tiene
como dato cronológico, el mes de mayo de 1952, por el suceso de que Rosalind
Franklin obtiene la famosa fotografía 51, una imagen del ADN obtenida mediante
difracción de rayos X; luego en abril de 1953, James D. Watson y Francis Crick
reportan la estructura tridimensional del ADN (modelo de doble hélice). Siendo
éstos, aportes importantes en el surgimiento posterior de la bioinformática, como
se ha comentado, su escenario de funcionalidad es la biología. En el año de 1964
se obtuvo la primera secuencia de un ácido nucleico. Dicha secuencia pertenecía a
un ARNt que descodifica un codón de alanina en Saccharomyces cerevisiae. Luego,
en 1978, de nuevo Margaret Dayhoff fue la encargada de generar la primera
matriz de substitución de aminoácidos, denominada PAM (Point Accepted
Mutation)

Dos décadas más tarde, al inicio de los años 1970, el Laboratorio Nacional de
Brookhaven (USA) estableció el Banco de Datos de Proteínas para almacenar
estructuras de proteínas en 3D, teniéndose 12 al inicio, y actualmente se data de
90,611. Y fue en el año de 1970 que se desarrolla el primer algoritmo para
alineamiento de secuencias, por Needleman y Wunsch; siendo este desarrollo un
episodio fundamental en la génesis de la bioinformática, que abrió el camino para
las comparaciones de secuencias y búsquedas en BD de rutina realizadas por los
biólogos de la era moderna. En 1973, se creó la base de datos más antigua que se
conoce y la cual sigue vigente, el Protein Data Bank (PDB). También es
importante relacionar que el primer algoritmo para predicción de estructuras de
proteínas fue desarrollado por Chou y Fasman en 1974. Esta década de los 70
marca el inicio activo de una articulación entre los conceptos biológicos y sus
procesos con la computación y programaciones computacionales que facilitaron la
interpretación de datos, principalmente de tipo genético.

La década de los años 80 se convierte en una etapa fundamental para ampliar la


aplicabilidad computacional para la estructuración de bases de datos para
informaciones de tipo biológica, predominado la genética y el estudio de la misma;
ya que se evidencia el establecimiento del GenBank y el desarrollo de rápidos
algoritmos para búsquedas en BD como FASTA de William Pearson y BLAST de
Stephen Altschul. Entonces, en los años años 80, la bioinformática había cobrado
ya un nuevo sentido en la investigación científica y, conscientes de ello, varios
grupos de investigación de prestigio, como el Theoretical Biology and Byophysics
Group adscrito al instituto norteamericano The Alamos Nacional Laboratory, junto
con Standford University, dieron origen a la base de datos más conocida en el
mundo, el GenBank, la cual ya se ha mencionado. Dicho proyecto fue financiado
por los National Institutes of Health (NIH) de los Estados Unidos y otras
importantes instituciones gubernamentales, como el United States Departament of
Energy y el United States Department of Defense.Casi paralelamente, en 1981,
Temple Smith y Michael Waterman revisaron extensamente los algoritmos
matemáticos propuestos por Needleman y Wunsch en 1970 para la comparación
de secuencias biológicas. Como resultado de sus análisis, generaron el conocido
algoritmo de alineamiento local que permitió optimizar la comparación de
secuencias biológicas a lo largo de un alineamiento. A finales de esta década de
los años 80 se da el inicio del proyecto del genoma humano, el cual proporciona
un desarrollo acelerado de la bioinformática. También cabe resaltar que después
de la creación del GenBank, se generaron sus versiones europea y asiática,
conocidas como la base de datos EMBL (European Molecular Biology Laboratory) y
DDBJ (DNA Data Bank of Japan) en 1981 y 1984, respectivamente. De manera
inmediata, luego de la creación de los bancos de secuencias, se cuestionó respecto
al significado de la información almacenada en ellos. Como consecuencia, en 1985
llega el algoritmo FASTA (FAST-All) de comparación de secuencias, el cual
directamente operaba como motor de búsqueda de secuencias similares dentro de
la base de datos GenBank

Otro contribuidor temprano a la bioinformática fue Elvin A. Kabat, pionero del


análisis de secuencias biológicas en los setenta, con sus volúmenes completos de
secuencias de anticuerpos publicados con Tai Te Wu entre 1980 y 1991. Durante
los años 1987 a 1990, se motiva con mayor fuerza el uso a las bases de datos para
secuencias de proteínas que permitió la creación de SwissProt y PIR (Protein
Information Resource). En 1990, se originó otro de los hitos más importantes de la
bioinformática, y es la implementación del algoritmo BLAST (Basic Local Alignment
Tool) que revolucionó la exploración y búsqueda de secuencias biológicas en bases
de datos

Llega entonces la década de los años 90 y todo el despliegue informático con el


uso masivo del internet haciendo posible el acceso inmediato, intercambio y
diseminación de datos biológicos. En términos generales la bioinformática pasa a
convertirse en una disciplina debido al avance en los estudios sobre el genoma,
por la generación de grandes cantidades de datos biológicos.

Se da entonces, el amplio desarrollo de herramientas computacionales eficientes


para el manejo sistémico y el análisis de los datos obtenidos sobre secuencias
genómicas. El desarrollo de estas herramientas fue dependiente, por decirlo de
una manera, del conocimiento generado en disciplinas tan diversas como las
matemáticas, la estadística, las ciencias computacionales, las tecnologías de la
información y la biología molecular, con su vertiente de la genética. La
transversalización de estas disciplinas creó un campo orientado a la información en
la biología, tomando para ese entonces el nombre formal de “Bioinformática”.
Convirtiéndose así en algo esencial para la investigación en genómica y biología
molecular. Además también está teniendo un gran impacto en muchas áreas de la
biotecnología, por ejemplo la inclusión actualmente de la agricultura de precisión y
procesos de biorremediación; y de las ciencias biomédicas. Algunas aplicaciones
como el diseño de fármacos basados en conocimiento; análisis forenses de ADN
entre otras. Algunas de las principales áreas de investigación en bioinformática
incluyen: Alineamiento de secuencias; Predicción de genes; Predicción de la
estructura de proteínas; Predicción de la expresión génica; Interacciones proteína-
proteína; Modelado de la evolución.

Continuando con el desarrollo histórico y epistemológico de la bioinformática, se


contempla que a finales de la década de los años 90, precisamente en el año 1997
estaba en pleno desarrollo el Proyecto del Genoma Humano, en instituciones la
públicas, y privadas. En este gran marco científico, cabe resaltar la unidad de
investigación del Dr. Ordovás, una autoridad mundial en lípidos y posteriormente
en Nutrigenómica, él realizaba sus experimentos en el ámbito del Framingham
Study (iniciado como Framingham Heart Study y posteriormente seguido por el
Framingham Offspring Study); y es importante su mención porque se realizaban
aplicando rigurosamente los procedimientos y protocolos de la Biología Molecular y
Genética para la extracción de ADN de muestras de sangre de los sujetos
poblacionales y muestrales del estudio, y el tratamiento posterior del ADN extraído
hasta llegar a detectar la expresión genética correspondiente; y enmarcado el
tratamiento de los datos recolectados del grupo muestral y los generados en los
experimentos porque se articulaba en la utilización de hojas de cálculo Microsoft
Excel y de la suite Wordperfect; además, el análisis de la información se realizaba
con los paquetes estadísticos SPSS y SAS. Sin embargo, se presentaba una
limitante para visualziar adecuadamente los datos biomédicos, por la rigurosidad
de los datos manejados y las limitaciones de estos paquetes y software. En esa
época, se hablaba de un conjunto de herramientas computacionales, desarrollados
fundamentalmente por los biólogos y científicos de perfil similar que trabajaban en
el Proyecto del Genoma Humano, para manejar y analizar la inmensa cantidad de
datos que generaba diariamente dicho proyecto, herramientas desarrolladas casi
exclusivamente para plataformas UNIX linux, y a través de la web eran distribuidas
libremente; es de destacar una de las más famosas, la de Jurgen Ott de la
Rockefeller University. Había algunas excepciones en cuanto a herramientas
hechas para las plataformas de APPEL; sin embargo, no había ninguna conexión
entre dichas herramientas y un planteamiento más formal sobre la forma de
abordar las situaciones problémicas en genética y en el descubrimiento del
genoma.

Por aquella década se comenzó a hablar de la Biología Computacional


(Computational Biology o Computer Biology), como disciplina que, con la
intencionalidad de mejorar la capacidad de la Biología tradicional, había
incorporado métodos, técnicas y herramientas de la Ciencia de la Computación
(Computer Science). Pero otros académicos, investigadores y científicos se referían
a la la Genética Computacional (Computational Genetics o Computer Genetics)
mostrándose como potenciador de la Biología Genética (y Molecular), y no de la
Biología en general. Sin embargo, esto permitió la incorporación de un término
denominado en inglés como “Bioinformatics”; entre los años 1997 y 1998 cuando
va tomando fuerza el nombre “Bioinformatics”, que más adelante se incorpora su
uso en español: “Bioinformática”.

Al hacer este recorrido histórico con su aspecto epistemológico, puede decirse que
actualmente ha tomado la connotación de disciplina, sin embargo, aún no se ha
oficialziado a nivel mundial como una ciencia o ingeniería propaiemnte formal, a
pesar de que ya son muchos los investigadores que le han dedicado grandes
esfuerzos por madurar el conocimiento de la bioinformática.

A partir del año 1997 gracias a la intesificación d elos trabajos en investigación, se


ha ido difundiendo la bioinformática como disciplian en muchos lugares del mundo,
llegando ya a países donde la investigación aún está débil, Colombia ya hace parte
de los países que le está apostando a la bionformática, sin embargo, no de la
manera que se desearía. Importante comentar que de forma paralela la
bioinformática se ha ido desarrollando como otra nueva disciplina, la Epidemiología
Genómica, surgida de la Epidemiología Genética.

Lo anterior permite emitir como definición de la bioinformática: “la aplicación de


las ciencias informáticas para resolver problemas biológicos; tarea esta llevada a
cabo por un grupo multidisciplinario”. Ahora bien, la comunidad científica y
académica utiliza lgunos términos a manera de sinónimos, por ejemplo, biología
computacional. Pero fue Paulien Hogeweg quien en el año 1970 incorporó el uso
del término bioinformática para referirse “al estudio de procesamiento de
información en sistemas biológicos”. Pero fue en el año 1982 en que el concepto
de bioinformática fue modificado para referirse a la creación de bases de datos
biológicas como GenBank.

Hoy en día, las computadoras son insumos esenciales de las investigaciones


biológicas. La labor humana es sustituida por las "labores robóticas", que ofrecen
una gran cantidad de ventajas, entre las que se encuentran “la disminución de
errores aleatorios, aumento de la reproducibilidad, disminución de la probabilidad
de contaminación, aumento de la precisión y el ahorro de tiempo”.

Haciendo un análisis de lo que ocurre a nivel mundial, es de establecerse que la


manipulación de la información que se genera a través de las nuevas tecnologías
provoca consecuencias en el desarrollo psicológico y moral de los seres humanos,
y en la estructura funcional de las sociedades, en un contexto de la globalización
donde aumenta la dependencia de las tecnologías. Asi pues,la ciencia moderna es
concebida desde su articulación con lo tecnológico, y desde el esquema
investigativo se busca el impacto social. Pero a nivel mundial, la bioinformática
sigue siendo monopolizada por los países más desarrollados, quienes poseen el
control del saber. Claro está que, la bioinformática, al igual que en otras ciencias,
se respalda en la tecnología por el manejo cognoscitivo y pragmático del saber, y
su sentido principal es generar procedimientos y productos en beneficio de la
sociedad.

Un nuevo panorama a nivel mundial en la investigación de la biología


computacional se originó gracias a la infraestructura computacional lograda para
almacenar y administrar datos; los modelos matemáticos diseñados para analizar e
interpretar patrones biológicos, y los avances tecnológicos que desde finales de los
años 90 incrementaron sustancialmente el volumen de procesamiento de las
muestras biológicas. Con la creación del consorcio para la ejecución del proyecto
de secuenciación del genoma humano (Human Genome, HUGO), en 1993, se inició
la era genómica. Entre los años 1998 y 2000, se entregaron los genomas
secuenciados de Caenorhabditis elegans, Pseudomonas aeruginosa, Drosophila
melanogaster y Arabidopsis thaliana. En el año 2003, se finalizó la secuencia
definitiva del genoma humano y, sin embargo, actualmente no se sabe con certeza
cuántos genes posee el ser humano, gracias esto a la incorporación de las bases
biotecnológicas. Actualmente se estiman más de 1.200 genomas de bacterias
completamente secuenciados y más de 4.000 proyectos en curso

A manera de ilustrar como en la actualidad se contribuye con la investigación en


bioinformática, se presenta el esiguiente diagrama de barras para dejar un
estimativo, allí se establece la contribución de Colombia:

Tomado de: Benitez A. & Cardona S. (2010)

De esta manera se pasa entonces de los aspectos históricos a nivel mundial de la


bioinformática, a su contextualización en el marco del territorio colombiano. Para
lo cual, infortunadamente Colombia se muestra como una comunidad de muy baja
producción de conocimiento bioinformático. Con causa de conocimiento, respecto a
la ncidencia del factor económico para la inversión científica , el desarrollo tan
débil de la bioinformática en Colombia tiene factores adicionales de fondo; y
radican en el déficit académico en cuanto a la enseñanza de la bioinformática.

…, Teniendo en cuenta que la academia es el principal gestor de la


investigación científica, tanto en el contexto de la educación pública como
de la privada, la carencia de adecuados programas de formación produce
un crecimiento nulo y, por ende, una pobre oferta de investigadores en
este campo. (Benítez, 2010, p. 173)

Queda argumentado el hecho relevante del proceso de enseñanza-aprendizaje que


se debe articular en las instituciones educativas. Y como ya se ha mencionado,
debe contarse con la transversalidad de las Ciencias naturales: Biología Molecular,
Biología genética, Bioquímica y Genética; y con la fundamentación en las Ciencias
Exactas: Matemáticas, Ingeniería de sistemas, Estadística. Por lo cual es de
reflexionarse al respecto al interior de las diferentes instituciones de educación
superior.

…, En Colombia, en la actualidad no se ha desarrollado ningún programa


sólido para la formación integral de bioinformáticos competentes. No
obstante, algunos programas de maestría y doctorado de instituciones
como la Universidad Nacional de Colombia y la Universidad de los Andes,
han incorporado módulos semestrales de bioinformática que, a su vez,
están lejos de tener el poder educativo requerido para generar verdaderos
profesionales en este campo. (Benítez, 2010, p. 174)

Retomando el aspecto de financiación de la bioinformática en Colombia, es


lamentable expresar que no s ecuenta con una inversión considerable, las
entidades públicas y privadas aún no le apuestan con fuerza a esta disciplina,
mientras que a nivel mundial la inversión si se evidencia con fuerza en los países
desarrollados, como lo muestra la siguiente figura:
Tomado de: Benitez A. & Cardona S. (2010)

A pesar de la poca inversión en Colombia tanto económica como en recurso


curricular, ya se ha elaborado un estudio diagnóstico respecto a biotecnología
por Colciencias, la Universidad Nacional de Colombia y CORPOGEN y dentro
de este estudio s destaca la temática de proyextar a través de la biotecnología
la línea de la bioinformática. Ahora bien hay algunos grupos de investigación
que se están enfocando en esta disciplina de la bioinformática:

…, Haciendo una búsqueda por los grupos y centros de investigación que


realizan estudios de componente bioinformático, podemos encontrar que
son pocos los grupos dedicados a ello y aún menos los que han podido
proyectar su trabajo a nivel internacional con publicaciones de mediano
impacto (9-22). Entre estos últimos, podemos mencionar al Grupo de
Parasitología Molecular (GEPAMOL) de la Universidad del Quindío, el
Centro de Bioinformática del Instituto de Biotecnología de la Universidad
Nacional de Colombia, el Grupo de Investigación en Bioquímica
Computacional de la Pontificia Universidad Javeriana y el Grupo de Análisis
Bioinformático (GABi) del Centro de Investigación y Desarrollo en
Biotecnología. (Benítez, 2010, p.178)

Se evidencia una cantidad muy mínima de actores investigativos que apunten


hacia la bioinformática en Colombia, actualmente. Sin embargo es destacar la
incidencia a nivel mundial que ha podido tener Colombia gracias a CENICAFE y
su proyecto Genoma del Café (http://bioinformatics.cenicafe.org), el cual, como
manifiesta (Benítez, 2010) “tiene como objeto principal un extenso análisis de
genómica funcional y estructural del café colombiano”.

Conceptualizaciones en la Bioinformática

Con anterioridad se viene estableciendo que la bioinformática es un área de


investigación interdisciplinaria (matemática aplicada, estadística, ciencias
computacionales, inteligencia artificial, química y bioquímica
De manera formal, se define entonces, la ciencia que estudia el desarrollo de
métodos computacionales y técnicas estadísticas para resolver problemas prácticos
y teóricos derivados del almacenamiento, extracción, manipulación y distribución
de información relacionada con datos biológicos (principalmente de
macromoléculas)

Bioinformática es una disciplina científica emergente que utiliza tecnología de la


información para organizar, analizar y distribuir información biológica con la
finalidad de responder preguntas complejas en biología. Bioinformática es un área
de investigación multidisciplinaria, la cual puede ser ampliamente definida como la
interface entre dos ciencias: Biología y Computación y está impulsada por la
incógnita del genoma humano y la promesa de una nueva era en la cual la
investigación genómica puede ayudar dramáticamente a mejorar la condición y
calidad de vida humana. Según la definición del Centro Nacional para la
Información Biotecnológica "National Center for Biotechnology Information" (NCBI
por sus siglas en Inglés, 2001): "Bioinformática es un campo de la ciencia en el
cual confluyen varias disciplinas tales como: biología, computación y tecnología de
la información”. Las tecnologías de la información jugarán un papel fundamental
en la aplicación de los desarrollos tecnológicos en el campo de la genética a la
práctica médica como refleja la presencia de la Bioinformática médica y la
Telemedicina dentro de las principales líneas en patología molecular. La aplicación
de los conocimientos en genética molecular y las nuevas tecnologías son
necesarias para el mantenimiento de la competitividad del sistema sanitario no
sólo paliativo sino preventivo.La identificación de las causas moleculares de las
enfermedades junto con el desarrollo de la industria biotecnológica en general y de
la farmacéutica en particular permitirán el desarrollo de mejores métodos de
diagnóstico, la identificación de dianas terapéuticas y desarrollo de fármacos
personalizados y una mejor medicina preventiva. La bioinformática consta de dos
subcampos: El desarrollo de herramientas computacionales y BD. La aplicación de
estas herramientas y BD en la generación desconocimiento biológico para
comprender mejor los sistemas vivos. Estos dos subcampos son complementarios
entre sí.

Se debe distinguir entre tres connotaciones en las que se unen la biología y la


informática, pero con objetivos y metodologías bien diferenciadas: Bioinformática o
Biología Molecular Computacional: investigación y desarrollo de la infraestructura y
sistemas de información y comunicaciones que requiere la biología molecular y la
genética tales como redes y bases de datos para el genoma, micro-arreglos, por
mencionar algunos; es la Informática aplicada a la biología molecular y la genética.
Biología Computacional: computación que se aplica al entendimiento de cuestiones
biológicas básicas, no necesariamente en el nivel molecular, mediante la
modelización y simulación, tales como ecosistemas, modelos fisiológicos, por
mencionar algunos; es la Informática y matemáticas aplicadas a la biología.
Biocomputación: desarrollo y utilización de sistemas computacionales basados en
modelos y materiales biológicos, tales como Biochips, biosensores, computación
basada en ADN, redes de neuronas, algoritmos genéticos, por mencionar algunos;
es la Biología aplicada a la computación.

En la bioinformática no hay trabajos típicos, todo depende de la pregunta biológica


que se trate de contestar, sin embargo, se puede dividir de manera muy general
en algunas temáticas: La genómica (genomics) que es el estudio y uso de las
secuencias de ADN en los cromosomas y la posición, composición y función de los
genes de algún organismo. La genética (genetics) que estudia también los
cromosomas, pero desde el punto de vista de hibridaciones, o sea el cruzamiento
genético de organismos, analiza la segregación genética de la población utilizada
para intentar hacer una conexión entre alguna característica del organismo con
determinada posición en el cromosoma. La Proteómica (proteomics) que estudia
las proteínas, la presencia o ausencia de ellas en un organismo, la secuencia, la
estructura y la función. Transcriptomics, que estudia cuales genes se expresan en
diferentes condiciones o partes del organismo. Esto es algo relativamente nuevo.
Metabolomics, como última tendencia es la parte de la bioinformática que trata de
integrar la información generada por las cuatro anteriores para intentar hacer un
modelo del metabolismo de algún organismo.Por otro lado, está la aplicación, y es
en cualquier organismo vivo. Por el momento la Bioinformáticaen humanos,
bacterias y levaduras son las más adelantadas.Con la finalidad de presentar la
complejidad de cada una de estas ramas de la Bioinformáticase presenta con
mayor detalle solo de la primera.

La Bioinformática y su importancia

Denotativamente se puede hablar de “Integración” como la palabra clave para


entender la importancia de la bioinformática, ya que a través de herramientas y
utilizando la información y/o datos ya depositados en bases de datos alrededor del
mundo se inicia a descubrir relaciones no triviales escondidas en el código de la
vida. La bioinformática ha empezado a tener un rol central como unión de diversas
áreas de la ciencia tales como enzimología, genética, biología estructural,
medicina, morfología, y ecología entre muchos otros. La pregunta relevante es
“¿cómo conseguir las relaciones importantes entre tanta información? esta
pregunta y muchos otros problemas biológicos están siendo respondidos a través
de la bioinformática, uniendo o relacionando toda la información que está
depositada en las bases de datos a través de sus asociaciones con los genes”.
Como un ejemplo práctico de lo anterior, NCBI, el centro de bioinformática del NIH
(National Institutes of Health), reciben y procesan en su sitio Web alrededor de 3
millones de requisiciones al día provenientes de investigadores ubicados alrededor
del mundo. Los procesos celulares son gobernados porel repertorio de genes
expresados y su patrón de actividad temporal. Se necesitan herramientas para
gestionar información genética en paralelo. Para ello se emplean nuevas
tecnologías para extracción de conocimiento, minería de datos y visualización. Se
aplican técnicas de descubrimiento de conocimiento a problemas biológicos como
análisis de datos del Genoma y Proteoma. La bioinformática, en este sentido,
ofrece la capacidad de comparar y relacionar la información genética con una
finalidad deductiva, siendo capaz de ofrecer unas respuestas que no parecen
obvias a la vista de los resultados de los experimentos. Todas estas tecnologías
vienen justificadas por la necesidad de tratar información masiva, no individual,
sino desde enfoques celulares integrados tales como genómica funcional,
proteómica, expresión multigénica, entre otros. De allí se determina para el
presente documento de trabajo tres unidades temáticas que enmarcan la
importancia de la bioinformática:

Unidad 1. Introducción a la Bioinformática, bases de datos y análisis de secuencias


de ADN y proteínas. La información contenida en secuencias de ADN, por su
contenido voluminoso requiere de técnicas inteligentes para el modelamiento de
los datos y de métodos computacionales avanzados para el procesamiento de
estos. Se busca optimizar el tiempo en el que se ejecutan cálculos e inferencias, y
mejorar la confiabilidad de los análisis que se realizan a partir de los resultados
obtenidos, los cuales pueden servir de base para el desarrollo de investigaciones
científicas. El grupo de investigación GIA del programa Ingeniería de Sistemas y
Computación de la Universidad Tecnológica de Pereira, se encuentra trabajando en
la determinación de tecnologías informáticas que permitan hacer avances
significativos en los desarrollos científicos en el campo de la biología. Este artículo
explora que técnicas computacionales son pertinentes en el desarrollo de
aplicaciones bioinformáticas..

Las bases de datos más relevantes en biología incluyen datos de secuencias de


nucleótidos, proteínas, estructura de proteínas, genomas, expresión genética,
bibliografía, taxonomía, metabolismo, factores de transcripción, etc. Nos podemos
hacer una idea de las bases de datos disponibles en esta base de datos de bases
de datos biológicas.

Principales bases de datos se secuencias de nucleótidos:

 NCBI (EEUU)
 EMBL (Europa)
 DDBJ (Japón)

Algunas bases de datos de genomas de organismos concretos:

 Flybase (Drosophila)
 SGD (Levadura)
 TAIR (Arabidopsis)
 ENSEML (Hombre, ratón y otros)

Principales bases de datos de proteínas:

 Uniprot
 Swiss-prot
 PDB
 MMDB
 SCOP

Unidad 2. Simulaciones de la vida . La aplicación del ordenador al estudio de la


Naturaleza ha conducido desde sus orígenes a espectaculares simulaciones,
describiendo las propiedades y mecanismos fundamentales de uno de los
fenómenos de mayor belleza y complejidad surgidos en nuestro planeta, la Vida.
Sin embargo, y desde los orígenes de la simulación, los científicos e ingenieros
emprendieron otro camino: aquel en el que es la propia Naturaleza la que se
convierte en fuente de inspiración, diseñándose desde entonces un número cada
vez mayor de procedimientos computacionales o algoritmos bioinspirados de
probada eficacia y utilidad en disciplinas como la Ingeniería, Economía, Química,
Política, Informática, Física, Matemáticas, Sociología, Biología, Medicina etc. Esta
unión surge debido a la problemática dada en fenómenos tan complejos como la
genética, la simulación del efecto de medicinas, la predicción de enfermedades,
etc. Todas estas situaciones manejan gran cantidad de información y variables, de
allí surge la necesidad de apoyarse con las nuevas tecnologías. Pero hay
circunstancias en las que ni las mejores plataformas tecnológicas pueden encontrar
respuestas en un tiempo prudente, es aquí donde se hace fundamental el uso de
herramientas, técnicas, frameworks y metodologías propias de la inteligencia
artificial para optimizar la mayor cantidad de procesos, reduciendo el tiempo y el
gasto computacional que provocan el manejo de esta información. En el siguiente
artículo se desarrolla un estado del arte de las mejores formas de la aplicación de
la inteligencia artificial en la bioinformática encontrada en la literatura

Unidad 3. El papel de la bioinformática en la investigación en las ciencias


agropecuarias. La investigación en Agroenergía incluye diversos aspectos
(http://www.cnpae.embrapa.br/), y entre ellos está conocer y mejorar las especies
potencialmente utilizables como fuentes renovables de energía. Muchas de estas
líneas de investigación, como caracterización molecular, mejoramiento genético,
ingeniería genética el mismo conocimiento básico sobre mecanismos moleculares
de las especies, tiene a alta productividad y la obtención de resultados vinculadas
a la aplicación de nuevas tecnologías y de bioinformática.Ahora bien, con la
producción agropecuaria: impacto del cambio del uso de la tierra medido a través
de la secuenciación de comunidades microbianas del suelo, genómica en plantas,
tuberculosis bovina (y humana) y búsqueda de genes en los microbiomas de
insectos para producción de biocombustibles

Conclusión

Es realmente visible el gran potencial de la bioinformática, pero es también


importante reconocer sus limitaciones para evitar sobreestimar esta disciplina. La
bioinformática y la biología experimental son actividades independientes, pero
complementarias. La bioinformática depende de la ciencia experimental para
producir datos primarios para el análisis.

Aclarando sus limitantes; es de establecer que a su vez la bioinformática,


proporciona la interpretación de los datos experimentales e importantes pistas
para seguir la investigación experimental. Las predicciones hechas en
bioinformática no son pruebas formales de cualquier concepto. No sustituyen a los
métodos tradicionales de investigación experimental que prueban en realidad las
hipótesis. Además, la calidad de las predicciones de bioinformática depende de la
calidad de los datos y la sofisticación de los algoritmos utilizados.

Finalmente se concluye que la Bioinformática se sustenta en el conocimiento


biológico real, en el contenido almacenado en enormes bases de datos, procesos
de abstracción a través del modelado matemático y la formulación de algoritmos
para llevar el modelo que describa y posteriormente permitas predecir información
(estadística probabilística). La gran oportunidad que representa la Bioinformática
para la vida, especialmente la humana, ya que a través de sus genes y estructura
molecular se puede analizar cómo interactúan en los seres vivos.

Bibliografía

Alvarado, M; et al. Preliminary study of the enzyme ubiquitin carboxylterminal


hydrolase 14 (UBP6) in Giardia intestinalis: Structural bioinformatic
analysis and transcriptional profile during encystation. Revista Colombiana
de Quimica. 43, 2, 32-40, May 1, 2014. ISSN: 01202804.

ARANA ERCILLA, MAYRA y ROBERTO VALDÉS ESPINOSA: "Tecnología apropiada:


concepción para una cultura", Revista Cubana de Ingeniería, vol. 4 , n.o 1, La
Habana, 2013, <http://rci.cujae.edu.cu/files/Vol_4_No_1_2013.pdf> [8/5/2014].

Arenas AF, Gutiérrez AJ, Gómez-Marín JE. Evolutionary origin of the protozoan
parasites histone-like proteins (HU). In Silico Biol.2007;8:2.

Backofen R., Gilbert D. “Bioinformatics and Constraints”. Constraints, 6; 2001: 141-


156.

Benítez-Páez A. Sequence analysis of the receptor activity-modifying proteins


family, new putative peptides and structural conformation inference. In Silico
Biol.2006;6:467-83.

Benítez-Páez A, Cárdenas-Brito S. Dissection of functional residues in receptor


activity- modifying proteins through phylogenetic and statistical analyses.
Evol Bioinform Online.2008;4:153-67.

Bermudez-Santana, c. Bioinformatics applications in medicine: The


human genome. How can we see such detail?. Acta Biologica
Colombiana. 21, 1, S249-S258, Jan. 1, 2016. ISSN: 19001649.
Recuperado de:
https://bibliotecavirtual.unad.edu.co:2098/record/display.uri?
eid=2s2.08
4965139112&origin=inward&txGid=7819dc6f539d78313f6b6a41bf2
923a 5

Blattner FR, Plunkett G 3rd, Bloch CA, Perna NT, Burland V, Riley M, et al. The
complete genome sequence of Escherichia coli K-12. Science.1997;277:1453-
74.8.

Cañedo Rubén. Bioinformática: en busca de los secretos moleculares de


la vida.
Recuperado de:
http://bvs.sld.cu/revistas/aci/vol12_6_04/aci02604.htm

Casadiego, Y. A. S. (2019). The Information Systems in Precision Agriculture and


Architectures for Decision Making.pdf. The Information Systems in Precision
Agriculture and Architectures for Decision Making.
https://doi.org/10.13140/RG.2.2.24149.47843

CASANELLA SAINT-BLANCARD, OSCAR: "Entrevista realizada a Luis Alberto


Montero Cabrera", mayo 22, Facultad de Química, Universidad de la Habana,
2014.

CASTRO, FIDEL: "Discurso pronunciado en el acto celebrado por la Sociedad


Espeleológica de Cuba, en la Academia de Ciencias", 15 de enero, 1960.

Claviere Jena-Michael and Notredame Cedric. 2007. Bioinformatics for


dummies. Wiley Publishing, Inc.

Collins F. S., Green E. D., Guttmacher A. E., Guyer M. S. “A vision for the future of
genomics research A blueprint for the genomic era”. Nature 2003, 422: 835-
847.

Collins F. S., Morgan M., Patrinos A. “The Human Genome Project: Lessons from
Large-Scale Biology”. Science, 2003, 300: 286-290.

Coltell O., Corella D. “Bioinformática y Epidemiología Genómica”. I+S. Informática


y Salud. Revista de la Sociedad Española de Informática y Salud; 2002, 37:
15-26.

Cook S. A., Rosenzweig A. “DNA Microarrays. Implications for Cardiovascular


Medicine”. Circ Res. 2002;91:559-564. INBIOMED. Red Temática de
Investigación Cooperativa de Informática Biomédica.
http://www.inbiomed.retics.net.

Córdoba, M., González Morón, D., Rodríguez-Quiroga, S. A., &


Kauffman, M. A. (2014). Artículo original: Neurología genómica
personalizada: el futuro es ahora. Neurología Argentina, 6127-136.
doi:10.1016/j.neuarg.2014.03.002

DÍAZ CABALLERO, JOSÉ RICARDO: "En torno a la periodización de la Técnica",


Tecnología y Sociedad, t. II, ISPJAE-MES, La Habana, 1999, pp. 10-18, ISBN
959-258-075-8.

DIAZ GRANADOS D., C., SANDOVAL, A. M., & CHAPARRO-GIRALDO, A.


(2013). DISEÑO DE UN GEN SEMISINTÉTICO CRY1Ac Y ANÁLISIS
DE LA ESTRUCTURA DE LA PROTEINA TRADUCIDA. (Spanish).
Biotecnología En El Sector Agropecuario Y Agroindustrial, 155-164

Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, et
al. Whole-genome random sequencing and assembly of Haemophilus
influenzae.. Science.1995;269:496-512.7.

Garnica DP, Pinzón AM, Quesada-Ocampo LM, Bernal AJ, Barreto E, Grunwald NJ,
et al. Survey and analysis of microsatellites from transcript sequences in
Phytophthora species: frequency, distribution, and potential as markers for
the genus. BMC Genomics.2006;7:245

Gutiérrez AJ, Arenas AF, Gómez-Marín JE. Molecular evolution of serine/arginine


splicing factors family (SR) by positive selection. In Silico Biol.2006;6:32.

Jackson D.G., Healy M.D., Davison D.B. Bioinformatics: not just for sequences
anymore. BIOSILICO 2003; I(3): 103-111.

Jones R.L. "The Internet and Healthcare Information Systems: How Safe Will
Patient Data Be?". IS Audit & Control Journal, I; 1998: 25-30.

Khoury M. “Genetic Epidemiology”. Rothman K.J., Greenland S. (eds.) Modern


Epidemiology (2nd ed.) Little, Bronw and Co., Boston, MA (USA), 1997.

Khoury M., Beaty T.H., Cohen B.H. Fundamentals of Genetic Epidemiology. Oxford
University Press, New York, 1993.
LAGE DÁVILA, AGUSTÍN: "La economía del conocimiento y el socialismo:
Reflexiones a partir de la experiencia de la biotecnología cubana", Cuba
Socialista, n.o 30,
La Habana, 2004, pp. 2-28,
<http://www.areitodigital.net/LAGE.AGUSTIN.economiacubana.II.OTO-
INV.05.htm> [15/5/2014].

Lahoz-Beltrá, R. 2012. Bioinformática: simulación, vida artificial e


inteligencia artificial. ISBN: 978-84-7978-181-1. Recuperado de:
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/detail.action?
docID =3196980

Marrugat J., Solanas P., D’Agostino R., Sullivan L., Ordovás J., et al. “Coronary risk
estimation in spain using a calibrated framingham function”. Rev Esp Cardiol
2003; 56: 253-261.

Martín Sánchez F., López V., Sánchez J. P., Liébana I. Red Temática de
Investigación Cooperativa en Informática Biomédica, INBIOMED. Revista I+S.
Informàtica y Salud, 2004, 46: 7-13.

Matute DR, Barreto-Hernández E, Falquet L. Hunting for insect-specific protein


domains. In Silico Biol.2006;6:35-42.

Méndez, E. & Rivas R. (2014). Nociones básicas para el análisis bioinformático de


proteínas. Departamento de Microbiología y Genética. Univeridad d
eSalamanca (España)

MOUNT W, DAVID: Bioinformatics, Sequences and Genomes Analysis, University of


Arizona, Tucson, 2002.

NÚÑEZ JOVER, JORGE: La ciencia y la tecnología como procesos sociales, Félix


Varela, La Habana, 1999.

NÚÑEZ JOVER, JORGE: "La democratización de la ciencia y el problema del poder",


en Emilio Duharte Díaz et al., La política: miradas cruzadas, Editorial de
Ciencias Sociales, La Habana, 2006.

Oscar Antonio Casanella Saint-Blancard, Kenia Rodríguez Jorge.2015. La


introducción de la bioinformática en el Instituto Nacional de
Oncología y Radiobiología. Revista Cubana de Educación Superior.
2015. (3). 166-177. Recuperado de:
http://bibliotecavirtual.unad.edu.co:2171/eds/pdfviewer/pdfviewer?
vid=1 &sid=3f5c2a33-d9fa-4111-b3ae-f18352ad58cd
%40sessionmgr4006

PARTIDO COMUNISTA DE CUBA (PCC): Lineamientos de la Política Social del


Partidoy la Revolución, La Habana, 2011.

Peña MD, Castellanos O, Carrizosa S, Jiménez C, Del Portillo P. La biotecnología,


otor de desarrollo para la Colombia de 2015. Bogotá D.C.: Colciencias; 2008.

Pérez-Llano, Yordanis and María del Carmen Luzardo Lorenzo. "Nuevo


Diseño Para Una Clase Práctica De Visualización Y Análisis De La
Estructura Tridimensional De Las Proteínas." ["New design for a
practical lesson on visualization and analysis of the three-
dimensional structure of proteins"]. Cuban Journal of Biological
Sciences / Revista Cubana De Ciencias Biológicas, vol. 5, no. 1, feb-
sep2016, pp. 65-70. EBSCOhost, search.ebscohost.com/login.aspx?
direct=true&db=a9h&AN=116582088&l ang=es&site=eds-live.

Philippe Lemey, Marco Salemi, Anne-Mieke Vandamme. 2009. The


Phylogenetic Handbook.A Practical Approach to
Phylogenetic.Analysis and Hypothesis Testing. Cambridge University
Press.The Edinburgh Building, Cambridge CB2 8RU, UK encontrado
en www.cambridge.org/9780521877107

Rodríguez-Correa, Hernando, et al. "Perspectivas De La Ecología


Molecular en Un País Megadiverso." ["Perspectives of Molecular
Ecology in a megadiverse country (English)"]. Revista Mexicana
De Biodiversidad, 22 May 2017. EBSCOhost,
doi:10.1016/j.rmb.2017.10.002.

Science’s News staff. “A History of the Human Genome Project”. Science


Magazine; 291 (5507); 2001: 1195-1261.

También podría gustarte