Está en la página 1de 7

UNIVERSIDAD TÉCNICA DE AMBATO

FACULTAD DE CIENCIA E INGENIERÍA EN ALIMENTOS Y


BIOTECNOLOGÍA

BIOINFORMÁTICA

APE 1 – Segundo Parcial

Integrantes:

Curso: 6° “A”

Fecha: 14 de junio del 2023

Tema: Análisis de microarrays

Introducción

Los microarreglos, conocidos también como herramientas arrays o chips de ADN, han
revolucionado el campo de la genómica y la biología molecular en las últimas décadas.
Permitiendo el análisis simultáneo de miles o incluso millones de secuencias de ADN o
ARN en una sola muestra, brindando una visión completa y detallada del perfil genético
o de expresión génica de un organismo (Murrieta & Sánchez, 2019). Un microarreglo
está compuesto por una superficie sólida, generalmente un vidrio o una placa de silicio,
en la que se encuentran dispuestas de manera ordenada y específica sondas de ADN o
ARN. Estas sondas son secuencias cortas y específicas de nucleótidos que corresponden
a genes o regiones específicas del genoma (Paz, 2015). Gracias su disposición, los
microarreglos han permitido la hibridación simultánea de las moléculas objetivas
presentes en la muestra con las sondas en el chip, proporcionando información valiosa
sobre los patrones de expresión génica que permiten identificar genes que están activos
o inactivos en diferentes condiciones o estados celulares (Guerrero, 2015).

El análisis de los microarreglos es la parte de mas importante de la investigación ya que


nos permite obtener información valiosa sobre los mecanismos biológicos y las
asociaciones con enfermedades (López, 2017). La interpretación es la etapa más crítica
en el análisis ya que requiere de conocimientos en herramientas y métodos
bioinformáticos avanzados tales como el análisis el gráfico de componentes principales
(PCA), gráfico de mapa de calor (heatmap), gráfico de agrupamiento jerárquico de datos
sin procesar (clustering) y el gráfico de volcano plot.
Figura 1.

Diagrama de cajas de la distribución de los datos de las muestras.

Nota: la figura 1 presenta una distribución no tan homogénea en las muestras control
marcadas con un color rojo intenso en la cual se observa que exista una variabilidad
significativa de los datos en la muestra 601 y 599, por otro lado, en las muestras
inducidas marcadas de color azul también se observa una variabilidad tanto significativa
en la muestra 594.

Figura 2.

Clustering del agrupamiento de las muestras control e inducidas


Nota. En la figura 2 se observa dos clusters principales, en el primero ubicado en la
parte izquierda se observan las muestras inducidas, y en el segundo en la parte derecha
manifiesta las muestras control. En el primer cluster principal se observa dos clusters
secundarios en el cual en el primero están las muestras 496 y 599, y en el segundo
cluster están las muestras 597, 595 y 601, en donde se puede observar que la muestra
601 que en la figura 1 presentaba una baja uniformidad en sus datos se muestra más
cercana a las muestras control el cual pone en manifiesto su alta variabilidad por la cual
según Guzmán, (2021) no se debe tomar en cuenta. Por otro lado, la muestra 594
ubicada en el segundo cluster principal no pertenece a los controles y debe ser
eliminada. Así también la muestra 599 que pertenece a los controles que está mal
ubicada en las muestras inducidas, también debe ser eliminada (Guzmán, 2021).

Figura 3.

Gráfica de los dos primeros PC para expresiones en datos brutos.


Nota: La Figura 3, se puede analizar las diferentes componentes de PC, en este caso
PC1 y PC2 con un porcentaje total de 79,7% respecto a la variabilidad de los datos
presentes (WT e inducido). Mediante esta imagen podemos determinar que los datos
presentes de micro arrays no se agrupan, y sobre todo que manejan una distinción
considerable entre los mismos, puesto que la componente en el eje X de PC1 tiene un
60.0% de variabilidad y la PC2 en el eje de las Y con una variabilidad de 19.1%,
asegurando lo antes mencionado, por otro lado, gráficamente es notable que, están tan
dispersas, asumiendo que el de mayor distinción o variabilidad frente a las demás
muestras es el array 594_Ind, debido a que en su clusters el que mantiene mayor
diferencia o aislamiento. Cabe mencionar que este PCA está conformado por dos
clusters. Es factible mencionar que la alta variabilidad de las muestras 594_Ind,
598_WT, 6 y el 600_WT, vendrían a ser muestras con variabilidades amplias referente a
los demás datos, por lo que lo recomendable seria no tomarlas en cuenta y simplemente
eliminarlas (Martínez, 2018).

Figura 4.
Genes expresados diferencialmente Inducidos vs Tipo salvaje (WT).

Nota: En la presente imagen, de acuerdo con la expresión de los genes mediante la


diferenciación de los mismos, entre Ind y WT, podemos inducir que el plot con eje X de
dos logaritmos y en el eje Y trabajando con el logaritmo negativo correspondientes a los
valores de P – value trabajado, que en este caso fue de 0.05. Se describe la imagen como
la expresión de los genes y tomando en cuenta que, el solapamiento entre ellos
representa una sobre expresión, así también, se verifica la diferenciación de expresión
de los arrays, tomando como punto de partida el 0, verificamos que mientras más
alejados (hacia arriba y a la derecha o izquierda), representan una mayor variabilidad,
sin embargo, estos más distantes de los tomará como más relevantes puesto que su
similitud frente al resto no es la misma. Se puede mencionar que el volcano plot
implementado tiene su fin en permitir la rápida identificación visual de los genes con
grandes cambios o pliegues que resultan ser estadísticamente significativamente, como
se presenta en la imagen los genes más en la parte superior (Blighe, 2023).

Figura 5.
Características principales de los niveles de la DEG filtrados.

Nota: En la figura de características principales en niveles de la diferenciación de


expresión génica o DEG de los filtrados, asumimos que, se presenta un solapamiento
muy evidente entre los genes, así como también se verifica la variabilidad de algunos
que puntúan más arriba siguiendo el nivel de expresión IQR guiado por las Y, así como
si nivel de expresión en base a la mediana guiada por el eje X. Es factible mencionar
que la imagen compuesta presenta demasiada expresión de genes, similares, o
repetitivos, es recomendable elaborar un segundo filtrado de los arrays con el fin de
minimizar el solapamiento de genes, pero maximizando la observación de genes de
interés expresados. (Blighe, 2023).

Bibliografía

Blighe, K. R. (2023). EnhancedVolcano: publication-ready volcano plots with enhanced


colouring and labeling. Bioconductor,
https://bioconductor.org/packages/devel/bioc/vignettes/EnhancedVolcano/inst/
doc/EnhancedVolcano.html#introduction.

Guerrero, I. (2015). Desarrollo de microarrays de altas prestaciones basados en


atrapamiento con un hidrogel. Aplicación a inmunoensayo y ensayos
genéticos (Doctoral dissertation, Universitat Politècnica de València).
Guzmán, A. (2021). Nuevos algoritmos basados en grafos y clustering para el
tratamiento de complejidades de los datos (Doctoral dissertation, Universitat
Jaume I).

Guzmán, A. (2021). Nuevos algoritmos basados en grafos y clustering para el


tratamiento de complejidades de los datos (Doctoral dissertation, Universitat
Jaume I).

López, L., Santiesteban, C. E., & Giráldez Rojo, R. (2017). Inferencia de redes de
asociación de genes empleando algoritmos genéticos y topología de
grafos. Revista Cubana de Ciencias Informáticas, 11(3), 21-35.

Martínez, C. G. (2018). ANÁLISIS DE COMPONENTES PRINCIPALES (PCA).


RPubs - by RStudio, https://rpubs.com/Cristina_Gil/PCA.

Murrieta, M. E. R., & Sánchez, J. F. V. (2019). Microarreglos de ADN: aplicaciones en


la microbiología. Epistemus, 13(27), 45-50.

Paz, L. P. (2015). Algoritmos de identificación de biclústeres con evolución coherente


en microarreglos de ADN [Algorithms for discover coherent evolution biclusters
on DNA microarrays. Ventana Informática, (33).

Westhoff, T. H., Scheid, S., Tolle, M., Kaynak, B., Schmidt, S., Zidek, W., ... & van der
Giet, M. (2005). A physiogenomic approach to study the regulation of blood
pressure. Physiological genomics, 23(1), 46-53.

También podría gustarte