Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase de Aplicaciones en Genomica Del PDS
Clase de Aplicaciones en Genomica Del PDS
genómica
Procesamiento Digital de Señales
Carrera de Bioinformática
Facultad de Ingeniería- UNER
Secuencia de ADN
• A, T, C, G : Nucleótidos o bases
• Cada nucleótido tiene dos terminaciones distintas: 5´y 3´
• La 5´terminación de un nucleótido se une a la 3´de otro nucleótido
• Por convención se representa la secuencia de nucleótidos para una
simple hebra de la 5´a la 3´ terminación de izquierda a derecha.
Dos hebras tienden a formar una
doble hélice
Doble hélice
• Los nucleotidos de ambas
hebras de unen quimicamente
según:
A-T
C-G
Representación de la molécula de
ADN
Hebras complementarias
5´ …A-G-A-C-T-G-A-A… 3´
5´ …T-T-C-A-G-T-C-T… 3´
Una molécula de ADN de doble hebra puede
representarse por cualquiera de las dos cadenas de
caracteres leídas en la dirección de 5´ a 3´
Genes, intrones y exones
PDS
Características Decisión:
unidimensionales / Codifica
multidimensionales No codifica
Secuencia Conversión Secuencia(s)
de ADN Numérica Extracción de
en valores Clasificación
características
numéricos
Representación numérica de la
secuencia de ADN
• Representación binaria (Voss)
• Z-curve
• Tetraedro
• Representación Compleja
• quaternion representation
• In the EIIP (electron-ion interaction potential) method
• Pares numéricos
• Frecuencia de ocurrencia de nucleótido
• Otras
Representación binaria (Voss)
• Mapea los nucleótidos en cuatro secuencias
binarias indicadoras
A-G-A-C-T-G-A-A
Tetraedro
Ejes de coordenadas
r
b
Tetraedro
Se puede elegir
A:
T:
C:
G:
Tetraedro
C A
G T
• Explota dos
propiedades
1. Los intrones
Ángulo de fase promedio
Exón Intrón
Prom φ
φ4x φ5x φ6x φ7x
φ2x φ3x
φ1x
Histograma x
x= A,C,T,G
φ
Pares Numéricos
Histograma del ángulo de fase de la TDF
• A-T = +1
• C-G= -1
- Se asignan +1 y -1 para indicar la presencia de A-T y C-G
respectivamente.
- Resulta una sola secuencias que reduce los costos del
procesamiento de la TDF en comparación a otros métodos que
utilizan más secuencias (Voss, Curva Z, Tetraedro).
Frecuencia de aparición de
nucleótidos
ATGCTATT…
x[n] = {0.23326, 0.20354, 0.28179, 0.28142,
0.20354, 0.23326, 0.20354, 0.20354,…}
Otras Representaciones
Transformadas de
Fourier
individuales
Medición del contenido espectral
(SC)
Contenido espectral
(SC)
P=S[N/3] /mean(S)
V F
P>=4
Exón No exón
Medida de la rotación espectral
Exón Intrón (SR)
Gen A Gen B Gen C
Prom φ
φ4x φ5x φ6x φ7x
φ2x φ3x
φ1x
Histograma x
x= A,C,T,G
φ
Medida de la rotación espectral
(SR)
• Este método gira los cuatro “vectores”(
) en sentido horario cada uno en
un ángulo equivalente al promedio del ángulo
de fase en las regiones codificantes.
• Esto hace que todos los vectores “apunten” en
la misma dirección
Medida de la rotación espectral
(SR)
• A su vez divide cada término por su
correspondiente desviación del ángulo de fase
para darle más peso a las distribuciones
exónicas. Media del ángulo
de fase en regiones codificantes
'ATGCTATT....´
DFT
Voss
A-G-A-C-T-G-A-A
• AMDF
Algorimto en el dominio temporal
• TDP
• otros
Magnitud promedio de la función
diferencia (AMDF)
• Algorítmo muy eficiente
Time-Frequency Hybrid (TFH)
Measure
Espectrograma
Espectrograma de ADN
Magnitud
TDF
RGB
Espectrograma de ADN
Frecuencia k