Está en la página 1de 3

JOURNAL OF PDS

RECONOCIMEINTO DE PICOS PARA SEALES


MALDI
Felipe Andino M., Electrnica y Control, EPN; Daniel Suntaxi S., Electrnica y Control, EPN

ResumenEn este documento se proceder a analizar seales


MALDI, y despus procesarlas decimandolas, extrayendo los
picos de dichas seales decimadas y finalmente analizar los picos
relevantes o los mismos que se encuentran por encima de cierto
umbral fijado previamente.
Index TermsMALDI, MALDI-TOF, downsampling, upsampling, Pick.picking.

I.

I NTRODUCCIN

ALDI es una tcnica de ionizacin suave utilizada en


espectrometra de masas. Se denomina MALDI por sus
siglas en ingls Matrix-Assisted Laser Desorption / Ionization
(desorcin/ionizacin lser asistida por matriz) y TOF por el
detector de iones que se acopla al MALDI y cuyo nombre
procede tambin de sus siglas en ingls Time-Of-Flight [1][2].
MALDI-TOF permite el anlisis de biomolculas (biopolmeros como las protenas, los pptidos, los azcares y los
lpidos) y molculas orgnicas grandes (como los polmeros,
y otras macromolculas) que tienden a hacerse frgiles y
fragmentarse cuando son ionizadas por mtodos ms convencionales.
A las seales MALDI se debe realizar un proceso de
modificacin de la frecuencia que puede ser decimacin
(downsampling) o interpolacin (upsampling), para este caso
se realizar downsamplig [3].
Una vez realizado la decimacin se debe realizar el siguiente
algoritmo Pick-picking que significa la extraccin de picos,
ya sea todo el espectro o de regiones seleccionadas. No
se consideran todos los picos solo se determinan los ms
relevantes de la seal, los cuales se filtran. Tambin hay un
valor mnimo de umbral: las seales ms dbiles se ignoran
[4].

II-A. ALGORITMO DESARROLLADO


El algoritmo desarrollado toma la muestra y elimina los
valores consecutivos que se repiten, despus con la muestra
total reducida, se proceder a obtener una muestra diez veces
menor a la muestra total, por lo que se procede a tomar un rango equivalente a diez muestras de las cuales se elimina nueve
y se conserva una , representando los datos ms relevantes.
Como se aprecia en la siguiente grfica:

II.

Figura 1. (a) Muestra, (b) Decimacin, (c) Pick-picking, (d) Picos Relevantes.

Una consideracin importante en el algoritmo desarrollado,


es que el procedimiento de la decimacin es aleatorio, por lo
que si se vuelve a ejecutar el algoritmo se obtendrn valores
diferentes.
II-B. DOWNSAMPLE
Matlab cuenta con la funcin downsample. Esta funcin
disminuye una muestra a otra de menor tamao dado un factor,
en nuestro caso diez veces menor.

DOWNSAMPLING

Se procede a realizar una modificacin en frecuencia de la


seal, disminuyendo la cantidad de muestras(downsampling)
para realizar posteriormente un procesamiento de la seal ya
modificada con menos muestras y as tener un tiempo de
procesamiento ms rpido.
Para una comprensin entre tiempo de procesamiento y
confiabilidad de los datos obtenidos, realizaremos un algoritmo
que nos permita de cada diez muestras; eliminar nueve y
mantener una, y as tener una nueva muestra diez veces
menor a la muestra original. Adems utilizaremos el comando
downsample proporcionado por MATLAB. Finalmente compararemos los resultados obtenidos entre nuestro algoritmo de
decimacin y la funcin downsample.

Figura 2. (a) Muestra, (b) Decimacin, (c) Pick-picking, (d) Picos Relevantes.

JOURNAL OF PDS

II-C.

COMPARACIN DE LOS RESULTADOS

Observando la Figura 1 y la Figura 2, se concluye que


al realizar el proceso de la decimacin o el downsampling,
obteniendo una muestra diez veces menor a la original, no
se logra apreciar gran diferencia entre las dos figuras, ms
cuando se selecciona los picos ms relevantes, se concluye que
el proceso de downsampling utilizando la funcin de Matlab
conserva ms muestras significativas, por lo que al ejecutar el
algoritmo desarrollado para discernir los picos mas relevantes,
la muestra obtenida con el downsampling nos otorga ms
cantidad de picos significativos.
Anteriormente se mencion que el algoritmo desarrollado
es aleatorio, por lo que los valores obtenidos de la muestra
decimada ser diferente cada vez que se ejecute este algoritmo,
al igual que la funcin de Matlab(downsample), la diferencia
experimental radica en que la funcin de matlab procesa
mucho ms rpido que el algoritmo desarrollado.
Finalmente, no se podra dirigir el proceso de disminuir la cantidad de datos para procesar los picos relevantes, pero tomando en cuenta los picos significativos obtenidos(confiabilidad de los datos) y el tiempo de procesamiento,
se opt por el segundo mtodo, es decir, la funcin de matlab,
para el siguiente paso de procesar las 78 muestras de 10000
datos.
III.

ANLISIS DE LOS PICOS

Despus de elegir el mtodo ms conveniente para el anlisis de nuestra muestra completa, procesamos las 78 muestras
de 10000 valores cada una.

Figura 4. Picos Relevantes

La Figura 4 muestra los picos ms relevantes, es decir


aquellos que se encuentran por encima del umbral (para
nuestra aplicacin a 0.8 del Pico mximo), donde se obtiene de
igual manera una cantidad enorme de datos, donde se aprecia
el comportamiento de la muestra analizada.
Con tantos picos en cuestin y de las 78 muestras deben
existir picos que se repitan y estos al final podran considerarse
los picos totalmente relevantes y aquellos que marquen el
comportamiento general de esta.
IV. PICOS REPETIDOS
Dentro de las muestras de los picos relevantes, el siguiente
paso es detectar los picos que se repiten y a su vez contabilizar
las veces que lo hacen, es decir tener un grfico que nos ayude
a observar los picos repetidos y la frecuencia con que lo hacen,
para al final lograr obtener una comprensin de como se esta
comportando la muestra.

Figura 3. (a) Muestra, (b) Decimacin, (c) Pick-picking, (d) Picos Relevantes.

En la grfica se aprecia primero, la muestra total de 780000


valores, despus con la funcin downsample de Matlab se
redujo la muestra a diez veces menos, obteniendo una muestra
mas procesable de 78000 valores.
Despus se observa el efecto de realizar el pick-picking de
la muestra decimada, como se observa en el tercer grfico.
De diferentes colores (78 exactamente) se logran apreciar
todas las muestras decimadas y realizadas el respectivo pickpicking, de aqu se concluye que existen varios picos de
diferente proporcin, algunos demasiados pequeos como para
descartarlos, de aqu es donde se elige un umbral a a partir
del cual se consideran los picos relevantes, la consideracin
del umbral esta entre 0 y el Valor del pico Mximo.

Figura 5. Picos Repetidos

Observando el grfico se llega a concluir que entre 650


y 700 se obtiene las muestras ms representativas, ya que
aqu estn los picos ms relevantes, esta zona es en donde
se concentran los picos ms comunes entre todas las muestras
y en 655 es donde la frecuencia de las muestras es mayor, se
obtienen 4 valores que se repiten en todo el rango de muestras.
La mayora de los picos que se repiten, muestran un
comportamiento de mximo 2 veces, lo que quiere decir que
en su gran mayora los picos solamente se repiten una vez, a
partir del umbral seleccionado.

JOURNAL OF PDS

V.

C ONCLUSIONES

El proceso de downsampling o decimacin reduce la


velocidad de datos o el tamao de los datos. El factor
de decimacin es generalmente un nmero entero o una
fraccin racional mayor que uno. Este factor multiplica el
tiempo de muestreo o divide la frecuencia de muestreo.
De esta manera se obtiene la dcima parte de la muestra
total sin causar mayores variaciones en la muestra original con una mayor facilidad de procesamiento de datos.
Por medio del proceso de downsampling incluido en la
herramienta Matlab se conservan las muestras ms significativas; al ejecutar este algoritmo las muestras obtenidas
otorgan la mayor cantidad de picos significativos.
Observando el grfico se llega a concluir que entre
650 y 700 se obtiene la mayor cantidad de muestras
significativas. Aqu se observan los picos ms relevantes,
esta zona es en donde se concentran los picos ms
comunes entre todas las muestras.
En la posicin 655 se puede observar que la frecuencia
mostrada es la mayor de las muestras, dado que aqu se
obtienen 4 valores que se repiten en todo el rango de
muestras.
VI.

B IBLIOGRAFA

[1] An overview of Module II: MALDI-TOF MS


Analysis http://iitb.vlab.co.in/?sub=41&brch=118&sim=
786&cnt=1373Tomado,mayo2015
[2] Analysis of mass spectrometric data: peak picking
and map alignment, Eva Lange, Universitat Berlin,
2008 enlace: http://www.diss.fu-berlin.de/diss/servlets/
MCRFileNodeServlet/FUDISS_derivate_000000004356/
thesis.pdf
[3] Procesamiento Digital de seales, Francisco Gmez,
Ingeniera Informtica http://arantxa.ii.uam.es/~taao1/
teoria/tema5/tema5.pdf
[4] http://www.inmr.net/Help3/ref/picking.html,tomado.
05/05/2015