Está en la página 1de 3

INSTITUTO TECNOLOGICO SUPERIOR DE LERDO

ARCHIVOS DE SECUENCIA
GABRIEL MICHEL CARRILLO
10231485

2012

ADMINISTRACION Y ORGANIZACIN DE DATOS

Archivos secuenciales
Los archivos secuenciales se pueden definir como el conjunto organizado de informacin, estos muestran una forma ms simple de almacenar y recuperar los datos y registros de un archivo. La estructura comn de un archivo es la secuencial, en esta un formato de estado fijo es usado para los registros.

Algunos ejemplos de estos tipos de archivos son los siguientes: Formato PHYLIP: es un formato de secuencias de caracteres y de residuos de aminocidos que se utiliza frecuentemente como formato de entrada de diferentes programas o paquetes de anlisis tales como: PHYLIP, LARD, PLATO, SPOT; entre otros. Caracterstica: La primera lnea del archivo contiene el nmero de especies o secuencias a analizar y luego, el nmero de caracteres separados por espacios en blanco. Seguidamente, se debe colocar el nombre o identificador de cada especie o secuencia (mximo 10 caracteres) que puede incluir signos de puntuacin y espacios en blanco. Luego debe colocarse la secuencia en s; es decir los caracteres, en cdigo de una letra, correspondientes a la protena, molcula de ARN o de ADN. Las secuencias pueden ser colocadas en columnas de diez caracteres cada una para facilitar la lectura de las mismas. Luego puede o no colocarse una lnea en blanco separadora entre el primer y el segundo grupo de secuencias. Es importante que el nmero de caracteres de todas las lneas sea igual. GenBank: este formato es el utilizado para los reportes de secuencias tanto de caracteres como de aminocidos que se encuentran almacenados en el GenBank . Principalmente se caracteriza por proporcionar al usuario una informacin bastante completa sobre la secuencia. Los programas del GCG pueden utilizar archivos obtenidos en bsquedas en el GenBank, pero para que esto sea posible, es necesario primero cambiarle el formato al archivo.

CLUSTAL: es uno de los muchos formatos para archivos de secuencias alineadas ms utilizados por los programas de anlisis de secuencias. Sus principales caractersticas son: tanto nucletidos como aminocidos son representados por el cdigo de una letra, los gaps son indicados con un guin "-" y al final de las secuencias alineadas, puede aparecer una especie de secuencia consenso con signo como: "*", ":" y "." MSF: Un formato para dos o ms secuencias alineadas, donde l "." representa un gap, los nucletido o aminocidos son representados en su cdigo de una letra, y la secuencia es escrita en columnas de diez letras cada una. El comienzo de la secuencia es marcado por dos backslashes: // MSF del GCG: los programas de GCG, para poder utilizar como archivo de introduccin de datos uno con este formato, las siguientes caractersticas requieren ser especificadas: tipo de archivo (!!AA_MULTIPLE...), comienzo de la seccin correspondiente a la secuencia (" ... ", comienzo de secuencia (" // ").

Conclusin:
Como conclusin se puede decir que los archivos de secuencia son aquellos que nos permiten manipular algunos tipos de archivos, tambin son ms fciles de almacenar datos o registros. Estos se caracterizan por tener un indicador nico, que son de tipo carcter como por ejemplo -, ., etc., otra caracterstica es como su nombre lo indica archivos de secuencia, es porque llevan una secuencia archivo tras archivo y eso facilita el almacenamiento y manipulacin de estos.

También podría gustarte