1. Objetivo del tutorial: Familiarizarse con la plataforma
de Galaxy con el objetivo de aplicarlo a el análisis de datos científicos extraídos de lo visto en la genómica, ademas de gestionar procesos iniciales básicos como la subida y lectura de datos y cómo leer estas aplicaciones.
2. FastQC- la herramienta tiene como funcion dar un
aproximado score logaritmico que dicta el posible porcentaje de un margen de error de que una base sea realmente la base dada por la secuenciación. Este va generalmente de 0 a 40, donde cada valor numérico apunta a un “porcentaje” de certeza, según cada base analizada dada por la lectura de illumina es real.
3. Entre el tamaño de 30 y 90 reads para cada pb, es
donde se encuentran los mejores scores de calidad (se indica un aproximado de 39, ninguno llega a 40).
Parte 2.
1. Aprender a utilizar la interfaz de Galaxy, entre estos
entender el funcionamiento de su enfoques: desde las funciones básicas hasta las funciones más complejas como obtener los nombres de los genes.
2. El archivo contiene dataset de regiones de interés de
ratones. Según el tutorial, a partir de las fuentes de datos de la UCSC podemos extraer información de nuestro interés para comparar secuencias, identificar regiones cromosómicas y leer posiciones de cada par de bases.
Parte 3.
1. El objetivo del tuyorial 3 es aprender la empleabilidad
de los datos extraídos de guías de prácticas (NGC). Estos en su mayoría se componen de datos del tipo FASTQ. Dado que este tipo de formato aún no está completamente definido, hay cierta libertad para manipularlos y conseguir información de interés científica. Para ello, se aprende también a depurarlos y enseña ciertas aplicaciones.
2. El formato SAM es usado para almacenar información
de alineadareads, que es un formato genérico de alineación de nucleotides. El formato Fasta, así mismo, es también un formato de almacenamiento de secuenciación de ácidos o peptides. Sin embargo, la diferencia radica en que el formato SAM está acompañado de archivos .bai (que configura a archivos del tipo búsqueda).
3. La herramienta MAP with funciona como un alineador
de secuencias de lectura corta. Se usa como algoritmos de alineación de lecturas de secuencias contra genomas de referencia con el objetivo de permitir una combinación de multiples conjuntos de datos, dado que analiza extremos emparejaros y alineación quiméricas.