A partir de un gen se produce un transcrito que despus es procesado y al final resulta en un mRNA maduro que codifica para la protena. En los proyectos de secuenciacin, al margen del genoma, para llevar a cabo la anotacin es fundamental disponer de informacin adicional. En este caso, los ESTs seran colecciones de cDNAs que se han secuenciados. No tiene porqu ser en su totalidad sino al menos los extremos (los ESTs son secuencias parciales derivadas de la secuenciacin de parte de un cDNA) A partir de distintos tejidos, se aisla mRNA total y se establecen libreras de cDNA, que despus son secuenciadas obteniendo colecciones de EST, es decir, genes que se expresan particularmente en esos tejidos. Actualmente se puede secuenciar masivamente la poblacin de RNA sin realizar genotecas como tal. Por comparacin de la secuencia del RNA y de secuencias del genoma a anotar, pueden identificarse genes y asociarlo con un determinado tejido, etc... Combinando toda esta informacin, permite anotar genes y en muchos casos identificarlos, orientado a una posible funcionalidad.