Está en la página 1de 7

Manual rpido de uso de Tools for Population Genetics (TFPGA)

Recuerda que el programa viene con un manual en pdf (llamadao TFPGADOC.pdf) ubicado en la misma carpeta en la que instalaste el programa (generalmente: C:/TFPGA/TFPGADOC.PDF) LEELO!!!

1.- Abrir el archivo, revisar datos y describirlos


1.- File 2.- Open Data File 3.- Indicar que muestre todos los archivos (no solo los .dat o .txt) 4.- Indicar la unidad en la que se ecuentra nuestro archivo (generalmente C:) 5.- Buscar la carpeta en la que se encuentra nuestro archivo (nota: dos puntos es para subir un nivel) 6.- Indicar nuestro archivo 7.- Picar Abrir.

8.- Revisa que el recuadro Data est seleccionado ya que de lo contrario no te mostrar tus datos y te mostrar los resultados (que an no existen). El formato de TFPGA es como sigue: en cada rengln se indica un individuo. Las columnas estn separadas por una coma y divididas en dos secciones: antes del espacio y despus del espacio. Las columnas que se encuentran antes del espacio se llaman cabecera e indican la poblacin, subpoblacin y sub-subpoblacin a la que pertenece el individuo; cada nmero indica una poblacin y/o subpoblacin. En nuestro ejemplo tenemos dos poblaciones: la uno con tres subpoblaciones (1,1 1,2 y 1,3) y la dos con otras tres subpoblaciones (2,1 2,2 2,3). Las columnas que se encuentra despus del espacio indican los alelos de cada locus. Cada locus se indica en una sola columna (en nuestro ejemplo solo tenemos un locus) y los alelos se indican con nmeros: - para geles dominantes 0 indica ausencia y 1 indica presencia para geles codominantes cada alelo se indica con dos nmeros 11, 12, 22 - (en nuestro ejemplo tenemos un locus con 5 alelos: 1, 2, 3, 4, 5 que nos dan los genotipos indicados en el archivo: 11, 12, 13, 14, 15, 22, 23, 24, 25, 33, 34, 35, 44, 45, 55)

9.- Pica Describe Data Set.

10.- Indica el nivel al que llegan tus datos (en nuestro caso subpoblaciones).

11.- Indica el nmero de loci que estamos analizando (en nuestro caso uno) 12.- Indica el nmero mximo de alelos que puede haber por locus (en nuestro caso tenemos un solo locus y este tiene 5 alelos) 13.- Indica el nmero de poblaciones estudiadas (en nuestro caso dos) 14.- Indica el nmero mximo de subpoblaciones que hay en las poblaciones (en nuestro caso cualquiera de las dos poblaciones tienen un mximo de tres 15.- Indica si el organismo es diploide o haploide 16.Indica si el marcador es dominante o codominante (los ISSR son dominantes, los microsatlites son codominantes). 17.pica OK. Nota: si te sale una ventanita como esta:

Quiere decir que la descripcin que acabas de hacer no coincide con la base de datos que abriste. Revisa de nuevo tus datos y vuelve a describirlos. Ahora ya estn cargados tus datos. Inicia tu anlisis!!!!

2.- Descriptive Statistics


Este anlisis estima las frecuencias allicas, frecuencias genotpicas, heterocigosis y el polimorfismo de tus datos. 1.- Pica Analyze 2.- pica Descriptive Statistics 3.- Pica Options para indicar cmo calcular la heterocigosis y el polimorfismo. 4.- Indica a qu niveles quieres el anlisis Entire data set Populations y Subpopulations si quieres que te indique el nivel de diversidad (Heterocigosis y polimorfismo) para cada uno de estos niveles. Entire data set te da la H y P para todos los datos sin considerar estrucrura. Populations te va a dar la H y P para cada poblacin y Subpopulations te va a dar la H y P para cada subpoblacin. 5.- Indica las opaciones que desees: Calculate Allele and Heterozygote Frequencies para que te muestre las frecuencias allicas y genotpicas. Calculate Per Locus Heterozygosities para que te indique las heterocigosis por cada locus (adems de las indicadas en el punto 4). Calculate Average Heterozygosities over Loci para que te indique la Heterocigosis promedio . Calculate Percent Polymorphic Loci para que te indique el polimorfismo. 6.- Pica OK

7.- Para iniciar el anlisis pica Analyze --> Descriptive Statistics --> Start analysis. La pantalla va a mostrar los resultados (Nota: no le hagas caso a -unbiased- ni a -direct count-). En algunos casos, cuando el archivo de resultados es muy grande, el programa no puede mostrarlo en pantalla, por lo que te va a pedir que lo guardes en un archivo, en ese caso, gurdalo como txt (ponle el nombre que quieras con la terminacin .txt - punto txt-) y luego abrelo con el block de notas. 8.- Interpreta los datos de diversidad gentica.

3.- F-statistics
Este anlisis estima la estructura poblacional. 1.- Pica Analyze 2.- pica F-statistics 3.- pica Options. 4.- Selecciona las opciones que desees que el programa ejecute: Show results for each allele si deseas conocer la estructura de los alelos (adems de las poblaciones) Show results for each locus (si deseas conocer la estructura de cada locus) Jackknife over loci para que haga una prueba de que tan slidos son tus datos (el jacknife hace muchas repeticiones del anlisis pero cambiando los datos en cada vez para probar la solidez de tus resultados). 5.- Determina si deseas o no hacer la prueba de Bootstrap (esta es otra prueba de solidez de datos en la que el anlisis se repite el nmero de veces que le indiques y te indica con un porcentaje de confianza -que tambin le indicas- qu tan slidos son tus datos-) 6.- pica OK

7.- pica Analyze --> F-statistics --> Start analysis. para iniciar el anlisis. 8.- Interpreta los datos de estructura poblacional. Recuerda que para TFPGA: f indica Fis, F indica Fit y theta indica Fst. Theta S indica Fst, Theta P indica Fis y Theta SS indica Fis. En algunos casos, cuando el archivo de resultados es muy grande, el programa no puede mostrarlo en pantalla, por lo que te va a pedir que lo guardes en un archivo, en ese caso, gurdalo como txt (ponle el nombre que quieras con la terminacin .txt - punto txt-) y luego abrelo con el block de notas.

4.- Genetic distance


Calcula la distancia gentica entre las poblaciones y/o subpoblaciones. Este anlisis nos va a mostrar una tabla de distancias genticas entre todos los pares de poblaciones y/o subpoblaciones de nuestra muestra. Una distancia de 0 indica que las poblaciones comparten el 100% de sus alelos, es decir que son idnticas y una distancia grande (generalmente de 1) indica que no comparten ninguno de sus alelos, es decir, que son completamente diferentes. Nota: este parmetro se entiende e interpret mejor luego de hacer el UPGMA (rbol de distancias o representacin grfica entre las distancias) 1.- Pica Analyze 2.- Genetic Distance 3.- Options. 4.- Selecciona entre quienes quieres calcular las distancias: entre las poblaciones y/o entre las subpoblaciones 5.- Selecciona el modelo con el que se va a medir la distancia gentica (te recomiendo usar Nei, 1972,1978 que va de 0 a 1). 6.- Selecciona el tipo de tabla que quieres que te muestre: en columnas (expanded format) o en tabla de contingencia (matrix format). 7.- pica OK.

8.- Pica Analyze --> Genetic Distance --> Start analysis para iniciar el anlisis. El programa te va a mostrar dos valores la distancia gentica (dist.) y la identidad gentica (ident.) que indica lo contrario a la distancia (I=1-dist), es decir, que cuando las poblaciones son idnticas la distancia es 0 y la identidad es 1. Por el momento no le hagas caso a unbiased dist. ni a unbiased ident. En algunos casos, cuando el archivo de resultados es muy grande, el programa no puede mostrarlo en pantalla, por lo que te va a pedir que lo guardes en un archivo, en ese caso, gurdalo como txt (ponle el nombre que quieras con la terminacin .txt - punto txt-) y luego abrelo con el block de notas.

5.- Hardy Weinberg


Este anlisis realiza pruebas para determinar si la poblacin se encuentra o no en equilibrio de H.W. 1.- Pica Analyze --> 2.- Hardy-Weinberg --> 3.- Options. 4.- Determina si quieres determinar se el Entire data set se encuentra en H.W., si las Populations se encuentran en H.W. y/ o si las Subpopulatins se encuentran en H.W. 5.- Determina el tipo de prueba que quieres hacer: prueba de Xi cuadrada (te la recomiendo, ya que es la que vimos en clase), G-test o Extact Test (que realiza remuestreos de tu muestra para indicar un error estandard y en cuyo caso, se activara la parte 5a para solicitarte informacin sobre el remuestreo). 6.- Determina si deseas que agrupe los genotipos iguales y realice la prueba con los tipos (Pooled Genotypes no te lo recomiendo) o que utilice todos los genotipos que indicaste (All Genotypes, si te lo recomiendo).

7.- Pica Analyze --> Hardy-Weinberg--> Start analysis. El programa te va a mostrar la Xi calculada, y los grados de significancia, ve a una tabla estadstica y determina si se encuentra o no en H.W. En algunos casos, cuando el archivo de resultados es muy grande, el programa no puede mostrarlo en pantalla, por lo que te va a pedir que lo guardes en un archivo, en ese caso, gurdalo como txt (ponle el nombre que quieras con la terminacin .txt - punto txt-) y luego abrelo con el block de notas.

6.- UPGMA
Este anlisis calcula las distancias genticas de igual forma que el apartado 4 (Genetic distance), pero adems las representa mediante un dendograma de distancias mediante el mtodo UPGMA, es decir, que te va a dar un rbol de distancias entre las poblaciones, subpoblaciones o sub-subpoblaciones. 1.- Pica Analyze 2.- UPGMA 3.- Options 4.- Determina si quieres hacer un rbol de distancia entre las Populations (lo cual sera aburrido en caso de que solo tuvieras dos poblaciones) on entre Subpopulations. 5.- Determina el tipo de distancia gentica que vas a utilizar (te recomiendo Nei, 1972). 6.- Determina si quieres que te calcule el porcentaje de loci que utiliz para determinar cada rama del rbol (un soporte del 100% indica una rama cuya distancia se determin de manera muy slida, un soporte del 0% indica una rama en la que no hay loci que soporten su valor de distancia, por lo que es una rama en la que no podemos confiar). 7.- Determina si quieres hacer una prueba de remuestreo mediante Boostrap, es decir que el programa repita el anlisis el nmero de veces que le indiques en # of permutations para indicarte el nmero de veces que sali igual la rama (un valor de 100 de boostrap quiere decir que del total de repeticiones el 100% de las veces la rama sali en la misma posicin y con la misma distancia, es decir, que es una rama muy slida; un boostrap de 0 quiere decir que cada vez que repiti el anlisis la rama sali en posiciones distintas y con distancias diferentes, es decir, que es una rama muy poco soportada). Como regla de dedazo: el nmero de repeticiones mnimas es de tres veces el nmero de datos que ests usando. 8.- pica OK

9.- Pica Analyze--> UPGMA --> Start analysis. Si le indicaste al programa que realizara Boostrap, entonces va a tardar un poco en darte el resultado. El programa va a abrir dos ventanas: una ventana grfica en la que te va a mostrar el rbol (puedes guardarlo picando File--> Save tree as Bitmap file para que lo guarde donde le indiques en formato .bmp) y otra ventana de resultados que te va a dar: una clave numrica de tus poblaciones (Key to subpopulation identifyers), una tabla con las distancias genticas de cada nodo (Distance) indicando las poblaciones que incluyen a ese nodo y el porcentaje de soporte mediante boostrap de cada nodo (estandarizado de 0 a 1, siendo 1=100%). En algunos casos, cuando el archivo de resultados es muy grande, el programa no puede mostrarlo en pantalla, por lo que te va a pedir que lo guardes en un archivo, en ese caso, gurdalo como txt (ponle el nombre que quieras con la terminacin .txt - punto txt-) y luego abrelo con el block de notas.

También podría gustarte