Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sistemtica logentica
Introduccin a la prctica.
Segunda Edicin
ndice general
Introduccin general
1.
Seleccin de caracteres
2.
Matrices de datos
13
3.
rboles
24
4.
35
5.
Pesaje de caracteres
56
6.
Alineamiento de ADN
65
7.
Modelos de evolucin
76
8.
Mxima verosimilitud
89
2
NDICE GENERAL
9.
Consensos
99
108
11. Soporte en ML
121
127
A. Programas de cmputo
136
. . . . . . . . 138
. . . . . . . . . . . . . . . . . . . 138
. . . . . . . . . . . . 141
. . . . . . . . . . . . . . . . . 146
B. Formatos de archivos
156
NDICE GENERAL
. . . . . . . . . . . . . . . . . 160
163
Introduccin general
Este libro ha sido pensado como uno de los tantos soportes posibles
para las clases de sistemtica de nivel bsico y medio, adems de
servir de repaso a conceptos tericos generales pero sobre la base
emprica, y no como reemplazo de los libros bsicos o avanzados
sobre anlisis logentico.
ii
INTRODUCCIN GENERAL
programas
de cmputo a usar (y
sus comandos), adems de una serie de preguntas sobre la prctica o en general sobre la tcnica. La literatura recomendada es
una sugerencia de lecturas, desde el punto de vista de los autores,
crticas, pero obviamente no cubre todos los artculos posibles;
exploraciones constantes de revistas como Cladistics, Systematic
Biology, Zoologica Scripta o Molecular Phylogenetics and Evolution y similares, actualizaran las perspectivas aqu presentadas.
Al nal se presenta un captulo que trata sobre los programas usados, que se espera funcione como una gua rpida para el uso de
los mismos pero que no reemplaza al manual.
A lo largo del libro se utiliza una tipografa consistente para indicar el nombre de los programas (v.g.,
TNT Component
,
), las
>
mult=replic 10;
iii
seguido en la UIS pero puede usarse en otras secuencias, por ejemplo, las prcticas caracteres, excluyendo alineamiento, seguido de
bsquedas incluida la bsqueda del modelo, consensos, por ltimo
soporte y al nal discutir la prctica de alineamiento.
Pblico objeto
Se espera que el usuario de este manual tenga conocimientos bsicos, o que est tomando un curso formal de sistemtica logentica
a nivel de pre o posgrado. No se esperan caractersticas especiales
en cuanto al dominio de computadores, pero el manejo bsico de
un editor de texto que permita grabar archivos sin formato es muy
iv
INTRODUCCIN GENERAL
Programas eliminados
eltest component
NONA
eltest
o
ticular
Piwe, Mod-
en modo
Modeltest
PAUP*
solo
de
Programas adicionados
; en especial para
este ltimo se dan ejemplos detallados para familiarizar al estudiante con la plataforma.
Agradecimientos
A la Universidad Industrial de Santander, en particular a la Escuela de Biologa. A los estudiantes del programa de pregrado
de la escuela de Biologa de la UIS (Universidad Industrial de
Santander) estudiantes profundizacin, a Viviana Romero quien
reescribi casi por completo el captulo de bsquedas.
vi
INTRODUCCIN GENERAL
Prctica 1
Seleccin de caracteres
Introduccin
PRCTICA 1.
SELECCIN DE CARACTERES
especial,
basada en
Por ejemplo, los brazos humanos, las alas de los murcilagos y las
patas de los caballos presentan una estructura sea similar, con
1 Este
anlisis de caracteres tambin implica revisar las armaciones cuantitativas o cualitativas hechas, ver Wiens (2001).
grados
o nive-
PRCTICA 1.
SELECCIN DE CARACTERES
Existen algunos criterios bsicos aplicables en general a los caracteres: para cada carcter se reconocen diversos estados alternativos
de ese carcter, los cuales son llamados estados de carcter o simplemente estados. Es posible que un carcter no sea aplicable a
todos los organismos de estudio, pero dentro de los organismos
donde es aplicable, los estados de un carcter deben dividir el universo en al menos dos grupos mutuamente excluyentes, cada uno
de ellos reconocible por un estado de carcter.
cajas
Color:
0. rojo
1. otro color
el estado
otro
de colores tales como verde o amarillo, cuya nica (falsa) similitud es que no poseen el color rojo, pero no existe una identidad
histrica defendible, es decir el NO color rojo se ha generado desde
mltiples ancestros. Todos los estados del carcter deben representar una unidad histrica, independientemente de si el estado es el
apomrco o el plesiomrco. Siempre que encuentre un carcter
donde uno de los estados est denido como negacin (incluidas las
ausencias), debe revisar cuidadosamente que el estado
indique claramente una unidad.
negativo
PRCTICA 1.
SELECCIN DE CARACTERES
direccin
Pilosidad en la pata:
0. si
1. no
0. uno
1. dos
PRCTICA 1.
SELECCIN DE CARACTERES
Tcnicas
organismos
fentica .
2 Copyright,
2. Elabore un listado de los diferentes caracteres de los organismos, reconozca al menos 5 caracteres nicos y 5 compartidos.
Anote en una hoja separada los organismos y sus estados.
3. Intercambie su listado (acompaado de la gua morfolgica
y los nombres de los organismos) con un compaero:
a) Trate de reconocer los caracteres que su compaero describi, y anote cuales organismos poseen esos caracteres.
b) En caso de ser necesario, re-escriba los caracteres de su
compaero e indique la razn de sus cambios.
4. Compare la lista de caracteres por organismos que usted
realiz con la que su compaero re-escribi.
Pregunta(s) general(es).
10
11
Literatura recomendada
Rieppel & Kearney (2002) [Una visin crtica y extensa de la seleccin de caracteres, con ejemplos empricos].
12
Prctica 2
Matrices de datos
Introduccin
Una de las diferencias ms importantes entre los trabajos taxonmicos con un enfoque clsico y los anlisis logenticos es que
estos ltimos incluyen explcitamente una matriz de datos donde
se pueden evidenciar los caracteres examinados, y cmo fueron
interpretados.
Bsicamente, la matriz de datos es una lista tabulada de las observaciones de los caracteres en los distintos taxa. Para facilitar su
13
14
PRCTICA 2.
MATRICES DE DATOS
lectura y su uso en programas de anlisis logentico, los caracteres y sus estados son codicados como nmeros o como letras.
TNT POY
o
pueden re-
1 si
15
Tcnicas
).
2 www.cladistics.com
3 www.mesquite.org
4 el
ape
16
PRCTICA 2.
MATRICES DE DATOS
Mesquite
17
http://evolution.genetics.washington.edu/phylip/software.html
o en
http://taxonomy.zoology.gla.ac.uk/software/
Abra el archivo de datos morfolgicos para vertebrados: datosVertebrados.xls con un programa para hojas de clculo y manipule
para Windows:
7 www.phyloxml.org
18
PRCTICA 2.
MATRICES DE DATOS
rios.
2. Identique si hay o no caracteres aditivos.
3. A partir de los datos, construya una matriz nueva (en
TNT
NEXUS
Mesquite
WinClada Nona
,
si est usando
si est usando
19
>
ape
phangorn
library(phangorn)
10
8 Aunque
permite
hacer la descarga de los paquetes directamente del repositorio desde el entorno
de R. Tambin es posible hacer la descarga directamente de la pgina web e instalarlo desde cualquier directorio en el ordenador dando directamente la ruta
a dicho sitio: install.packages (../usuario/R/Packages/Paquete.tar.gz),
pero deber descargar e instalar, independiente,todas las dependencias requeridas por el paquete. La instruccin library() le permitir cargar el paquete en el entorno de R para poder empezar a trabajar con todas sus utilidades.
phangorn
ape rgl
install.packages( Nombre_paquete )
20
PRCTICA 2.
>
MATRICES DE DATOS
install.packages(c(ape,phangorn),
dependen-
cies=T)
>
datos
<
read.table(matriz.txt)
>
phylip
y asgnela
datos.Phylip
<
read.phyDat(DNA1.phy,
format=phylip, type=DNA)
h) Escriba en formato
Nexus
> write.nexus.data(datos.Phylip,le=NuevaDNA1.nex)
21
Winclada Mesquite
o
revise la conversin.
14. En el directorio de datos existen dos matrices con distintos
problemas problema1.txt y problema2.txt , intente abrir las
11
Mesquite R
y
TNT
McClade
Mesquite
las terminaciones de los archivos son .ss en WinClada, .nex con Mesquite o MacClade, pero debe recordar que la termi11 tradicionalmente,
22
PRCTICA 2.
MATRICES DE DATOS
Revise la seccin de Programas de cmputo para ver las instrucciones que utilizara con un programa distinto a
Winclada/NONA
Pregunta(s) general(es).
1. Si desea transformar de un formato de matriz a otro usando exclusivamente editor de texto, cules son los pasos a seguir? Ensaye
la lista contruida con un ejemplo.
2. Haga el listado de los aspectos comunes a todos los formatos de
matrices.
3. En el laboratorio anterior se insisti en la claridad de los caracteres y sus estados. A la luz de los resultados obtenidos usando
rboles y la matriz:
a) puede usted conectar la importancia del anlisis de caracteres con la forma como se interpretan los cladogramas?
b) Revise su bibliografa, y de ser posible compare trabajos con
y sin matriz explcita. Puede notar alguna diferencia?
23
Literatura recomendada
Maddison & Maddison (2014) [El programa ms verstil para manipulacin de matrices, por lo que la documentacin debe ser leda].
Prctica 3
rboles
Introduccin
Una vez nalizado un anlisis logentico, el resultado es un agrupamiento que tradicionalmente se dibuja como un rbol donde
los taxa usados estan como hojas o terminales del rbol. Las diferentes ramas se unen en nodos o componentes. As, el agrupamiento
((Terminal 1, Terminal 2), Terminal 3) puede representarse con el
rbol:
24
25
Raz
Terminal 3
Nodo interno 1
Terminal 2
En cladstica, los rboles son tambin conocidos como cladogramas y en general, las dos palabras son usadas erroneamente co-
mo sinnimas.
cladogramas deben tener transformaciones de caracteres en nodos (nodos soportados), en caso de no tener transformaciones, el
1 Es
necesario aclarar que todos los cladogramas son rboles, pero no todos
los rboles son cladogramas
26
PRCTICA 3. RBOLES
ancho
Tcnicas
Una forma de expresar los rboles en formato de texto (por ejemplo para usar con programas o para el resumen de un artculo) es
27
28
PRCTICA 3. RBOLES
distintos programas:
Mesquite R Figtree
2
Mesquite
WinClada
(requiere
la matriz de datos), su interfaz de impresin requiere mucha prctica (no es intuitiva). Otras alternativas, si usa Linux, pueden ser
NJPlot o GNUplot
WinClada
Edit/Mouse, en
FigTree
Mesquite
TreeView
WinClada
Figtree
herramientas en la ventana; en
). Las acciones se
). Ms que comandos,
1. Desde
2 http://cran.r-project.org
3 http://tree.bio.ed.ac.uk/software/gtree/
) o arras-
29
2. En
Mesquite TNT
TNT
y
ramas completas; en
WinClada TNT
o
da de cladogramas para la matriz de vertebrados que contruy en la prctica 2, use los parmetros por omisin (men
Analize / heuristics, traditional search).
4. En
Mesquite Figtree
o
30
PRCTICA 3. RBOLES
Mesquite WinClada
o
bol.dat :
WinClada
y no ambigua.
2) en
TNT
>
Character
>
caracteres).
31
3) en
Mesquite
>
library(ape); arbol
<
read.tree(arbol.r.tre)
>
plot(arbol)
o
>
plot.phylo(arbol)
32
PRCTICA 3. RBOLES
>
plot(arbol, use.edge.length=FALSE)
<
>
arbol$node.label
>
plot(arbol, show.node.label=TRUE)
arbol$edge.length
>
edge.col=c(red,blue,cyan))
trizDatos
y use la funcin
parsimony()
Ma-
33
>
parsimony(arbol,MatrizDatos)
Pregunta(s).
a) Al hacer una bsqueda por defecto Usted y sus companeros
obtienen las mismas topologas y los mismos caracteres que
soportan los grupos?.
b) Examine sus caracteres y cambie su aditividad-no aditividad. Cambia esto la forma como mapean? Haga el ejercicio
para varios caracteres, binarios y multiestado.
c) Si cambia la raz, cambia el costo? Por qu cree que se presenta el resultado que obtuvo? Es (y por qu) una ventaja
o una desventaja?
d) Dibuje el siguiente cladograma:
(Lampreas (Tiburn (Esturin Telesteo) (Celacanto (Pezpulmonado (Anbio (Mamfero (Tortuga (Lagarto (Cocodrilo Ave)))))))))
e) Si la raz esta colocada entre Ave y Cocodrilo, cmo es la
topologa resultante?
f ) Convierta la topologa dibujada a notacin de parntesis.
34
PRCTICA 3. RBOLES
Pregunta(s) general(es).
existe una gran diferencia entre los rboles logenticos actuales y sus
equivalentes
Literatura recomendada
Page & Holmes (1998) [El captulo 2 esta dedicado a los rboles
y presenta muy buenas ilustraciones, Tambin puede consultar la
pgina de docencia de Rod Page (http://taxonomy.zoology.gla.ac.
uk/teaching/index.html)].
Prctica 4
Bsquedas mediante parsimonia
Introduccin
Un discusin constante en sistemtica es como seleccionar cladogramas, por ejemplo, Hennig (1968) plantea relaciones mediante la
agrupacin por sinapomorfas, no es muy explcito a lo que reere
la obtencin del cladograma. Camin & Sokal (1965) posiblemente
fueron los primeros en sugerir el uso de la parsimonia como un
posible mtodo para hacer esta seleccin Camin & Sokal (1965);
desde entonces el cladograma seleccionado es aquel que minimiza
35
36
la cantidad de transformaciones, es decir el cladograma ms parsimonioso. Posteriormente, esta tcnica fue generalizada usando
diferentes tipos de optimizacin: unas de las ms conocidas e implementadas son: la optimizacin de Wagner y la optimizacin de
Fitch (Wagner (1961); Kluge & Farris (1969); Farris (1970); Fitch
(1971)).
La forma ms sencilla de elaborar cladogramas es usando el algoritmo de Wagner: como el orden de entrada de los taxa afecta
la topologa, se realiza una aleatorizacin de tal secuencia de entrada, la cual puede estar seguida de permutaciones de ramas, sin
embargo, para matrices muy grandes consume gran cantidad de
37
TNT
; este es el pro-
NONA
otra
38
PAUP*
PAUP*
TNT TNT
.
PhyML
usados o
RaxML/ExamML
Tcnicas
1 En
39
Con
40
NONA/Winclada
File/File open
Heuristic Search
TNT
>
proc nombre_archivo;
>
mult;
POY
>
read( `nombre_archivo')
>
build()
>
swap()
PAUP*
>
set criterion=parsimony
>
exec nombre_archivo
>
hsearch
41
Pregunta(s).
2. Bsquedas modicadas
Con el archivo el datos
datosChica.dat
realice las
a) 5, 10 y 100 rplicas.
b) reteniendo 1 o 100 rboles por rplica.
NONA
, el comando ms usado
es mult* para las bsquedas iniciales, max* para permutar ramas (requiere rboles) y nix* para ratchet. En
TNT
PAUP*
42
y la bsqueda con hsearch tanto para rboles de Wagner como para permutar ramas; en este ltimo caso use
hsearch start=current.
Para los archivos de macros de
TNT
use la instruc-
cin run seguida del nombre del archivo; en este caso pauprat.run y los parmetros run pauprat.run 10 5;
TNT usa pesos de 1 y 2 en el archivo de salida, pauprat.
Pregunta(s).
archivo.dat
43
44
dida que el anlisis avanza, se disminuye la probabilidad de aceptacin de los subptimos), y la fusin de
rboles, que utiliza lo mejor de diferentes soluciones.
Una revisin completa de estos mtodos se puede consultar en Golobo (1999).
Pregunta(s).
Anlisis Filogentico en
: bibliotecas y dependencias
phang-
45
orn
>
install.packages(phangorn,
dependen-
cies=TRUE)
>
library (phangorn)
chars2.txt
>
primates
<
read.phyDat
(chars2.txt,
format=phylip, type=DNA)
>
write.nexus.data
(primates,
le=primates.nex)
c) Revise la matriz
primates.nex
con un editor de
46
read.phyDat()
de caracteres como
write.nexus.data()
escribe un archivo formato NEXUS a partir de un vector de secuencias. Los argumentos de una funcin pueden
args(Nombre_funcin)
?Nombre_funcin
Pregunta(s). Qu otras funciones en otras bibliotecas permiten leer y/o escribir archivos tipo Nexus, Fasta, Phylip,
Clustal, Sequential e Interleave?
4. Topologas iniciales
Estime la matriz de distancia, realice el anlisis de agrupamiento y graque para un posterior anlisis.
47
>
<
matrizDistancia
dist.dna(as.DNAbin(primates))
<
>
arbolUPGMA
>
arbolNJ
>
>
plot (arbolNJ,
La funcin
<
upgma (matrizDistancia)
NJ(matrizDistancia)
dist.dna()
upgma() NJ()
y
48
plot()
random.addition()
con la funcin
La funcin
>
arbolRAS
<
random.addition(primates,
method=tch)
>
Pregunta(s).
5. Parsimonia y optimizacin
49
primates
y las topologas
>
parsimony(treeUPGMA, primates)
>
parsimony(treeNJ, primates)
>
parsimony(treeRAM, primates)
La funcin
parsimony()
>
optParsUPGMA
<
tim.parsimony(treeUPGMA, primates)
op-
50
>
optParsNJ
<
optim.parsimony(treeNJ,
pri-
mates)
>
optParsRAM
mates)
>
optParsUPGMA_SPR
<
tim.parsimony(treeUPGMA,
opprimates,
rearrangements=SPR)
>
optParsUPGMA_NNI
tim.parsimony(treeUPGMA,
<
opprimates,
rearrangements=NNI)
La funcin
optim.parsimony()
intenta encontrar el
Pregunta(s).
51
y TBR?
parsimony() optim.parsimony()
y
>
pratchet(primates,
start=treeUPGMA,
method=tch, maxit=100,
k=5, trace=1, all=FALSE, rearrangements=NNI)
>
pratchet(primates,
method=tch, maxit=100,
start=treeUPGMA,
52
11. Bsqueda con Rachet utilizando los rboles optimizados con NNI y optimizando con el mtodo de rearreglos
NNI.
>
pratchet(primates,
start=optParsUPGMA_NNI,
method=tch, maxit=100,
k=5, trace=1, all=FALSE, rearrangements=NNI)
12. Bsqueda con Rachet utilizando los rboles optimizados con NNI y optimizando con el mtodo de rearreglos
SPR.
>
pratchet(primates,
start=optParsUPGMA_NNI,
method=tch, maxit=100,
k=5, trace=1, all=FALSE, rearrangements=SPR)
13. Bsqueda con Rachet utilizando los rboles optimizados con SPR y optimizando con el mtodo de rearreglos
NNI.
53
>
pratchet(primates,
start=optParsUPGMA_SPR,
method=tch, maxit=100,
k=5, trace=1, all=FALSE, rearrangements=NNI)
14. Bsqueda con Rachet utilizando los rboles optimizados con SPR y optimizando con el mtodo de rearreglos
SPR.
>
pratchet(primates,
start=optParsUPGMA_SPR,
method=tch, maxit=100,
k=5, trace=1, all=FALSE, rearrangements=SPR)
pratchet()
Pregunta(s).
54
Pregunta(s) general(es).
Cul cree usted que sera(n) el(los) criterio(s) para seleccionar entre los diferentes programas?
55
Literatura recomendada
Prctica 5
Pesaje de caracteres
Introduccin
57
den el uso de pesado, argumentando que es claro tras un anlisis logentico que diferentes caracteres poseen distintos niveles
de informacin; lo cual se hace evidente al multiplicar cualquier
cuanticador de homoplasia del carcter por el peso inicial que se
le asign, en la lgica de pesaje sucesivo Kluge & Farris (1969).
58
PRCTICA 5.
PESAJE DE CARACTERES
pesado
no es ni a priori, ni a posteriori, ya
que en realidad es un criterio de bsqueda. Esta forma es conocida como pesado implcito (Golobo, 1993). Este procedimiento
utiliza la conanza del carcter (con una funcin cncava de homoplasia) y utiliza ese valor como criterio ptimo; el problema de
este mtodo, de hecho el de cualquier mtodo, es cmo escoger
entre las diferentes funciones. El pesado sucesivo es muy popular
para
59
60
PRCTICA 5.
PESAJE DE CARACTERES
El mtodo de Golobo (1993) sigue la lgica de parsimonia tradicional, y aunque Golobo (1993) vea su mtodo como un renamiento de pesado sucesivo, este pesaje se puede usar igualmente
en coordinacin con pesado implcito. La forma comn de pesado
implcito es usar una funcin cncava de la forma
la constante de concavidad y
k
, donde
k+h
es
Tcnicas
1. En
PAUP*
datos.pesado.dat
).
61
>
charset terceraPosicion=3-.\ 3;
>
weight 0 :terceraPosicion;
62
PRCTICA 5.
PESAJE DE CARACTERES
c) Coloque todos los pesos iguales y realice una bsqueda con pesado sucesivo, itere un mximo de 10 veces.
Chequee si los pesos se estabilizaron revisando el costo
de los rboles usando pscores;.
2. En
TNT
PAUP*
se
activa usando
>
PAUP*
comienza
TNT
como en
PAUP*
el lmite es de 32000
TNT PAUP*
y
por lo cual es recomendable recurrir a alguna medida de soporte para los nodos, con lo que se evita la sobre-resolucin.
A diferencia de
PAUP* TNT
,
PAUP*
1 el
inverso de la usada en
PIWE:
h
k+h
PAUP*
63
use
>
pscores gt=yes;
TNT
TNT
como en
PAUP*
Pregunta(s) general(es).
64
PRCTICA 5.
PESAJE DE CARACTERES
Literatura recomendada
Prctica 6
Alineamiento de ADN
Introduccin
Aunque los datos moleculares pueden proporcionar grandes cantidades de caracteres, presentan retos en la asignacin de homologas al tratarse exactamente de las mismas bases en todas
las secuencias; adems en muchas ocasiones las secuencias tienen
un tamao desigual. Para resolver estos problemas se han ideado
los mtodos de alineamiento, que buscan recuperar las posibles
homologas dentro de diferentes secuencias, al utilizar una matriz
65
66
1x: t T C C g A A T T g g c t a c T T C C g A A t T T g G
2x: t C G A T T G C C A C T C G A T T G
2a: t - - C g A - - T g c c t a c T - C - g A - t T - g G
2b: t - C - g A - T - g c c t a c - T - C g A - t - T g G
2c: t - C - g - A T - g c c t a c - T - C g - A t - T g G
Ya que se necesitan ms de tres secuencias para un anlisis logentico, es necesario el alineamiento simultneo de mltiples secuencias. El primer mtodo usado es el alineamiento mltiple que
usa un rbol gua con las secuencias en los terminales; a partir de
1 Ejemplo
67
anlisis
de sensibilidad. Bajo
68
de las transformaciones); hasta ahora, esta idea solo se ha utilizado en el contexto de anlisis con mltiples genes o entre genes y
morfologa simultneamente.
Tcnicas
MUSCLE
sobre
CLUSTAL
, pero si el objetivo es la
POY
, ya que
CLUSTAL
POY
CLUSTAL
derivado del clculo de la distancia entre las secuencias; como todos los mtodos basados en distancias, es dependiente del orden
de entrada de los datos;
MUSCLE
de distancia, revisa el resultado del alineamiento, primero a nivel goblal y luego a nivel local;
POY
POY
69
CLUSTAL
CLUSTAL
CLUSTAL
es slo un rbol para optimizar las secuencias, no un rbol logentico como tal; mientras que el rbol generado por
POY
es un
POY
POY
el objetivo de
libro se usar
POY
cada rbol (as se lo utilizar en esta prctica), por lo que es posible usar este resultado como entrada para programas de bsquedas
que usen secuencias alineadas, de usar los alineamientos, los costos
usados para el alineamiento deberan ser los mismos usados para
el anlisis logentico.
Al asignar los costos, hay que tener en cuenta la desigualdad triangular, es decir, que el costo de una transformacin nunca puede ser
mayor al de una transformacin equivalente, pero que tome otros
estados, si las transiciones tienen un costo de 3 y las transversiones
de 1, la transformacin A G, tendra un costo de 3, pero si se
70
hace de la forma A T G, el costo sera de 2 (dos transversiones). Esto hara que a los nodos se les pudiesen asignar estados
no observados en los terminales.
POY
1. En
CLUSTAL/MUSCLE
CLUSTAL
datos.ou.dat
CLUSTAL
71
f ) Ejecute
MUSCLE
MUSCLE
con
POY
mente rpida de dominar. Para los diferentes tipos de costos, el comando ms importante es transform(). Por ejemplo,
con transform(tcm(1,2)) se da peso de 1 a las sustituciones y
de 2 a los gaps o a los datos morfolgicos (estticos). Matrices de transformacin ms complejas pueden elaborarse
y luego leerse con ese mismo comando. Una de las grandes
ventajas de
POY
computadoras.
3. En
POY
>
POY
usando
read(datos.fas.dat)
72
con:
>
transform
(tcm(1,1));
build(
100);
select(
unique);swap();select()
>
report(alin.txt,phastwinclad)
Winclada
73
y genere el alineamiento.
j) Haga un anlisis de sensibilidad usando las matrices
datos.fas.dat datos2.fas.dat
y
Pregunta(s).
Cmo hace
POY
74
el manual
Las topolgas obtenidas va parsimonia son iguales (o
no) a las generadas por ML?
Los alineamientos implcitos son equivalentes? use los
costos de los alineamientos y los caracteres informatvos
evaluados en
winclada
Pregunta(s) general(es).
MUSCLE CLUSTAL
y
, al
MALIGN POY
,
y los obtenidos en
POY
) y las topologas?
75
Existe una disputa sobre una relacin entre los juegos de costos y
el soporte. Dados sus conocimientos, escriba un pequeo ensayo
donde indique sus ideas, su posicin y sus argumentos en esta
discusin.
Literatura recomendada
Giribet & Wheeler (1999) [Uno de los pocos artculos que discute
explcitamente el tema de los gaps].
Prctica 7
Modelos de evolucin
Introduccin
77
78
PRCTICA 7.
MODELOS DE EVOLUCIN
Dado que los valores de las probabilidades de los datos son muy
pequeas, y que es ms fcil sumar los logaritmos que multiplicar
los nmeros iniciales, para facilitar se utiliza el negativo del logaritmo natural de la verosimilitud, que es el valor tradicionalmente
reportado por los programas as como en la literatura.
79
puedan explicar mejor los datos, lo que no implica que los modelos
sean ms realistas, por lo que la seleccin de un modelo no puede
basarse en el aumento neto del valor de verosimilitud, sino si la
mejora es (o no es) estadsticamente signicativa, dado el nmero
2 para la proporcin, tomando el nmero de parmetros extra como los grados de libertad. El problema de esta prueba es que no es
claro si la distribucin
1 Es
= 2ln
(7.1)
80
PRCTICA 7.
MODELOS DE EVOLUCIN
PAUP*
JModelTest
JModeltest PAUP* R +
ape + PhyML JModeltest + PhyML
Para los clculos, se puede usar
, o
JModeltest
es un programa de
, o
Java
3 AIC=
81
le permite mayor control sobre la forma de iniciar el clculo, tanto desde el rbol de inicio hasta la forma de implementar el test
jerrquico, desde JC hacia GTR (forward) o en sentido contrario
(backward); puede usar hasta 203 modelos y de manera automtica corre los anlisis en mltiples procesadores, lo que hace ms
eciente que
PAUP* R
o
en conjunto con
ape
PhyML
Tcnicas
PAUP* R
o
debe
En
6.
JModeltest2 + PhyML
82
PRCTICA 7.
MODELOS DE EVOLUCIN
PHYLIP
JModelTest
BIONJ
FIXED BIONJ+JC
Pregunta(s).
83
En
R+ape+PhyML
1. Abra
ape
, si es
necesario, instalela.
2. Coloque como directorio activo el directorio donde tenga los
datos y
PhyML
5
>
library(ape)
>
DNA
<
read.dna(alineado.phy)
>
phylip
table(unlist(lapply(DNA,
tamao
de
las
secuencias
leemos datos
length)))##
##Test
de
listado
de
modelos
de
>
5 La
library(ape)
##
##
##
##
en Linux cambie a
instruccin en
para comentarios es # y por lo tanto no es ubna
instruccin del programa
84
PRCTICA 7.
MODELOS DE EVOLUCIN
##
execname =
./phyml,
##
execname =
phyml,
si es local o
si es global
##
##
>
en windows use:
modelo
<
format =
execname =
##
>
phymltest(alineado.phy,
phyml.exe,
use format =
print(modelo)
append = FALSE)
interleaved
##
si aplica a su matriz
de AIC
>
summary(modelo)
##
>
PhyML )
##
85
>
Tanto
R -f modelos.R
JModeltest
como
R+ape
usan
PhyML
para el clculo
R+ape
fcilmente leble.
En
PAUP*
>
help automodel;
>
set criterion=dist;
>
dset distance=JC;
86
PRCTICA 7.
>
MODELOS DE EVOLUCIN
hsearch;
>
jmodeltest
rior.
5. Calcule el valor de AIC para 4 diferentes modelos: JC, K80,
GTR y uno de su eleccin. El valor de AIC ser mejor cuanto
ms pequeo.
6. Para los mismos modelos y el escogido por el hLRT en
elTest
JMod-
pare sus resultados, tanto para AIC como para BIC con el
de sus compaeros, y determine cual es o son los mejores
modelos para esos criterios. Ordene los modelos del mejor al
peor.
87
Pregunta(s).
Es el modelo escogido por el criterio de Akaike igual al escogido en el test jerrquico? Usted esperara que lo fuesen?
Es igual el resultado en las distintas exploraciones realizadas? Usted esperara que fuesen iguales desiguales?
Son iguales los resultados en AIC y BIC?
De usar los tres programas usted espera la misma respuesta?
Pregunta(s) general(es).
Literatura recomendada
88
PRCTICA 7.
MODELOS DE EVOLUCIN
Prctica 8
Mxima verosimilitud
Introduccin
90
PRCTICA 8.
MXIMA VEROSIMILITUD
En este caso se estima el rbol (la hiptesis logentica) que maximice la probabilidad de los datos actuales, dado el modelo evolutivo sugerido para las secuencias a analizar (existen intentos de generalizar los modelos de evolucin a datos morfolgicos, ver Lewis
(2001)).
Uno de los principales problemas con la estimacin de verosimilitud es que el valor depende de el costo de las ramas. En la actualidad, inicialmente se ignora el valor de las diferentes ramas,
y luego de encontrar un rbol especco, se calcula el mejor valor
de verosimilitud para una rama a la vez. Swoord et al. (1996)
ofrecen una explicacin extensa de los clculos relacionados con el
mtodo.
Tcnicas
Los mtodos para buscar y seleccionar rboles usados en verosimilitud son bsicamente los mismos usados en parsimonia: a un rbol
inicial se lo mejora con permutacin de ramas (ver prctica 4, pgi-
91
1. en PAUP*
a) Antes que nada estime el mejor modelo para la matriz,
use los procedimientos de la prctica
1 tal
7.
92
PRCTICA 8.
Pregunta(s).
MXIMA VEROSIMILITUD
cionar el modelo.
b) La bsqueda inicial en
PAUP*
>
set criterion=likelihood
se coloca a
PAUP*
distribucin de
tado.
d) Pruebe alternativamente los siguientes modelos: JC, HKY,
93
Reporte los
2. en PhyML
PhyML
PAUP*
por lo tanto debera ser una de sus primeras opciones, el programa cuenta con dos esquemas de instrucciones: el primero
por lnea de commandos (que se usa de manera indirecta al
obtener el modelo ptimo con
R+ape
o con
JModelTest
94
PRCTICA 8.
MXIMA VEROSIMILITUD
PHYLIP
, por la
archivo,
Newick
PHYLIP
Pregunta(s).
ma?
PhyML
95
7. Argumente qu criterio
RaxML
PhyML
96
PRCTICA 8.
MXIMA VEROSIMILITUD
lnea de commandos.
3. en RaxML
a) Haga una corrida en
RaxML
ML.
1) Dado un archivo dna.phy , para usar el programa
debe acceder a la lnea de comandos y usar las instrucciones:
>
20 -n ML0
RaxML
>
97
>
Pregunta(s).
Compare sus resultados con los de sus compaeros. Cal
fue el mejor valor de verosimilitud, independientemente del
modelo?
Inuye en sus resultados la seleccin del mecanismo de
reorganizacin ramas?
Cmo considera los tiempos de ejecucin comparados con
otros mtodos como parsimonia? Dieren los resultados
con los de parsimonia?
Pregunta(s) general(es).
98
PRCTICA 8.
MXIMA VEROSIMILITUD
Se ha propuesto que se pueden usar modelos para el anlisis morfolgico. Analice los puntos favorables o desfavorables e indique
su punto de vista sobre el tema.
Qu implicaciones tiene el uso de modelos en el concepto de
homologa y carcter presentado anteriormente?
Literatura recomendada
Prctica 9
Consensos
Introduccin
100
PRCTICA 9. CONSENSOS
101
Tcnicas
En la mayora de los programas, los consensos estricto y de la mayora estn implementados (por ejemplo,
WinClada
102
PRCTICA 9. CONSENSOS
del valor de corte (un consenso estricto slo retendra los nodos
con soporte del 100 %).
TNT
TNT
TNT
).
, debe
PAUP*
), otros no (
).
datos.consenso.dat
:
, en
Win-
103
WinClada
cin de winclados; el men Trees tiene la entrada consensus compromise, donde hay la posibilidad de hacer consenso
PAUP*
1 una
WinClada
104
PRCTICA 9. CONSENSOS
use la instruccin
>
contree
TNT
>
use:
nelsen
para obtener el consenso estricto, si desea que el consenso sea el ltimo rbol, use nelsen*
Para el consenso de la mayora, use la instruccin majority y majority* respectivamente.
>
o
save {strict}
105
>
save {majority}
>
POY
report(consensus)
para el consenso estricto y report(consensus:x) para consensos de la mayora, donde x es un entero mayor que
50.
Si desea guardar los resultados en un archivo debe colocar el nombre entre comillas dobles. Por ejemplo:
>
En
PAUP*
ape
jrich
106
PRCTICA 9. CONSENSOS
ciales en formato
Newick
en un archivo
arboles.phy
>
>
arboles
<
read.tree(arboles.phy)
>
plot(wconsensus(arboles,collapse=F));
plot(wconsensus(arboles,collapse=T))
Pregunta(s) general(es).
107
Literatura recomendada
Sharkey & Leathers (2001) [Una crtica al uso y abuso del consenso
de mayora].
Prctica 10
Soporte en parsimonia y ML
Introduccin
109
35.
Otra forma de medir el soporte es utilizar rboles subptimos (Bremer, 1994). En este mtodo se hace un consenso estricto con esos
110
PRCTICA 10.
SOPORTE EN PARSIMONIA Y ML
rboles subptimos, y eventualmente, cuanto mayor sea la diferencia entre los rboles ptimos y subptimos, mayor ser el nmero
de nodos encontrados en los rboles ptimos que desaparecern.
El objetivo es contar la diferencia de costo necesaria para que el
nodo colapse.
111
parte de los datos (una particin, que puede ser, por ejemplo, uno
de los diferentes genes analizados). Si el nodo esta presente en
el consenso de los rboles ms parsimoniosos de la particin, el
soporte se halla de la forma convencional; si por el contrario el
nodo no est presente, se busca el rbol ms parsimonioso que
contenga el nodo, y la diferencia de pasos entre este rbol y el
rbol ms parsimonioso de la particin es el soporte de Bremer
negativo del nodo (es negativo, indica qu tan contradicho es el
nodo). Los soportes por particiones permiten detectar cules son
las particiones que sugieren el nodo y cuales lo contradicen. De
esta forma, no solo se mide el soporte, sino que es posible observar
la congruencia por nodos entre las particiones. Aunque al sumar
los valores de Bremer de las particiones el resultado puede ser igual
al valor del soporte de Bremer, esto no siempre sucede.
112
PRCTICA 10.
SOPORTE EN PARSIMONIA Y ML
113
POY
114
PRCTICA 10.
SOPORTE EN PARSIMONIA Y ML
de esto, es que proporciona una medicin directa, aun para nodos no presentes en el rbol ms parsimonioso. La desventaja ms
notoria es que hay que realizar muchas bsquedas para medir el
soporte de cada nodo.
Tcnicas
1. En
, re-
TNT
islas
de rboles.
115
TNT NONA
y
>
en
bbreak
TNT
>
En
, y en
NONA
max*;
NONA TNT
y
con
>
bsupport
116
PRCTICA 10.
SOPORTE EN PARSIMONIA Y ML
mos con
>
subop X;mult
3. En
POY
>
calculate_support()
usando los rboles ms cortos que no contengan cada clado. Con diferentes parmetros se implementan el
bootstrap y el jackknife; en esos casos es bueno incluir
el tipo de bsqueda,en general simple, durante el re-
117
>
calculate_support(bootstrap:100, build(10),swap())
calcula 100 rplicas de bootstrap, y en cada una se construyen 10 arboles de Wagner, mejorados con permutado de ramas, y
>
calculate_support(jackknife(resample:100,
re-
move:33.3),build(10),swap())
Pregunta(s).
POY
4. En
TNT
118
PRCTICA 10.
>
SOPORTE EN PARSIMONIA Y ML
blocks
TNT
TNT
>
ttags;
RaxML
RaxML
pueda
119
>
./raxml
GTRGAMMA
datos.phy
1234
resultados
20
donde:
-f i indica que ser un anlisis de boostrapping
tradicional
-s es el archivo de datos
-n es el nombre de los resultados
-m es el modelo
-b es el nmero usado para el generador de nmeros
la azar
-# es el nmero de rplicas.
c) Al nalizar revise los archivos llamados:
RAxML_info.resultados
RAxML_bootstrap.resultados
d) Para un boostrapping rpido use la lnea de comandos:
>
./raxml
GTRGAMMA
1234
datos.phy
fastboot
100
120
PRCTICA 10.
SOPORTE EN PARSIMONIA Y ML
PAUP*
PAUP*
es ms lento que
TNT
Pregunta(s).
Compare con sus compaeros sus resultados de soporte basado en permutaciones y en soporte de Bremer.
Los nodos con mayor soporte son los mismos?
Existe correlacin entre los diferentes mtodos?
Usted sugerira (o no) el uso de soporte relativo? Explique
las razones de su escogencia.
Prctica 11
Soporte en ML
Introduccin
122
Tcnicas
La medicin de soporte usando boostrap no paramtrico ya fue discutida en la seccin de soporte en parsimonia; el boostrap paramtrico es una prueba de simulacin que depende del modelo encontrado como estimador de la evolucin de las molculas (Felsenstein,
2004); la prueba busca evaluar que pasara si obtenemos ms datos
a partir del mismo modelo, el cual es cierto. Con esta idea se simulan datos a partir del rbol que se obtiene con los datos reales; a
partir de estos datos simulados se estiman los rboles, los cuales
en conjunto son resumidos con un consenso de la mayora que
sirve como estimador de los soportes de los nodos. Las secuencias
simuladas se obtienen con los mismos parmetros y con el mismo
123
1. Con
JModeltest
a) Para la matriz
datos.param.dat
elo.
2. En
PAUP*
Newick
PAUP*
>
Seq-Gen
Gen
Seq-
124
NEXUS
arbol.tre
; use la
lnea de comandos:
> seq -gen mHKY n10 l27 a1.6985 < arbol.tre >
sec.nex
Escoja el archivo de rboles que obtuvo con
PAUP*
y es-
pecique la salida.
Usted puede tener un archivo de instrucciones e insertarlo
despues de cada secuencia con la instruccin -xInstruc.txt en
Seq-Gen
Seq-Gen
.
a) En
PAUP*
a) Analice el archivo de simulaciones obtenido en 3, usando los mismos comandos que uso en 2a, recuerde que
1 En
seq-gen no existe el modelo JC, por lo que debe usar HKY con ts=tv
y frecuencias iguales.
2 Tambin puede usar un rbol con constriccin, es decir forzando la
monolia de un grupo en particular, si la pregunta est limitada a un grupo
particular.
125
Seq-Gen
PAUP*
dado que
en
>
PAUP*
use la instruccin
tonex
from=archivo.phy
to=archivo.nex
for-
mat=relphylip
Pregunta(s) general(es).
126
Literatura recomendada
Prctica 12
Anlisis Bayesiano
Introduccin
128
PRCTICA 12.
ANLISIS BAYESIANO
129
Tcnicas
130
PRCTICA 12.
ANLISIS BAYESIANO
MrBayes
Un problema con
MrBayes
131
amina el soporte de las ramas y dado que la respuesta es un consenso de la mayora, las ramas que no tienen soporte pueden aparecer
con probabilidades posteriores altas (Golobo & Pol, 2005).
MrBayes
Mrbayes
tres o cuatro primeras letras, por ejemplo, puede abrir los datos slo con exe. Con mcmc
MrBayes
>
mcmcp ngen=1000
>
mcmcp samplefreq
132
PRCTICA 12.
ANLISIS BAYESIANO
>
prset statefreqpr=xed(equal)
>
>
Con showmodel puede ver en cualquier momento cmo esta congurado el modelo de sustitucin nucleotdica a usar; help muestra
una lista de los comandos disponibles en
MrBayes
; al igual que
133
JModelTest
para
lencia para
MrBayes
en la pgina: http://mrbayes.sourceforge.
net/.
2. Realice una corrida en
MrBayes
JModelTest
, inicial-
temperatura
3.
MrBayes
por defecto.
1 Este
134
PRCTICA 12.
ANLISIS BAYESIANO
Pregunta(s) general(es).
MrBayes
Literatura recomendada
primer
de fcil lectura]
135
Golobo & Pol (2005) [Una crtica muy completa al anlisis bayesiano].
Apndice A
Programas de cmputo
por
136
137
lenguajes
por casi todos los programas. Es posible que al nal del proceso todo
sea asunto de un par de instrucciones, una vez que ha perfeccionado
sus habilidades y que posee archivos de instrucciones preajustadas a
sus gustos y necesidades.
138
A.1.
A.1.1. WinClada
Autor: Nixon, 2002.
wine
den-
tro de Linux].
El programa require de
o
Hennig86
NONA
PIWE
conictos
A.1.
139
referenciar la grca.
WinDada
Edit: Lo ms importante es que permite que los datos sean o no modicables. Adems, permite adicionar polimrsmos.
Output: Le permite exportar en formatos diferentes, o informacin variada sobre los caracteres.
140
CPanel
los caracteres.
Winclados
Nodes: Para ver frecuencias de nodos, desafortunadamente su funcionalidad es muy inestable, y a veces produce resultados inesperados.
A.1.
141
Edit/Mouse modes: Modica las acciones posibles del ratn para modicar el rbol, como mover nodos, colapsarlos, cambiar la raz.
Plataforma (
McClade
Plataforma (
Mesquite
McClade
Disponibilidad (
Disponibilidad (
Mesquite
mesquiteproject.org.
MacClade
142
Maddison, 1992].
En
MacClade
Data Editor
tanas son:
Edit: se pueden duplicar caracteres o taxa, editar bloques de comandos que corran directamente en PAUP*.
Utilities: se pueden buscar secuencias particulares dentro de la
secuencia total, reemplazar caracteres por otros, reemplazar datos
ausentes por gaps y viceversa, importar alineamientos desde el
genbank y nalmente se puede lograr que la matriz hable por s
sola s, que hable! Un lector automtico lee en forma descendente
los taxa de su matriz facilitndole un poco el trabajo (puede usar
A.1.
143
144
Tree Window
las ventanas bsicas del data editor, no obstante, incluye otras nuevas,
especcas para el mapeo de caracteres y manejo de los rboles. Solo se
describen aquellas nuevas ventanas:
PAUP*
(vea la
prctica 10).
Trace: aqu se maneja todo lo relacionado con el mapeo de los
caracteres; puede mapear todos los caracteres a la vez, o escoger
un determinado carcter para ser mapeado. Tambin se escoge el
tipo de cambio de los caracteres (resolving options) el cual puede
ser ACTRAN o DELTRAN, y escoger el tipo de mapeo para los
A.1.
caracteres continuos,
MacClade Mesquite
y
145
McClade Mesquite
,
es una
McClade
equivalente.
146
A.2.
Bsqueda de rboles
A.2.1. TNT
Autor: Golobo et al. (2008b), plataforma: Windows, MacOS, Unix.
NONA
de datos o archivos de instrucciones. Para las bsquedas puede congurar los diferentes mtodos usando ratchet, drift y mult; al usar ? puede
obtener los parmetros, y con = puede modicarlos. Mult puede usarse
como la
central
nombre
El programa cuenta con ayuda en lnea que puede ser consultada usando help o escribiendo help comando para un comando especco.
A.2.
BSQUEDA DE RBOLES
147
Este es nico programa que tiene directamente implementado el remuestreo simtrico, adems tiene implementado el soporte de Bremer,
el soporte relativo de Bremer, soporte de Bremer dentro de los lmites
del Bremer absoluto y puede calcular la cantidad de grupos soportadoscontradichos (FC), con resample usted puede congurar la permutacin.
Con subop (tambin en
NONA
subptimos, en diferencia de pasos con respecto al rbol ptimo. Bsupport hace el clculo del ndice de Bremer, con un * calcula el valor relativo, o puede usar Bsupport ] para calcular el soporte relativo dentro
de los lmites del absoluto. Los resultados se pueden almacenar usando
Versin de men
winClada
, pero
1 www.lillo.org.ar/phylogeny/tnt/scripts/General_Documentation.pdf
148
Optimize: Permite ver y dibujar sinapomorfas, mapear caracteres, y revisar estadsticos de caracteres y rboles (por ejemplo
long o peso).
Trees: All se encuentran las entradas para el dibujo de rboles,
el clculo soporte de Bremer, realizar consensos y super-rboles,
as como rboles al azar, y el manejador de etiquetas de los nodos
(tags).
Data: Aparte de la conguracin de caracteres y terminales, posee
un editor bsico de datos, que aunque muy simple, es extremadamente fcil de manejar, y ms directo que los editores basados en
mostrar la matriz (Como
winClada Mesquite
, o
).
A.2.2. NONA
Autor: Golobo, 1998.
Este programa es una buena opcin que existe para bsquedas bajo
parsimonia, dado que es gratuito, tiene lenguaje de macros y es veloz,
pero dados los costos, velocidad y operatibidad de
TNT
, este ltimo
A.2.
BSQUEDA DE RBOLES
149
es la mejor opcin.
NONA
TNT
. Una
NONA
PAUP*
, no puede desactivar
terminales.
Al igual que en
TNT
permutar ramas se utiliza max. En ambos casos debe colocarse un asterisco mult*; max* para que utilice TBR como permutacin, en caso
contrario usar SPR.
150
(FC).
A.2.3. POY
Autor: Varn et al., 2007.
A.2.
BSQUEDA DE RBOLES
151
vo es el archivo a leer. Puede leer mltiples conjuntos de datos, bien sea abriendo uno por uno, o varios en la misma instruccin como
read(arch1,arch2). Los datos se van agregando. Para limpiar la
memoria se utiliza wipe(). Se buscan rboles con build(x), que realiza
x arboles de Wagner. Para mejorar dichos rboles hay que usar swap().
Note que las instrucciones estn separadas. Es posible hacer bsquedas
ms sosticadas usando nuevas tecnologas, como ratchet implementado en perturb(iterations: x, ratchet()), donde se haran x iteraciones de
ratchet, con swap(drift) o swap(annealing) se hace deriva de rboles y
cristalizacin simulada, y fuse() hace fusin de rboles.
El comando para manejar costos es transform(tcm()). Se puede modicar los costos de transformacion para datos
estticos
como mor-
fologa con
>
transform(static, weight:2)
>
transform(tcm(1,2))
152
>
transform(xedstates)
Es posible calcular soportes con calculate_support(), que incluye bootstrap, jackknife y soporte de Bremer (por omisin). Las salidas se realizan con report(archivo), pueden ser cladogramas en formato de
parntesis, dibujados en ascii, o en postscript. Tambin es til para
conocer estadsticas de los rboles, las optimaciones de los nodos y la
integridad de los datos.
A.2.4. PAUP*
Autor: Swoord, 2002.
A.2.
BSQUEDA DE RBOLES
153
PAUP*
NONA TNT
y
154
A.2.5. MrBayes
Autor: Ronquist et al., 2005.
Plataforma: Windows, MacOS, Unix.
Disponibilidad: gratuito, http://mrbayes.net
A.2.
BSQUEDA DE RBOLES
155
gratuito y su interfaz es muy similar a la de PAUP*. Los principales comandos del programa son descritos en el captulo de anlisis bayesiano.
El tutorial incluido es muy completo y viene dentro del programa.
Una de las caractersticas ms interesantes es la implementacin de
los
modelos
como el modelo parsimonia tal y como fue descrito por Tuey & Steel
(1997) que se activa usando
>
lset parsmodel=yes;
Apndice B
Formatos de archivos
B.1.
Formatos de matrices
B.1.1. NONA
NONA TNT Hennig86
POY WinClada
Es vlido para
) y
(formato de morfologa de
156
B.1.
FORMATOS DE MATRICES
157
NONA
158
;
cc -.;
p/;
B.1.2. PAUP*
Se inicia con la clasula #nexus, y luego con el bloque data. se puede
denir si los carctertes son morfolgicos, ADN o protenas. Los polimrsmos se colocan entre parntesis redondos. ADN en formato IUPAC.
#nexus
begin data;
dimensions ntax=5 nchar=5;
format missing=? gap=- symbols=0 1 2;
matrix
out 00000
alpha 10-20
beta 1102(01)
gamma 1?111
lamda 11111
;
end;
B.1.
FORMATOS DE MATRICES
159
begin assumptions;
typeset tipoUno=unord:1-3 5, ord:4;
end;
begin paup;
[Aqui
bsquedas]
hsearch add=random;
end;
#nexus
begin data;
dimensions ntax=5 nchar=5;
format missing=? gap=- datatype=dna;
matrix
out ACGTC
alpha AT-CG
beta RTAAC
gamma CGAYlamda TCNCC
;
end;
160
B.1.3. POY
POY Clustal
y
con
>
>
taxonA Comentarios
aaacgt
aac
>
taxonB
aaacgt
B.2.
Formatos de rboles
B.2.1. NONA
NONA Hennig86 WinClada TNT
,
B.2.
FORMATOS DE RBOLES
161
otros programas.
(0 (1 (2 (3 4 ))))*
(0 (1 (2 3 4 )))*
(0 ((1 2 )(3 4 )));
p/;
B.2.2. PAUP*
En
PAUP*
formato aparte. Los grupos son separados por comas y el primer taxon
es 1.
#nexus
begin trees;
translate
162
1 lamda,
2 alpha,
3 beta,
4 gamma,
5 out
;
tree *primero=(5,(1,(2,(3,4))));
tree politomico=(5,(1,(2,3,4)));
tree tercero=(5,((1,2),(3,4)));
end;
Apndice C
Algunos comandos bsicos para
POY
C.1.
(* tomado de urlgroups.google.com/group/POY4/ *)
(* dados dos archivos de datos *)
(* 1.fas y 3.fas *)
163
>
read(1.fas,
3.fas)
>
transform((names:(1.fas),
tcm:412.txt),
(names:(3.fas), tcm:121.txt))
>
store(misdatos)
>
build(5, trees:2)
>
select(best:1)
>
transform((all, static_approx))
>
report(todo13.mtr,
phastwinclad)
(*
Resultados
en
el
archivo Sensitivity_results.txt *)
>
echo
(412+121
Resultados,
output:Sensitivity_results.txt)
>
>
select(best:0)
>
use(misdatos)
>
select(characters,names:(1.fas))
>
build(5)
>
select()
>
>
>
transform((all, static_approx))
>
report(matriz1.mtr, phastwinclad)
>
use(misdatos)
>
select(best:0)
>
select(characters,names:(3.fas))
>
build(5)
>
select(best:1)
>
>
>
transform((all, static_approx))
>
>
quit()
Bibliografa
Alfaro, M. E. & M. T. Holder. 2006. The posterior and the prior in
bayesian phylogenetics. Annual Review of Ecology, Evolution,
and Systematics Pages 1942.
168
BIBLIOGRAFA
Archibald, J. K., M. E. Mort, & D. J. Crawford. 2003. Bayesian inference of phylogeny: a non-technical primer. Taxon Pages 187
191.
Bayes, T. 1763. An essay towards solving a problem in the doctrine of chances. Philosophical Transactions Pages 370418.
[doi:10.1098/rstl.1763.0053].
Camin,
J.
branching
&
R.
Sokal.
sequence
in
1965.
method
phylogeny.
for
Evolution
deducing
19:311326.
[doi:10.2307/2406441].
Carpenter, J. M. 1988. Choosing among multiple equally parsimonious cladograms. Cladistics 4:291296. [doi:10.1111/j.10960031.1988.tb00476.x].
Coddington,
J.
&
N.
Schar.
1994.
Problems
with
zero-
[doi:10.1111/j.1096-
0031.1994.tb00187.x].
Cranston,
2014.
K.,
Best
L.
Harmon,
practices
for
M.
O'Leary,
data
&
C.
Lisle.
sharing
in
phy-
BIBLIOGRAFA
logenetic
169
research.
PLOS
Currents
Tree
of
Life
[doi:10.1371/currents.tol.bf01e4a6b60ca4825c69293dc59645].
[doi:10.1111/j.1096-
0031.1991.tb00045.x].
Farris,
J.
2001.
Support
weighting.
Cladistics
[doi:10.1111/j.1096-0031.2001.tb00133.x].
17:389394.
170
BIBLIOGRAFA
Giribet,
ular
G.
&
W.
Phylogenetics
C.
Wheeler.
and
1999.
Evolution
[doi:dx.doi.org/10.1006/mpev.1999.0643].
On
gaps.
13:132
Molec
143.
BIBLIOGRAFA
171
and
zandee.
Cladistics
11:91104.
[doi:10.1111/j.1096-
0031.1995.tb00006.x].
Golobo,
es
tion
and
P.
1997.
state
costs.
Self-weighted
reconstructions
Cladistics
optimization:
under
13:225245.
implied
Tree
search-
transforma-
[doi:10.1111/j.1096-
0031.1997.tb00317.x].
Golobo, P. 1998. Tree searches under sanko parsimony. Cladistics 14:229237. [doi:10.1006/clad.1998.0068].
Golobo, P. & J. Farris. 2001. Methods for quick consensus estimation. Cladistics 17:S26S34.
Golobo, P. & D. Pol. 2005. Parsimony and Bayesian phylogenetics. 148-162 Oxford.
172
BIBLIOGRAFA
Golobo, P. A. 2014. Hide and vanish: data sets where the most
parsimonious tree is known but hard to nd, and their implications for tree search methods. Molecular Phylogenetics and Evolution Pages. [doi:dx.doi.org/10.1016/j.ympev.2014.06.008].
Golobo, P. A., J. M. Carpenter, J. S. Arias, & D. R. MirandaEsquivel. 2008a. Weighting against homoplasy improves phylogenetic analysis of morphological data sets. Cladistics 24:758
773. [doi:10.1111/j.1096-0031.2008.00209.x].
Golobo, P. A., C. I. Mattoni, & A. S. Quinteros. 2006. Continuous characters analyzed as such. Cladistics 22:589601.
[doi:10.1111/j.1096-0031.2006.00122.x].
BIBLIOGRAFA
173
Grant, T. & A. Kluge. 2004. Transformation series as an ideographic character concept. Cladistics 20:2331.
Kearney, M. 2002. Fragmentary taxa, missing data, and ambiguity: mistaken assumptions and conclusions. Systematic Biology
51:369381.
Kluge,
cles:
A.
1997.
Sophisticated
Consequences
phylogenetic
for
falsication
dierential
systematics.
and
character
Zoologica
[doi:10.1111/j.1463-6409.1997.tb00424.x].
Scripta
research
weighting
cyin
26:349360.
174
Kluge,
the
BIBLIOGRAFA
A.
&
J.
evolution
Farris.
of
1969.
anurans.
Quantitative
Systematic
phyletics
Zoology
and
18:132.
[doi:10.1093/sysbio/18.1.1].
BIBLIOGRAFA
175
Miyamoto,
M.
M.
1985.
Consensus
cladograms
and
gener-
[doi:10.1111/j.1096-
0031.1985.tb00421.x].
Nelson,
ples
G.
and
1979.
Cladistic
denitions,
with
analysis
a
and
historical
synthesis:
note
on
Princi-
adanson's
176
BIBLIOGRAFA
Patterson, C. 1981. Signicance of fossils in determining evolutionary relationships. Annual Review of Ecology and Systematics
12:195223.
Platnick,
tion
N.
of
I.
1979.
Philosophy
cladistics.
Systematic
and
the
Biology
transforma28:537546.
[doi:10.2307/sysbio/28.4.537].
Pleijel,
F.
1995.
construction.
On
character
Cladistics
coding
11:309315.
for
phylogeny
re-
[doi:10.1111/j.1096-
0031.1995.tb00092.x].
Posada, D. & K. A. Crandall. 2001. Selecting the best-t model of nucleotide substitution. Systematic Biology 50:580601.
[doi:10.1080/10635150118469].
Quicke, D. L. J., J. Taylor, & A. Purvis. 2001. Changing the landscape: A new strategy for estimating large phylogenies. Systematic Biology 50:6066. [doi:10.1080/10635150119012].
BIBLIOGRAFA
177
Richards, R. 2002. Kuhnian valures and cladistic parsimony. Perspectives on Science 10:127.
Rieppel, O. & M. Kearney. 2002. Similarity. Biological Journal of the Linnean Society 75:5982.
[doi:10.1046/j.1095-
8312.2002.00006.x].
Scotland, R. W., R. Olmstead, & J. Bennett. 2003. Phylogeny reconstruction: the role of morphology. Systematic Biology
52:539548.
Sharkey, M. & J. Leathers. 2001. Majority does not rule: the trouble with majority-rule consensus trees. Cladistics 17:282284.
Sharkey, M. J., S. Stoelb, D. R. Miranda-Esquivel, & B. J. Sharanowski. 2013. Weighted compromise trees: a method to summarize competing phylogenetic hypotheses. Cladistics 29:309314.
[doi:10.1111/cla.12000].
178
BIBLIOGRAFA
Springer, M. S., R. W. DeBry, C. Douady, H. M. Amrine, O. Madsen, W. W. de Jong, & M. J. Stanhope. 2001. Mitochondrial versus nuclear gene sequences in deep-level mammalian phylogeny
reconstruction. Molecular Biology and Evolution 18:132143.
Steel, M. 2002. Some statistical aspects of the maximum parsimony method. Pages 125139 en Molecular Systematics and
Evolution: Theory and Practice (R. DeSalle, W. Wheeler, &
G. Giribet, eds.) vol. 92 de EXS 92. Birkhuser Basel.
Strong, E. & D. Lipscomb. 1999. Character codding and inaplicable data. Cladistics 15:363371.
BIBLIOGRAFA
179
Swoord, D., G. Olsen, P. Waddell, & D. Hillis. 1996. Phylogenetic Inference cap. 11, Pages pp. 407514. Sinauer Associates,
Sunderland, Massachusetts.
180
BIBLIOGRAFA
ndice alfabtico
rboles
pesaje
Codicacin, 24
a posteriori, 57
a priori, 57
alineamiento
sucesivo, 58
anlisis de sensibilidad, 67
tcnicas, 56
denicin, 65
Test de Patterson, 2
mltiple, 67
Consenso
Bsqueda
clculo, 99
funciones concavas, 60
estricto, 99
Ratchet, 43
mayora, 99
SPR, 39
TBR, 39
Formatos, 157
rboles, 162
Wagner, 38
matrices, 157
Carcter
Codicacin, 2, 13
Likelihood
denicin, 1
bsquedas, 89
homologa, 1
modelos, 76
181
182
NDICE ALFABTICO
Parsimonia
bsquedas, 35
Programas
bsquedas, 147
Edicin de matrices, 139
Remuestreo
bootstrap, 59
jackknife, 59
Soporte
bootstrap, 122
jackknife, 122
ML, 122
Bootstrapping no paramtrico, 122
Bootstrapping paramtrico,
108
parsimonia, 108
Bootstrap, 108
Bremer, 108
Jack-knife, 108
remuestreo, 108