Está en la página 1de 51

Anlisis filogentico y Construccin

de rboles
Lectura de un rbol filogentico: Significado de los grupos
monofilticos
Un rbol filogentico es un diagrama que representa la lnea de descendencia
evolutiva de las diferentes especies organismos o de los genes de un ancestro
com!n
Lectura de un rbol filogentico: Significado de los grupos
monofilticos
"stas filogenias tienen como fin apreciar las abrumadoras evidencias que apoyan
la teora de la evolucin propuesta por C#arles $atr%in quien fue uno de los
primeros cientficos en utili&arlas para e'plicar sus estudios(
Lectura de un rbol filogentico: Significado de los grupos
monofilticos
)*u es e'actamente una filogenia+
)Cmo se deben leer e interpretar estos diagramas+
)Cmo se construyen este tipo de diagramas+
Lo representado en un rbol
filogentico
Cuatro ranitas de Darwin
Cuatro ranitas de Darwin (fila superior)
Conectadas con sus padre (fila inferior)
,
A -.
-/
2013
2012
2011
2010
2009
-0
-.
-/
-1
-2
En varias generaciones, cada individuo dar lugar a un
nero varia!le de cr"as por generaci#n$
Eliinando las igenes de los individuos, el recuadro anterior
se inserta en una po!laci#n a%or con s uniones
generacionales$
En una escala de tiepo evolutiva, la igraci#n de genes entre las
pe&ue'as po!laciones, entrete(iendo los lina(es, llevndolos a
conforar una sola especie$
34CA54A67A
Durante la evoluci#n uc)as veces los lina(es sufren de
divisiones a causa de un fen#eno conocido coo
*+C,-+,./,
,islaientos
0igraciones
1en#enos a!ientales
Coo consecuencia de la *+C,-+,./,, los lina(es &ue se
desarrollan separadaente con cada ve2 s diferentes,
)asta el punto en &ue pueden llegar a conforar especies
totalente diferentes$
"8emplo3 4in2#n de las +slas 5alpagos o 4in2#n de Darwin$
Este fue uno de los e(eplos s iportantes presentados por
C)arles Darwin coo prue!a de su teor"a de la evoluci#n de las
especies$
)Cmo clasificar las especies+
,
A
, 6 C
D
4asado
1uturo
Cuatro especies descendientes
7ina(e nico ancestral
7ina(e e8tinguido
, 6 C D
,ncestro con
de ,, 6, C % D
,ncestro con
de C % D
,ncestro con
de , % 6
-epresentaci#n de la clasificaci#n de cuatro especies (,, 6, C, D)$
7as especies , % 6 coparten un ancestro con s reciente
&ue con las especies C % D$ 9i la relaci#n fuese entre , % C, , % D,
6 % C o !ien 6 % D, el ancestro con ser"a el c"rculo aarillo$ Del
iso odo, C % D coparten un ancestro en con s
reciente entre si &ue el de las especies , % 6$
"l l'ico de un rbol filogentico
,acterias Aves 9arsupiales :;9;
.odo
(Evento de especiaci#n)
:erinales;:a8a
-a"2
(noralente sin eti&ueta)
<rganisos individuales,
especies o grupos de
especies$ 9iepre %
cuando representen una
raa separada del r!ol$
En ciertos conte8tos
pueden corresponder a
genes individuales$
9amferos Lagartos Cocodrilos Aves
Clado o
grupo onofol=tico
>n clado es una pie2a de una filogenia &ue inclu%e
un lina(e ancestral % todos los descendientes de ese
ancestro$ Este grupo ancestral tiene la propiedad de
la 0<.<1+7+,, por lo &ue ta!i=n puede ser referido
coo un grupo onofil=tico$
>n grupo onofiletico puede ser identificado visualente
%a &ue es un peda2o de un r!ol grande &ue puede ser
cortado de ra"2 con un solo corte$
5rupo no onofol=tico
9amferos Lagartos Cocodrilos Aves
9i un r!ol tiene &ue ser cortado en dos lugares para
e8traer un deterinado con(unto de ta8ones, los ta8ones
constitu%en un grupo .< 0onofil=tico$
9amferos Lagartos Cocodrilos Aves
,ctualente se inclu%e a las ,ves dentro del clado
-eptilia$
)Cmo se lee un rbol filogentico+
6 C D
, 6
C D
,
6
C D
,
>n r!ol filogen=tico representa la )istoria de la raificaci#n de un ancestro
con$ En este conte8to de!e &uedar en claro &ue lo iportante es la
raificaci#n % no lo iportante de las raas (a enos &ue se indi&ue)$
En la figura, todos los r!oles contienen la isa inforaci#n$
, 6 C D ,
6
C
D
D
5egla general
-otar
5irar
:orcer
9in llegar a cortar la l"nea
Del iso odo, distintos diagraas pueden representar la isa inforaci#n
pero de distintas aneras$
7os r!oles representan l"neas evolutivas &ue no poseen
fora, por lo &ue pueden ponerse los or"genes tanto en la
punta i2&uierda o derec)a de la iagen sin alterar el
resultado final de la l"nea
,
6 C D E , 6
C D
E , 6 C D
E
Cladograma: es el modelo bsico y simplemente muestra la distancia al ancestro comn en
trminos relativos. Las ramas son de igual longitud por lo cual no indican el tiempo evolutivo.
Filograma: contiene informacin adicional dada por la longitud de las ramas. Los nmeros
asociados con cada rama corresponden a un atributo de las secuencias, tal como cantidad de
cambio evolutivo. Es aditivo. Mtricos.
Dendrograma: tipo especial de rbol aditivo en el cual los extremos del rbol son equidistantes de
la raz y son proporcionales al tiempo de divergencia.
D
,
C
6
9in edici#n
D
,
C
6
Ca!io gen=tico
?
1
@
1
1
3
D
,
C
6
:iepo
Cladograma
Filograma
Dendrograma
Construccin de arboles filogenticos
$atos a utili&ar:
4oliorfisos de restricci#n$
9.4s
9ecuencias de ,D.$
9ecuencias de ,-.$
4oliorfisos de longitud$
AGCGAGAGCGAGGATGACGGCTGGGAGATTGGGTATCTCGACCGGACGTC
AGCGATAGTGAGGATGACGGCTGGGATATTGGGTATCTCGACCGGTCCTC
AGCGATAGTGAGGATGACGGCTGGGATATTGGGTATCTCGACCGGTCCTC
AGCGAGAGCGAGGATGACGGCTGGGAGATTGGGTATCTCGACCGGACGTC
AGCGAGAGCGAGGATGATGGCTGGGAGATTGGGTATCTCGACCGGACGTC
TCAGAAATTGAAAGGGCTGTTACCCATTGAAGAAAAGAAAGAAAAATTTA
TCAGAAATTAAAAAGGTCTTTACCCGTTGAAGAGAAGACCGAGACATTTA
TCAGAAATTAAAAAGGTCTTTACCCGTTGAAGAGAAGAACGAAACATTCA
TCAGAAATTGAAAGGGCTGTTACCCATTGAGGAAAAGAAAGAAAAATTTA
TCAGAAATTGAAAAGGCTATTACCCATTGAAGAAAAGAAAGAAAAATTTA
<rincipales mtodos
1$ 9todos por distancia
2$ 08ia parsionia
3$ 08ia verosiilitud
Neighbor-Joining (Matrices no ultramtricas,
rbol sin raz)
UPGMA (distancias ultramtricas, rbol con raz)
,
6 C
,
6
C
D
1$ 9todos por distancia
Si el rbol tiene raz, la distancia es ultramtrica
Dados tres taxones cualesquiera, A,B,C, se tiene:
1. Hay uno que equidista de los otros dos. (En el caso
de la figura, el A)
2. Esa distancia es mayor que la distancia entre los dos
restantes.
d
AC
= v
1
+ v
2
+ v
4
= v
1
+ v
2
+ v
3
= d
AB
> d
BC
La distancia medida en un rbol es aditiva
, 6 C D E
9A=54C"S $" $4S=A6C4A
0 ? A A
? 0 A A
A A 0 0
A A 2 0
, 6 C D
,
6
C
D
, 6 C D
1
3
3
3
1
1
9A=54C"S $" $4S=A6C4A
A
P
i k
H
I
H
S
H
S
H
i
H
i
H
S
H
S
H
T
H
i
Representa la disminucin de la heterocigosis originada por
el apareamiento aleatorio a nivel metapoblacional.
Representa la disminucin de la heterocigosis originada por el
apareamiento aleatorio a nivel intra-subpoblacional. Puede
alcanzar valores positivos (dficit de heterocigotos), negativos
(exceso de heterocigotos) o, simplemente 0, cuando las
poblaciones se encuentran en equilibrio de Hardy-Weinberg,
situacin en la que F
IS
coincide con el coeficiente de
consanguineidad.
Este parmetro se denomina ndice de fijacin y
representa la disminucin de la heterocigosis
originada por el apareamiento aleatorio a nivel inter-
subpoblacional. Oscila entre 0, cuando todas las
poblaciones tienen las mismas frecuencias gnicas y
1 cuando las poblaciones estn fijadas para alelos
distintos, es decir son diferentes.
El tratamiento jerrquico de las poblaciones subdivididas.
Paso 2: Definicin de los estadsticos F de Wright.
19:
19: 19:
19: 19: 19:
, 6 C D
,
6
C
D
, 6 C D
9A=54C"S $" $4S=A6C4A >?S=@
5"A6;L$S B"45 A C;CC"5:A9$" 2DE/
Esta edida supone &ue sur(an diferencias gen=ticas de!ido a &ue solo la deriva
gen=tica$
C;"?4C4"6=" $" $43"5-"6C4A "6=5" <;,LAC4;6"S >-S=F 6"4 2DGE@
9iilar al 19: aun&ue perite incluir un nero iliitado de alelos por loci$
$4S=A6C4A -"6H=4CA "S=A6$A5 $" 6"4 >2DG1@
Esta edida supone &ue las diferencias surgen de!ido a utaciones gen=ticas %
la deriva gen=tica$
$4S=A6C4AS -"6H=4CAS
46$4C" $" ?4IAC4J6 >?S=: B54-:= 2D02@
-epresenta la disinuci#n de la )eterocigosis originada por el apareaiento
aleatorio a nivel interKsubpoblacional$ <scila entre 0, cuando todas las
po!laciones tienen las isas frecuencias g=nicas % 1 cuando las po!laciones
estn fi(adas para alelos distintos, es decir son diferentes$
C;"?4C4"6=" $" $43"5-"6C4A "6=5" <;,LAC4;6"S >-S=F 6"4 2DGE@
Esta edida supone &ue las diferencias surgen de!ido a utaciones gen=ticas % la
deriva gen=tica$
9A=54C"S $" $4S=A6C4A
$S= L := K :S
-S= L $S= M :=
Diversidad entre po!laciones
Coeficiente de divergencia
<oblacin 6N Alelo 2 Alelo 1
A 33 0,BC 0,@3
, B2 0,CA 0,22
G0
Clculo de las medias ponderadas para cada alelo
p
1
=
(330,47)+(420,78)
75
D OP./P
p
2
=
(330,53)+(420,22)
75
D O/0P.
<oblacin 6N Alelo 2 Alelo 1
A 33 0,BC 0,@3
, B2 0,CA 0,22
G0
Clculo de la #eterocigosis total esperada >:QB@
E
1
= 1 p

2
B
T
= 1 |(u,64)
2
+ (u,S6)
2
]
B
T
= u,46 u,46 u,46 u,46
<oblacin 6N Alelo 2 Alelo 1
A 33 0,BC 0,@3
, B2 0,CA 0,22
G0
Clculo de la #eterocigosis esperada para cada subpoblacin >:QB@
E
A
= 1 p

2
B
A
= 1 |(u,47)
2
+ (u,SS)
2
]
B
A
= u,Su u,Su u,Su u,Su
E
B
= 1 p

2
B
B
= 1 |(u,78)
2
+ (u,22)
2
]
B
B
= u,S4 u,S4 u,S4 u,S4
<oblacin 6N Alelo 2 Alelo 1
A 33 0,BC 0,@3
, B2 0,CA 0,22
G0
Clculo de la #eterocigosis esperada para la poblacin >:QB@
B
S
= |(N
A
*B
A
) + (N
B
*B
B
)]N
T
B
S
= u,41 u,41 u,41 u,41
B
S
= |(SS*u,Su) + (42*u,S4)]7S
<oblacin 6N Alelo 2 Alelo 1
A 33 0,BC 0,@3
, B2 0,CA 0,22
G0
Clculo de la diversidad entre poblaciones
B
ST
= B
T
- B
S
B
ST
= u,uS u,uS u,uS u,uS
B
ST
= u,46 u,41
<oblacin 6N Alelo 2 Alelo 1
A 33 0,BC 0,@3
, B2 0,CA 0,22
G0
Clculo de la diversidad entre poblaciones
0
S1
=

S1
E
1
0
S1
=
0,05
0,46
D O22
59:
59: 59:
59: 59: 59:
, 6 C D
,
6
C
D
, 6 C D
C;"?4C4"6=" $" $43"5-"6C4A "6=5" <;,LAC4;6"S >-S=@
Neighbor-Joining
UPGMA
CONSTRUCCIN DE UN RBOL FILOGENTICO USANDO EL MTODO UPGMA
El =todo >450, (Mtodo de agrupamiento por pares con media aritmtica no
ponderada) es el =todo de agrupaiento s siple )asta a)ora desarrollado$
Caractersticas
Constru%e un r!ol por un =todo de agrupaiento secuencial$
Dada una atri2 de distancias, =ste inicia ediante la agrupaci#n de los dos ta8ones con la
enor distancia
>n nodo interior es colocado en el punto edio entre ellos % se crea una atri2 reducida al
considerar el nuevo grupo coo un nico ta8#n$
7as distancias entre este nuevo ta8#n copuesto % el resto de los ta8ones se calculan para
crear dic)a atri2$
El iso proceso de agrupaiento se repite crendose una nueva atri2 reducida$
9e produce una iteraci#n contina )asta &ue todos los ta8ones se inserten en el r!ol$
El ltio ta8#n a'adido se considera coo grupo e8terno lo &ue produce un r!ol con ra"2$
Ejemplo de construccin de un rbol filogentico usando
el mtodo UPGMA (tomado del libro de Xiong)
A , C $
,
6 0,B0
C O/0 0,B@
D 0,?0 0,C0 0,@@
,
C
0,1C@
0,1C@
AKC ,
6
0,40+0,45
2
D O.10
D
0,60+0,55
2
D 0,@C@
0,C0
6
0,B2@;2D0,212
,KAKC
D
0,70+0,60+0,55
3
D OP2G
D
0,?1C;2D0,309
CONSTRUCCIN DE UN RBOL FILOGENTICO USANDO EL MTODO MXIMA
PARSIMONIA (MP).
El mtodo de MP selecciona el rbol que tiene el mnimo nmero de cambios evolutivos, i.e.,
el rbol cuyas ramas tengan promedio la mnima longitud.
Se basa en el principio conocido como Navaja de Occam (Occams razor) formulado por
William Ockham en el siglo XIV.
Este principio hace referencia a un tipo de razonamiento basado en una premisa muy
simple: en igualdad de condiciones la solucin ms sencilla es probablemente la
correcta.
Esto es porque la solucin ms simple requiere el menor nmero de suposiciones y de
operaciones lgicas.
4ara el anlisis filogen=tico, la parsionia es una !uena suposici#n$
9iguiendo este principio, un r!ol con el enor nero de su!stituciones es
pro!a!leente la e(or opci#n para e8plicar las diferencias entre los ta8ones
estudiados$
Esta perspectiva se (ustifica por el )ec)o de &ue los ca!ios evolutivos &ue suceden
dentro de lapsos de tiepo cortos son relativaente raros$
Esto iplica &ue un r!ol con ca!ios "nios es u% pro!a!le &ue sea una !uena
estiaci#n del verdadero r!ol$
,l inii2ar los ca!ios, el =todo inii2a el ruido filogen=tico de!ido a la
)ooplasia (ca!io evolutivo paralelo &ue )ace &ue dos organisos presenten un
iso carcter ad&uirido independienteente) % a la evoluci#n independiente$
CONSTRUCCIN DE UN RBOL FILOGENTICO USANDO EL MTODO MXIMA
PARSIMONIA (MP).
CONSTRUCCIN DEL RBOL
La construccin del rbol filogentico de MP funciona
buscando todas las posibles topologas de rboles y
reconstruyendo secuencias de ancestros que requieren
el mnimo nmero de cambios evolutivos a las
secuencias actuales.
Para ahorrar tiempo de cmputo, slo un pequeo
nmero de sitios, que tienen informacin filogentica
importante, son usados en la determinacin del rbol.
Estos sitios son llamados sitios informativos, los
cuales son definidos como sitios que tienen al menos
dos tipos diferentes de caracteres, cada uno
ocurriendo al menos dos veces.
E(eplo de e8tracci#n de sitios
inforativos
Sitios informativos y no-informativos.
Los sitios informativos son los que pueden a menudo ser explicados median una
topologa de rbol nica.
Los sitios no-informativos son constantes o tienen cambios que ocurren una sola vez.
Los sitios constantes obviamente no son tiles para evaluar diferentes topologas.
Los sitios con cambios ocurriendo una sola vez tampoco son tiles porque pueden ser
explicados por mltiples topologas.
Los sitios no-informativos son desechados en el proceso de construccin de un rbol
filogentico de MP.
Dr.
CONSTRUCCIN DEL RBOL
Etapas de la construccin
Una vez que los sitios informativos son identificados y los no-informativos son
descartados, el mnimo nmero de substituciones en cada sitio informativo es calculado
para una topologa dada.
El nmero total de cambios en todos los sitios informativos son sumados para cada
posible topologa y el rbol con el ms pequeo nmero de cambios es elegido como el
mejor.
Consideraciones
La clave para contar un nmero mnimo de sustituciones para un sitio particular es
determinar los estados del carcter ancestral en los nodos internos.
Debido a que estos estados de caracteres ancestrales no se conocen directamente,
pueden existir mltiples soluciones posibles.
En este caso, el principio de parsimonia se aplica para elegir los estados de los caracteres
que resultan en un mnimo nmero de sustituciones.
CONSTRUCCIN DEL RBOL
La inferencia de una secuencia ancestral se realiza en dos pasos
1. Se recorre el rbol de las hojas hacia la raz para determinar todos los posibles estados de los
caracteres ancestrales
2. Se recorre el rbol de la raz hacia las hojas para asignar secuencias ancestrales que exigen el
nmero mnimo de sustituciones (puntaje de parsimonia)
CONSTRUCCIN DEL RBOL
ClustalE,lineaiento (5ratis)
,174surv 1,0 (5ratis)$
4opulations (0u% til con icrosat=lites, 5ratis)
.FG4lot
4HI7+4 3,?9@ (5ratis)
Codoncode ,ligner (u% til con secuencias D.,, -.,, 4rot$
0E5, 3$1 (0u% fcil de ane(ar)
4,>4J (4<4 9:,-) (Es el s sofisticado % verstil)
5raficar con :reeview, :reeilustrator, :ree5rap) (:odos gratis)$
<5;-5A9AS U=4L47A$;S "6 LA C;6S=5UCC4J6 $" A5,;L"S
.ota3 En a2ul se destacan los prograas utili2ados en clases$

También podría gustarte