Está en la página 1de 12

Introduccin a la Bioinformtica, prctica 3: Creacin

de rboles filogenticos.

Introduccin
En esta prctica conoceremos los fundamentos de los anlisis filogenticos por
medios informticos. Principalmente cubriremos el uso de algunas de las
herramientas bioinformticas ms conocidas y la manera de crear filogramas y
cladogramas con ellas.

Para seguir adelante con esta prctica, es fundamental que conozca la manera de recuperar secuencias y
cmo crear alineamientos mltiples con estas. Si encuentra alguna dificultad en esto, por favor remitase a
las dos prcticas anteriores: BLAST y recuperacin de secuencias biolgicas, Alineamiento mltiple e
identificacin y bsuqeda de motivos.

Nota: estas prcticas se basan en la premisa de que se conoce el marco terico general sobre el cual stas
se basan, de esta manera no se pretende que estas prcticas sean un tutorial en s mismas, sino ms bien un
complemento fundamental para poner en prctica los conceptos recibidos en las clases tericas. Sin
embargo, eventualmente encontrar descripciones y explicaciones de conceptos que as lo requieran, estos
se encuentran encerrados en marcos de color verde.

Preparando nuestras secuencias

No exageremos si afirmamos que el exito o fracaso de un anlisis filogentico


radica en el alineamiento mltiple (AM) que obtengamos de nuestras secuencias.
Bsicamente debemos seguir los lineamientos planteados en la anterior gua
acerca de AM.
Garbage in, garbage out (basura a la entrada, basura a la salida), es una vieja
premisa en anlisis bioinformticos, y bsicamente nos recuerda que no importa
lo efectivo que sea un programa o algoritmo, la calidad de nuestros resultados
siempre depender de la calidad de la informacin que le suministremos a este.

Recupere y realice un alineamiento mltiple (preferiblemente mediante clustalw,


ya que necesitaremos una archivo .aln completamente vlido ms adelante) con
las siguientes secuencias de insulina para diferentes especies:
1. NP_000198
2. P30410
3. NP_062002
4. P01321
5. NP_032412
6. P01311
7. P01315
8. P01332
9. NP_776351
10.P01318

Una vez realizado el alineamiento, preste atencin al rbol gua calculado por
clustalw, recuerde que este NO es un rbol filogentico. Entonces , cul es el
significado de este rbol gua?

Guarde el archivo de alineamiento. Salve tambin el rbol gua, lo utilizaremos


ms adelante.

Edicin de nuestro alineamiento


Generalmente, tendemos a pensar en un alineamiento mltiple como en un
archivo sagrado, intocable y portador de la verdad absoluta. Sin embargo, en
la vida real es muy comn realizar ediciones manuales de nuestros
alineamientos, y esto puede responder a varias circunstancias. Por ejemplo,
algunas veces resulta evidente para nuestros ojos que la remocin de una
seccin de gaps podra dar lugar a un mejor alineamiento (simplemente ningn
algoritmo puede superar nuestra capacidad de raciocinio), sin llegar a alterar
drsticamente nuestros resultados.
En el caso de la creacin de rboles. Los gaps no son de mucha ayuda y por lo
general trabajamos con las regiones muy conservadas, y es rutinario suprimir las
regiones ricas en gaps y trabajar nicamente con dichos bloques de
conservacin.
En el caso de clustalw, es posible hacerle explcito que no queremos trabajar con
regiones ricas en Gaps (ms adelante detallaremos este proceso).
De esta manera es posible realizar una edicin manual de nuestro alineamiento,
esto es posible tanto desde JalView, como desde BioEdit, e incluso desde
cualquier procesador de palabra como Open Office Writer, Kword, Abiword o
Ms Word.
****

Creacin de rboles filogenticos con clustalw


Existen herramientas mucho ms sofisticadas que clustalw para la creacin de
rboles (ms adelante veremos algunas de ellas), que nos permiten controlar
cada uno de los aspectos de la creacin de nuestro rbol, para lo cual debemos
intimar con muchos de los detalles detrs de los algoritmos existentes para este
fin. Particularmente con clustalw resulta muy sencillo crear nuestros rboles.
...visite nuevamente la pgina de clustalw en el sitio web del EBI:
http://www.ebi.ac.uk/clustalw
e ingrese el alineamiento mltiple creado en el paso anterior.

Esta vez clustalw, entender que hemos ingresado un AM y que no debe crear
uno nuevamente! Sin embargo debemos darle algunas indicaciones antes de
continuar. Lo primero que debemos decirle es el tipo de mtodo que utilizaremos
para la creacin de nuestro rbol:
Seleccione NJ en el men desplegable: TREE TYPE, de la seccin
PHYLOGENETIC TREE.

Con esta opcin hemos decidido crear nuestro rbol mediante el mtodo
Neighbor Joining, que es tal vez el mtodo de mayor aceptacin para este tipo
de anlisis.

Mtodos para la creacin de rboles


Bsicamente existen 2 categoras de mtodos para la creacin de rboles en
estudios filogenticos: Mtodos basados en distancia (dentro de los que se
encuentran UPGMA y NJ), y los mtodos basados en la composicin de las
secuencias (ac se encuentran el mtodo de mxima parsimonia ML, y el de
mxima probabilidad ML).
Cada uno de estos mtodos tiene sus fortalezas y sus debilidades, pero es ms
ampliamente usado NJ, ya que ha probado ser bastante eficaz.
Como fue mencionado anteriormente, generalmente no es conveniente crear
nuestro rbol haciendo uso de las regiones ricas en gaps, si no hemos editado
nuestro alineamiento manualmente debemos decirle a clustalw que no use dichas
regiones.

Seleccione On en el men desplegable: Ignore Gaps de la seccin


PHYLOGENETIC TREE.

Despus de unos segundos, aparecern nuestros resultados. La pgina de


resultados es similar a la presentada al hacer un alineamiento mltiple, sin
embargo su contenido es un poco diferente.

Cabe anotar que se crea por defecto un rbol Phylip, adems del que hemos
pedido (NJ).
Por defecto tambin, clustalw muestra primero un cladograma, que se ubica al
final de la pgina de resultados:
Esta vez nos interesa conocer las distancias relativas de las ramas en nuestros
rboles y no solamente su topologa, as que hes ms conveniente que veamos el
rbol como un filograma:

Presione el botn Show as phylogram Tree.

Compare este rbol con el rbol gua creado por clustalw al realizar el
alineamiento. Encuentra diferencias y/o similitudes entre ellos? De qu manera
se organizan lo OTUs en cada uno de estos?

Puede ser interesante guardar nuestro rbol para futuros anlisis y tal vez la
idea de tomar capturas de pantalla cada vez que queramos guardar nuestros
rboles no resulte muy atractiva. Clustalw nos ofrece la opcin de guardar
nuestro rbol en un formato conocido como Newick.

Presione el botn View PH File que se encuentra en la parte inferior del


filograma.

Despus de unos segundos ser llevado a una pgina web en la cual nuestro
rbol ha sido convertido a dicho formato, que se caracteriza por su gran cantidad
de parntesis.
Creacin de rboles filogenticos mediante Phylip
Como fue mencionado anteriormente, clustalw es bsicamente una herramienta
para alineamiento mltiple de secuencias, sin embargo hemos visto que es
posible realizar muy buenos rboles mediante su utilizacin.
Para el mundo de la filogenia, sin embargo, existen otros programas mucho ms
usados, y que de alguna manera podemos caracterizar como de gama alta, es
decir son programas (y suites) especficamente desarrollados para este
propsito, generalmente reservados para los gures en este tipo de anlisis.
Dentro de esta gama alta de programas contamos con PAUP y PHYLIP. En esta
oportunidad trabajaremos con este ltimo.

Visite la siguiente direccin:


http://bioweb.pasteur.fr/seqanal/phylogeny/phylip-uk.html

Phylip puede ser considerado mejor como un paquete de programas para


anlisis filogentico ms que un programa individual. Esta es la razn por la
cual se encuentra frente a un listado de programas en este momento.
El truco para trabajar con Phylip es utilizar los programas en orden y conocer
de antemano lo que queremos lograr.
Nuestro objetivo es crear un rbol basado en distancias, as que lo primero que
debemos hacer es crear la matriz de distancias de nuestro alineamiento mltiple.

En la primera seccin Programs for molecular sequence data en la seccin


Proteins presione el enlace advanced form del programa protdist. Ser
llevado-a la siguiente pgina web:

Ingrese all su direccin de correo electrnico, tambin copie y pegue el


alineamiento mltiple realizado anteriormente (Incluyendo la lnea que dice
CLUSTALW).

Dependiendo de la longitud del alineamiento, los resultados pueden aparecer en


pantalla inmediatamente o ser enviados a la direccin de correo que se ha
ingresado, esto depende de la carga del servidor y no existe manera de controlar
este comportamiento.

Siga el enlace a Bootstrap en la parte inferior del formulario.


Este formulario nos permite definir los parmetros bajo los cuales realizaremos
el bootstrap de nuestro rbol.

Seleccione la casilla Perform a bootstrap before analysis. En la casilla


Random Number seed, introduzca 3 y en la opcin How many
replicates 2.

El nmero de rplicas por lo general debe ser como mnimo 100. Esto implica sin
embargo una gran carga para el servidor, por ahora dejaremos este nmero en
2, as obtendremos nuestros resultados mucho ms rpido y, en general, el
concepto se podr comprender igualmente.
Despues de unos minutos llegar una serie de correos a la direccion que ingres
anteriormente.

El ms importante de estos correos es el primero de ellos: acces all protdist


results, los otros correos contienen detalles acerca de los anlisis realizados. El
contenido de este correo es una URL que le llevar a una pgina web con los
resultados.

Siga dicho link a la pgina de resultados.


Seleccione neighbor del men desplegable en la parte superior de la pgina
de resultados.

Mediante esta opcin estamos especificando que usaremos el programa


Neighbor, que convierte nuestra matriz de distancia en un rbol NJ.

Presione el botn Run the selected program on outfile.


La anterior accin le llevar a una nueva pgina web.

Seleccione Neighbor-Joining como mtodo de distancia.

De esta manera obtendremos un rbol NJ.

Siga el enlace que dice Bootstrap options, y llene los campos de acuerdo a la
siguiente imgen.

En la seccin other options, ingrese el nmero 8 en la casilla outgroup


species. tiene alguna idea de por qu hemos escogido este nmero para el
outgroup? Pista: est directamente relacionado con el alineamiento mltiple
realizado.

Presione el botn run neighbor que se encuentra en la parte superior de la


pgina.

Despus de unos minutos apareceran los resultados en pantalla (o llegarn los


enlaces correspondientes a su correo).
Los primeros 2 enlaces llevan a los archivos que contienen los rboles de los
consensos. Outfile.consense muestra una versin en texto de nuestro rbol,
as como datos generales acerca del proceso de bootstrapping.

Outtree.consense, lleva a un archivo en formato Newick.


Los siguientes dos enlaces nos muestran los rboles que fueron utilizados para
crear el rbol consenso. De igual manera que para el rbol consenso, el enlace
outtree es una versin en formato Newick de dichos rboles.
Esta vez encontramos nicamente dos rboles debido a que este fue el nmero
de rplicas que pedimos, generalmente deben ser alrededor de 100!

Phylip, ofrece tambin herramientas que permiten visualizar nuestro rbol de


una mejor manera.

Seleccione la opcin drawtree del men desplegable, justo debajo de los dos
primeros enlaces y presione el botn ubicado a la derecha de este.

Esto le llevar a una nueva pgina en la que puede establecer el formato de la


grfica en la que ser exportado nuestro rbol. Adems de si queremos ver
nuestro rbol como un fenograma o un cladograma.

Esta vez utilizaremos las opciones por defecto (archivo en formato postscript y
cladograma).
Presione el botn Run drawtree. Asegrese de que su direccin de correo
electrnico se encuentra en la casilla.

Obtendr una nueva pgina web con un enlace al archivo postscript.

Gua elaborada por Andrs M. Pinzn V., del Centro de Bioinformtica del Instituto de Biotecnologa en la Universidad Nacional de
Colombia y est distribuida bajo licencia:

Creative Commons

Bogot Colombia - Julio de 2006.

Cualquier sugerencia o inquietud dirigirla a:

ampinzonv@unal.edu.co andrespinzon@gmail.com

También podría gustarte