Está en la página 1de 10

Departamento de Biotecnologa

Escuela de Industria Alimentaria y Biotecnologa

Anlisis Bioinformtico De Familia de


Protenas E2F
Identificacin de posibles motivos y filogenia
Fabin Gonzlez

Fecha: 12 de Mayo De 2017

RESUMEN

Se realizaron distintos anlisis bioinformticos a la familia de protenas E2F, principalmente


se estudi de manera general la filogenia de estas y posibles motivos principales dentro de
las secuencias, esto se realiz en secuencias ortlogas y parlogas, donde para las
primeras se estudi la relacin de la protena E2F1 para H. sapiens; M. musculus; G. gallus,
M. mulatta Y R. norvegicus, en cambio para las secuencias parlogas se examinaron las
protenas E2F1, E2F2, E2F3, E2F4, E2F5 y E2F6 de H. sapiens.

Los objetivos principales fueron la identificacin de posibles motivos y la creacin de rboles


filogenticos para las secuencias parlogas y ortlogas.

Palabras Claves: Anlisis bioinformtico; Motivos de protenas; Secuencias ortlogas y


parlogas; Familia E2F.
1 Introduccin

El proceso por el cual un gen da lugar a una protena se llama expresin gnica y el primer
paso de ella es la fase denominada transcripcin, es en ella cuando se produce una copia
de ARNm de una cadena de ADN (Lewin, 2008). Dicha etapa est regulada a dos niveles, el
primero por la estructura y las modificaciones en las histonas presentes en la cromatina y en
segundo lugar por los factores de transcripcin y sus co-factores y las polimerasas de ADN.

La familia de factores de transcripcin E2F, nombradas as por la capacidad de estas de


unirse al promotor del gen E2 de adenovirus es un grupo importante de protenas que se ha
conservado durante la evolucin en invertebrados, peces, aves y mamferos, donde la
contribucin de esta familia es vital en la regularizacin transcripcional de un grupo de
genes responsables del control del ciclo celular (Dvalos y Recillas, 2011).

Los miembros de esta familia de transcripcin son efectoras corriente abajo de la va de la


protena del retinoblastoma (Rb), esta ltima juega un papel fundamental en la regulacin
del ciclo celular eucarionte mediante la interaccin con los miembros de la familia de E2F,
por lo tanto se deben analizar de manera conjunta, por otra parte histricamente se ha
pensado que juegan un rol imprescindible en el control de la divisin celular, sin embargo
esta visin se ha expandido ya que actualmente se le atribuyen a los distintos factores E2F
roles opuestos en diferentes contextos, por ejemplo pueden funcionar tanto como activador
como represor de la transcripcin, pueden actuar en la proliferacin y diferenciacin
celular, en la supresin de tumores, en la oncognesis (Dimova & Dyson, 2005). Adems de
regular la expresin de genes necesarios para la transicin de la fase G1 a la fase S del
ciclo celular tambin son capaces de regular otros genes relacionados en el control del
ciclo.

Las protenas E2F estn codificadas por ocho genes que dan lugar a nueve protenas
distintas, donde E2F3 es el nico que codifica para dos protenas y esto lo hace mediante el

Bioinformtica 1|P a g e
uso de promotores alternativos (Dvalos & Recillas , 2011). Todas las protenas E2F
muestran un grado alto de identidad en su dominio de unin al ADN, por otra parte las
protenas E2F estn conservadas en la mayora de los linajes eucariontes, incluyendo
animales y plantas (Cao et al, 2010)

Fig.1. Esquema de la familia de protenas E2F. Se muestran los diferentes dominios que se encuentran en cada
una de las protenas, as como su tamao. NLS: Seal de localizacin nuclear. PP: Protenas Pocket. DP:
Protenas compaeras de dimerizacin.

Un alineamiento de secuencias en el rea de la bioinformtica es una forma de representar


y posteriormente comparar dos o ms secuencias de ADN, ARN o secuencias de protenas,
de este modo al compararlas se pueden observar reas de similitud, las que podran indicar
relaciones funcionales o evolutivas entre las secuencias en estudio.

Si dos secuencias en un alineamiento proceden de un ancestro comn, las no coincidencias


pueden interpretarse como mutaciones puntuales (sustituciones), y los huecos como
mutaciones de insercin o delecin. En el alineamiento de secuencias proteicas, el grado de
similitud entre los aminocidos que ocupan una posicin concreta en la secuencia puede
interpretarse como una medida aproximada de conservacin en una regin particular, o
secuencia motivo, entre linajes. La ausencia de sustituciones, o la sustitucin de
aminocidos cuya cadena lateral tiene propiedades qumicas similares en una regin
particular de la secuencia (lo que se denomina como sustituciones muy conservadas) podra
indicar que esta zona tiene importancia estructural o funcional.

Los objetivos principales fueron la bsqueda de posibles motivos en las secuencias


proteicas y a partir de herramientas bioinformticas la creacin de rboles filogenticos con
la respectivas interpretaciones de estos.

2 Materiales y Mtodos*

Identificacin de la secuencia de la protena

P a g e |2
Para consultar las protenas E2F se realiz la bsqueda en la base de datos Uniprot; Sitio
WEB: http://www.uniprot.org. Para el posterior anlisis de secuencias ortlogas se
seleccionaron las protenas E2F1 de Homo sapiens, Mus musculus, Gallus gallus, Macaca
mulatta Y Rattus norvegicus, donde para esta ltima especie se analiz E2F1 y una
isoforma de esta. Para el anlisis de secuencias parlogas se seleccionaron las protenas
factores de transcripcin E2F1, E2F2, E2F3, E2F4, E2F5 y E2F6, donde todas las
protenas mencionadas provenan de Homo sapiens.

Alineamiento de secuencias y rbol filogentico

Se procedi a alinear las distintas secuencias ortlogas y posteriormente las secuencias


parlogas en la base de datos Clustal Omega Sitio WEB:
http://www.ebi.ac.uk/Tools/msa/clustalo/, ambas fueron procesadas con el software
clustalo; versin 1.2.4 con los parmetros por defecto y con los resultados del
alineamiento en formato Newick se procesaron los datos en visualizador de rboles
filogenticos Sitio WEB http://www.trex.uqam.ca.

Para los diseos de los rboles filogenticos se utiliz la secuencia de la protena ubiquitina
de Saccharomyces cerevisiae con los parmetros predeterminados a fin de enraizar el
rbol.

Anlisis de regiones conservadas

Para analizar las regiones conservadas de E2F1 entre los distintos linajes, se utiliz
software Prot Param Sitio WEB: http://web.expasy.org/cgi-bin/protparam/protparam. Se
analizaron de manera general algunas propiedades fisicoqumicas tales como punto
isoelctrico de la regin, cantidad de aminocidos cargados e ndice de inestabilidad.

Para cotejar lo inferido con respecto a las secuencias conservadas se utiliz la base de
datos BLAST (Basic Local Alignment Search Tool) Sitio WEB:
https://blast.ncbi.nlm.nih.gov/Blast.cgi , con las opciones predeterminadas para el anlisis
de protenas, con este anlisis se logr compulsar la secuencia de E2F1 de H. sapiens con
la base de datos, de esta manera se conjetur la funcin de las secuencias conservadas.
(Datos no incluidos)

3 Resultados

Alineamiento de secuencias ortlogas.


Gallus MA----TAGG--AAGLAALLGGASP------HLLIVSA-------------SEEPAGGCR
Human MALAGAPAGGPCAPALEALLGAGALRLLDSSQIVIISAAQDASAPPAPTGPAAPAAGPC-
Macaca MALAGAPAGGPCAPALEALLGAGALRLLDSSQIVIISAAQDASAPPAPTGPAAPAAGPC-
Mus --MAVAPAGGQHAPALEALLGAGALRLLDSSQIVIISTAPDVGAPQLP---AAPPTGPR-
isoforma --MAVAPAGGQHAPALEALLGAGALRLLDSSQIVIISTAPDVGAPQLP---AAPPTGPR-
Rattus --MAVAPAGGQHAPALEALLGAGALRLLDSSQIVIISTAPDVGAPQVPTGPAAPPAGPR-
*** * .* ****..: :::*:*: : :*

Gallus PDADLLLFATPQPSRPGPAPRRPALGRPPVKRKLNLETDHQYIAESLPAARGRARIPGRG
Human -DPDLLLFATPQAPRPTPSAPRPALGRPPVKRRLDLETDHQYLAESSGPARGRGRHPGKG
Macaca -DPDLLLFATPQAPRPTPSAPRPALGRPPVKRRLDLETDHQYLAESSGPARGRGRHPGKG
Mus -DSDVLLFATPQAPRPAPSAPRPALGRPPVKRRLDLETDHQYLAGSSGPFRGRGRHPGKG
isoforma -DSDVLLFATPQAPRPAPSAPRPALGRPPVKRRLDLETDHQYLAGSSGPFRGRGRHPGKG
Rattus -DPDVLLFATPQAPRPAPSAPRPALGRPPVKRRLDLETDHQYLAGSSGPFRGRGRHPGKG
* *:******* ** *: ***********:*:*******:* * ***.* **:*

Bioinformtica 3|P age


Gallus AKSPGEKSRYETSLNLTTKRFLELLSQSPDGVVDLNWAAEVLKVQKRRIYDITNVLEGIQ
Human VKSPGEKSRYETSLNLTTKRFLELLSHSADGVVDLNWAAEVLKVQKRRIYDITNVLEGIQ
Macaca VKSPGEKSRYETSLNLTTKRFLELLSRSADGVVDLNWAAEVLKVQKRRIYDITNVLEGIQ
Mus VKSPGEKSRYETSLNLTTKRFLELLSRSADGVVDLNWAAEVLKVQKRRIYDITNVLEGIQ
isoforma VKSPGEKSRYETSLNLTTKRFLELLSRSADGVVDLNWAAEVLKVQKRRIYDITNVLEGIQ
Rattus VKSPGEKSRYETSLNLTTKRFLELLSHSADGVVDLNWAAEVLKVQKRRIYDITNVLEGIQ
.*************************:* *******************************

Gallus LITKKSKNNIQWLGSQVAAGASSRQRLLEKELRDLQAAERQLDDLIQTCTVRLRLLTEDP
Human LIAKKSKNHIQWLGSHTTVGVGGRLEGLTQDLRQLQESEQQLDHLMNICTTQLRLLSEDT
Macaca LIAKKSKNHIQWLGSHTTVGVSGRLEGLTEDLRQLQESEQQLDHLMNICTTQLRLLSEDT
Mus LIAKKSKNHIQWLGSHTMVGIGKRLEGLTQDLQQLQESEQQLDHLMHICTTQLQLLSEDS
isoforma LIAKKSKNHIQWLGSHTMVGIGKRLEGLTQDLQQLQESEQQLDHLMHICTTQLQLLSEDS
Rattus LIAKKSKNHIQWLGSRTMVGIGQRLEGLTQDLQQLQESEQQLDHLMHICTTQLQLLSEDS
**:*****:******:. .* . * . * ::*::** :*:***.*:: **.:*:**:**

Gallus SNQHAAYVTCQDLRSIVDPSEQMVMVIKAPPETQLQVSDPGEAFQVSVRSTQGPIDVFLC
Human DSQRLAYVTCQDLRSIADPAEQMVMVIKAPPETQLQAVDSSENFQISLKSKQGPIDVFLC
Macaca DSQRLAYVTCQDLRSIADPAEQMVMVIKAPPETQLQAVDSSETFQISLKSKQGPIDVFLC
Mus DTQRLAYVTCQDLRSIADPAEQMVIVIKAPPETQLQAVDSSETFQISLKSKQGPIDVFLC
isoforma DTQRLAYVTCQDLRSIADPAEQMVIVIKAPPETQLQAVDSSETFQISLKSKQGPIDVFLC
Rattus DIQRLAYVTCQDLRSIADPAEQMVIVIKAPPETQLQAVDSAETFQISLKSKQGPIDVFLC
. *: ***********.**:****:***********. * .* **:*::*.*********

Gallus PEDSSGVCSPVKSPFKAPAEELS-----------PGSSQQRASPLLHSAQDVNMLLPEAL
Human PEETV-GISPGKTPSQEVTSEEENRATDSATIVSPPPSSPPSSLTTDPSQSLLSLEQEPL
Macaca PEETVGGISPGKTPSQEATSEEENRATDSATIVSPPPSSPPSSLTTDPSQSLLSLEQEPL
Mus PEESADGISPGKTSCQETSSGEDRTAD--SGPAGPPPSPPSTSPALDPSQSLLGLEQEAV
isoforma PEESADGISPGKTSCQETSSGEDRTAD--SGPAGPPPSPPSTSPALDPSQSLLGLEQEAV
Rattus PEESAEGISPGRTSYQET-SGEDRNAD--SGTAGPPPSPPSTSPTLDPSQSLLGLEQEAV
**:: ** :: : . . * * :* . :*.: * * :

Gallus LPGTALPTKCPTEDVSLSPLASMDTLLEHGKDDFPGFLADEFIALSPPQ-PQDYHFGLEE
Human LSR-MGSLRAPVDEDRLSPLVAADSLLEHVREDFSGLLPEEFISLSPPHEALDYHFGLEE
Macaca LSR-MGSLRAPVDEDRLSPLVAADSLLEHVREDFSGLLPEEFISLSPPHEALDYHFGLEE
Mus LPR-MGHLRVPMEEDQLSPLVAADSLLEHVKEDFSGLLPGEFISLSPPHEALDYHFGLEE
isoforma LPR-MGHLRVPMEEDQLSPLVAADSLLEHVKEDFSGLLPGEFISLSPPHEALDYHFGLEE
Rattus LPR-IGNLRAPMEEDRLSPLVAADSLLEHVKEDFSGLLPGEFISLSPPHEAVDYHFGLEE
* : * :: ****.: *:**** ::** *:* ***:****: ********

Gallus GEGISELFDCDFGDFTHLDF
Human GEGIRDLFDCDFGDLTPLDF
Macaca GEGIRDLFDCDFGDLTPLDF
Mus GEGIRDLFDCDFGDLTPLDF
isoforma GEGIRDLFDCDFGDLTPLDF
Rattus GEGIRDLFDCDFGDLTPLDF
**** :********:* ***

Fig.2. Alineamiento de secuencias ortlogas de de H.sapiens; M.musculus; G.gallus,


M.mulatta Y R.norvegicus, donde para esta ltima especie se analiz E2F1 y una isoforma
de esta.

(*): Representa un aminocido conservado entre las secuencias analizadas; (:): Representa
una sustitucin de aminocido por otro con caractersticas fisicoqumicas similares o
conservativas; (.): Representa una sustitucin de un aminocido por otro de manera menos
conservativa en comparacin

Las regiones en color amarillo y verde indican secuencias parcialmente conservadas entre
los linajes y las regiones en color azul sugieren secuencias altamente conservadas entre los
distintos organismos.

P a g e |4
Fig.3. Arbol filogentico de secuencias ortologas de la protena E2F1 de H. sapiens; M.
musculus; G. gallus, M. mulatta Y R. norvegicus, donde para esta ltima especie se analiz
E2F1 y una isoforma de esta.

Los nmeros en parntesis corresponden a distintos nodos.

Alineamiento de secuencias parlogas


E2F4 ------------------------------------------------------------
E2F5 ------------------------------------------------------------
E2F1 ------------MALAGAPAGG-------------------PCAPAL-EALLGAGAL-RL
E2F6 ------------------------------------------------------------
E2F3 MRKGIQPALEQYLVTAGGGEGAAVVAAAAAASMDKRALLASPGFAAAAAAAAAPGAYIQI
E2F2 -------------------------------------MLQGPRALAS-----AAGQTPKV

E2F4 ------------------------------------------------------------
E2F5 --------------------------------------------MAA-------------
E2F1 LDS---SQIV--IISAAQDASAPPAPTGPAAPAA--GPCDPDLLLFATPQAPRPTP----
E2F6 ------------------------------MSQQRPARKLPSLLLDPTEE-----TVRRR
E2F3 LTTNTSTTSCSSSL------QSGAVAAGPLLPSAPGAEQTAGSLLYTTPHGPSSRAGLLQ
E2F2 VPAMSPTELWPSGLSSPQLCPATATYYTPLYPQTAPPAAAPGTCLDATPHGPEGQVVR--

E2F4 -----------------------------------------MAEAGPQAPPP------PG
E2F5 ------AEPASSGQQAPA-------GQGQ----GQRPPPQPPQAQAPQPPPPPQLGGAGG
E2F1 ------SAPRPALGRPPVKRRLDLETDHQ-YLAESSGPARGRGR------HPGKGVKSPG
E2F6 -----CRDPINVEGLLPSKIRINLEDNVQ-YVS--------------------MRKALKV

Bioinformtica 5|P age


E2F3 QPPALGRGGSGGGGGPPAKRRLELGESGHQYLSDGLKTPKGKGRAALRSPDSPKTPKSPS
E2F2 ---------CLPAGRLPAKRKLDLEGIGRPVVP-EFPTPKGKCI-RVDGLPSPKTPKSPG

E2F4 TPSRHEKSLGLLTTKFVSLLQEAKDGVLDLKLAADTLAVRQKRRIYDITNVLEGIGLIEK
E2F5 GSSRHEKSLGLLTTKFVSLLQEAKDGVLDLKAAADTLAVRQKRRIYDITNVLEGIDLIEK
E2F1 EKSRYETSLNLTTKRFLELLSHSADGVVDLNWAAEVLKV-QKRRIYDITNVLEGIQLIAK
E2F6 KRPRFDVSLVYLTRKFMDLVRSAPGGILDLNKVATKLGV-RKRRVYDITNVLDGIDLVEK
E2F3 EKTRYDTSLGLLTKKFIQLLSQSPDGVLDLNKAAEVLKV-QKRRIYDITNVLEGIHLIKK
E2F2 EKTRYDTSLGLLTKKFIYLLSESEDGVLDLNWAAEVLDV-QKRRIYDITNVLEGIQLIRK
*.: ** * :*: *: : .*::**: .* * * :***:*******:** *: *

E2F4 KSKNSIQWKGVGPGCNTREIADKLIELKAEIEELQQREQELDQHKVWVQQSIRNVTEDVQ
E2F5 KSKNSIQWKGVGAGCNTKEVIDRLRYLKAEIEDLELKERELDQQKLWLQQSIKNVMDDSI
E2F1 KSKNHIQWLGSHTT---VGVGGRLEGLTQDLRQLQESEQQLDHLMNICTTQLRLLSEDTD
E2F6 KSKNHIRWIGSDLSN-FGAVP-QQKKLQEELSDLSAMEDALDELIKDCAQQLFELTDDKE
E2F3 KSKNNVQWMGCSLSE-DGGMLAQCQGLSKEVTELSQEEKKLDELIQSCTLDLKLLTEDSE
E2F2 KAKNNIQWVGRGMFE-DPTRPGKQQQLGQELKELMNTEQALDQLIQSCSLSFKHLTEDKA
*:** ::* * : * :: :* * **. .: : :*

E2F4 NSCLAYVTHEDICR--CFAGDTLLAIRAPSGTSLEVPIPE-GLNGQKKYQIHLKSVSGPI
E2F5 NNRFSYVTHEDICN--CFNGDTLLAIQAPSGTQLEVPIPEMGQNGQKKYQINLKSHSGPI
E2F1 SQRLAYVTCQDLRSIADPAEQMVMVIKAPPETQLQAVDSS-----E-NFQISLKSKQGPI
E2F6 NERLAYVTYQDIHSIQAFHEQIVIAVKAPAETRLDVPAPR-----EDSITVHIRSTNGPI
E2F3 NQRLAYVTYQDIRKISGLKDQTVIVVKAPPETRLEVPDSI-----E-SLQIHLASTQGPI
E2F2 NKRLAYVTYQDIRAVGNFKEQTVIAVKAPPQTRLEVPDRT-----EDNLQIYLKSTQGPI
.. ::*** :*: : ::.::** * *:. : . : : * .***

E2F4 EVLLVNKEAWSSPPVAVPVPPPEDLLQSPSAVSTPPPLPKPALAQSQEASRPNSPQLT--
E2F5 HVLLINKESSSSKPVVFPVPPPDDLTQPSSQSLTPVTPQKSSMATQ--------------
E2F1 DVFLCPEETVGGISP------GKTPSQEVTS--------------EEENRATDSATIVSP
E2F6 DVYLCEVEQGQTSNK------RSEGVGTSSSEST-----HPEGPEEEENP-QQSEELLEV
E2F3 EVYLCPEETETHSPM------KTNN-QDHNGNIP-----KPASKDLA--S-TNS-G---H
E2F2 EVYLCPEEVQEPDSP------SEEPLPSTSTLCP-----SPDSAQPS--S-STDPSIMEP
.* * * .

E2F4 -PTAVPGSAEVQGMAGPAAEITVSGGPGTDSKDSGELSSLPLGPTTLDTRPLQSSALLDS
E2F5 ---N-----------------------------------LPEQHVSERSQALQQTSA---
E2F1 PPSSPP----SSLTTDP----------------SQSL-------LSLEQEPL-----LSR
E2F6 SN----------------------------------------------------------
E2F3 SDCS----------------------------------------VS--------------
E2F2 TASSVPAPAPTPQQAPP----------------PPSL-------VPL-------------

E2F4 SSSSSSSSSSSSNSNSSSSSGPNPSTSFEPIKADPTGVLELPKELSEIFDPTRECMSSEL
E2F5 -----------------------------------------------TDISSAGSISGDI
E2F1 MG-----------------------SLRAPVDEDRLSPLVAADSLL---EHVREDFSG--
E2F6 ------------------------------------------------------------
E2F3 --------------------------------MGNLSPLASPANLL---QQTEDQIPS--
E2F2 --------------------------------EATDSLLELPHPLL---QQTEDQFLSP-

E2F4 LEELMSSEVFAPLLRLSPPPGDHDYIYNLDESEGVCDLFDVPVLNL----------
E2F5 IDELMSSDVF-PLLRLSPTPA-DDYNFNLDDNEGVCDLFDVQILNY----------
E2F1 -------LLPEEFISLSPPHEALDYHFGLEEGEGIRDLFDCD-FGDLTPLD-F---
E2F6 --------------------------------------------------------
E2F3 -------NLEGPFVNLLPPLLQEDYLLSLGEEEGISDLFDAYDLEKLPLVEDFMCS
E2F2 -----TLACSSPLISFSPSLDQDDYLWGLEAGEGISDLFDSYDLGDLLIN------

P a g e |6
Fig.4. Alineamiento de secuencias de protenas E2F1, E2F2, E2F3, E2F4, E2F5 y E2F6 de
H.sapiens.

(*): Representa un aminocido conservado entre las secuencias analizadas; (:): Representa
una sustitucin de aminocido por otro con caractersticas fisicoqumicas similares o
conservativas; (.): Representa una sustitucin de un aminocido por otro de manera menos
conservativa en comparacin

Fig.5. rbol filogentico de secuencias parlogas de protenas E2F de H.sapiens. Se ilustran las
secuencias de E2F1, E2F2, E2F3, E2F4, E2F5 y E2F6.

Los nmeros en parntesis corresponden a distintos nodos

4 Discusin

Anlisis de secuencias ortlogas

Se observ en el alineamiento que existen tres regiones conservadas, una regin altamente
conservada (De color azul en figura 2) y otras dos parcialmente conservadas (Color verde y
amarillo respectivamente en figura 2). La secuencia con mayores identidades est
compuesta por setenta y cinco aminocidos, de los cuales ocho estn cargados
negativamente (Asp y Glu) y doce lo estn de manera positiva (Arg y Lys). La secuencia
conservada tiene un punto isoelctrico terico de 9.6 y un ndice de estabilidad de 44.7, lo
que clasifica a esta regin como inestable1

Bioinformtica 7|P age


Se puede inferir que la secuencia altamente conservada podra tener una funcin
indispensable (estructural y/o funcional) y basado en lo descrito por Dvalos y Recillas,
2011 se podria deducir que esta area conservada corresponderia al sitio de union a ADN,
por lo tanto se puede decir que todas las proteinas muestran un alto grado de identidad en
el dominio de union ADN.

El rea de color verde correspondera a una secuencia parcialmente conservada en


comparacin al rea altamente conservada, est compuesta por veintitrs aminocidos, de
los cuales, dos estn cargados negativamente (Asp y Glu) y cinco lo estn de manera
positiva (Arg y Lys). La secuencia descrita tiene un punto isoelctrico terico de 10.27 y un
ndice de estabilidad de 57.3, lo que clasifica a esta regin como inestable1.

Se puede inferir que la secuencia parcialmente conservada podra tener una funcin
esencial y basado en lo descrito por Dvalos y Recillas, 2011 se podria deducir que esta
area conservada corresponderia al sitio de union de ciclina A/ cdk 2.

El rea de color amarillo en la secuencia corresponde a otro sitio parcialmente conservado,


est compuesto por treinta y un aminocidos de los cuales, cuatro estn cargados
negativamente (Asp y Glu) y dos lo estn de manera positiva (Arg y Lys). La secuencia
descrita tiene un punto isoelctrico terico de 4.7 y un ndice de estabilidad de 65.4 lo que
clasifica a esta regin como inestable1.

Se puede inferir que la secuencia parcialmente conservada podra tener una funcin
esencial y basado en lo descrito por Dvalos y Recillas, 2011 se podria deducir que esta
area conservada corresponderia al sitio de union de alguna de las proteinas de la familia
pocket dentro de las cuales estan las proteinas de retinoblastoma y esto queda
demostrado segn el analisis en base de datos BLAST

Anlisis de rbol filogentico de secuencias ortlogas

En la figura nmero 3 se ilustran las relaciones filogenticas de la protena E2F1 de distintas


especies. Se puede observar que la protena E2F1 de M. musculus y su isoforma son
cercanas en el rbol y provienen de nodo (1), esto tiene consistencia con lo sabido
previamente a travs de la secuencia, y a su vez estas dos secuencias tienen un nodo en
comn con R. Norvegicus, esto se podra explicar ya que ambas especies pertenecen al
orden Rodentia.

En la rama que comienza en (3), se encuentra las protenas que corresponden a los de las
especies que pertenecen al orden de los primates; M.mulatta y H. sapiens.

Se puede deducir que en nodo (2) existe una protena antepasado en comn de las
protenas de M. musculus, R. norvegicus, H. sapiens y M. mulatta

En la rama del nodo (4) se encuentra la protena E2F1 perteneciente a G. gallus,


organismo de la clase de las Aves. Se puede observar que filogenticamente est aislada
de las otras protenas previamente nombradas y se puede inferir que en nodo (5) se
encuentra la protena ancestro de todas las anteriores.

Anlisis de secuencias parlogas

P a g e |8
A diferencia del anlisis del anlisis en las secuencias ortlogas, en las parlogas no fue
posible observar reas con identidad en las distintas protenas, solo se observan
identidades puntuales. Esto se pudo haber debido a que el alineamiento no se realiz de
manera correcta, una posible razn para ello quizs fue la variabilidad en la cantidad de
aminocidos de las distintas secuencias, para ejemplificar esto se puede nombrar a E2F3,
protena que tiene como longitud 465 residuos, en cambio E2F6 solo tiene 281 residuos de
aminocidos, lo anterior podra haber llevado a la no alineacin.

Para complementar lo anterior y basado en lo descrito por Cao et al. (2010), E2F4 y E2F5
comparten mayor similitud con la secuencia ancestral de E2F que con E2F1, E2F2 y E2F3,
entonces se puede deducir que existen disimilitudes de secuencias entre los distintos
miembros de la familia proteica de E2F, lo que tambin podra haber llevado a la no
alineacin.

Anlisis de rbol filogentico de secuencias parlogas

En la figura nmero 5 se ilustran las relaciones filogenticas de las distintas protenas de la


familia E2F (E2F1, E2F2, E2F3, E2F4, E2F5 y E2F6). Se puede observar que las protenas
E2F4 y E2F5 estn emparejadas por una protena ancestro en nodo (4) y esto reafirma por
lo anterior dicho por Cao et al (2010).

A partir del nodo (3) nace la protena E2F6 y el nodo (2), y es de este ltimo de donde
proviene la protena E2F1 y el nodo (1), y de este ltimo proviene E2F2 y E2F3.

Se puede anlogar el anlisis del rbol filogentico ortlogo al parlogo infiriendo que en el
nodo (5) se encuentra la protena ancestro comn

Bioinformtica 9|P age


5 Conclusiones

A partir de las distintas bases de datos y con el uso de programas de bioinformtica se logr
encontrar los principales motivos dentro de las protenas de la familia E2F y a su vez se
logr la creacin de rboles filogenticos tanto para secuencias parlogas como para
ortlogas. Esto servira como una constatacin de lo afirmado por la bibliografa, ya que los
resultados se cotejaron con los artculos citados, obteniendo resultados similares.

Como principal motivo de secuencia en ortlogas se puede nombrar el sitio de unin de


ADN, el que fue fcilmente cotejado, en cambio en las secuencias parlogas existi
dificultad para comparar y analizar los patrones en las identidades. Se propone analizar con
mayor detalle donde se encuentran los patrones en ellas, para ello ser necesario un
exhaustivo trabajo de anlisis de las secuencias para luego comparar con bibliografa.

6 Trabajos citados

Cao , L., Peng, B., Yao, L., Zhang, X., Sun , K., Yang, X., & Yu, L. (2010). The ancient function of RB-E2F
Pathway: insights from its evolutionary history. Biology Direct, 5(55), 1.

Dvalos, M., & Recillas , F. (2011). La via RB/E2F y la familia de proteinas represoras Polycomb en el
desarrollo de cncer. TIP. Revista especializada en ciencias quimico- biolgicas, 15(1), 38-50.

Dimova, D., & Dyson, N. (Mayo de 2005). The E2F transcripcional network: old acquiaintances with ne faces.
Oncogene(24), 2810.

Lewin, B. (2008). Genes IX (Novena ed.). (C. Heras, Ed.) Ciudad de Mexico, D.F, Mexico: McGraw Hill.

Van den Heuvel, S., & Dyson, N. (Septiembre de 2008). Conserves functions of the pRB and E2F families.
Nature Reviews, 9(9), 713-722.

1
Se refiere a esta regin en particular y no a la protena total

P a g e | 10