Está en la página 1de 50

TEMA 8 FUNCIN CARDIACA

ANATOMIA Y FISIOLOGA
ANATOMIA
La vena cava es la que llega del hgado. Va a la aurcula derecha la sangre,
despus al ventrculo y de ah a los pulmones. Este circuito se denomina circulacin menor. De los pulmones llega la sangre oxigenada a la aurcula izquierda, para al ventrculo izquierdo y llega a la aorta, desde donde se va a
distribuir la sangre por todo el cuerpo. A esta circuito se le denomina circulacin mayor.
La funcin caracterstica del corazn es movilizar la sangre.. Su actividad es la
contraccin.

CIRCULACIN CORONARIA
La circulacin coronaria hace referencia a los vasos que irrigan al propio corazn. La aorta presenta arterias coronarias derecha e izquierda, que irrigan
sangre para que el corazn se abastezca de oxgeno. Las arterias coronarias
se ramifican a capilares. La circulacin por el corazn es complicada por varias razones:
- Hay poca anastomosis, es decir, pocas ramificaciones. Ello hace que
la sangre no pueda llegar por muchos caminos.
- Slamente cuando el corazn se relaja (distoles) puede entrar la
sangre. En stole (contrado) no entra la sangre.
- Las cavidades, las aurculas y los ventrculos, estn rodeados de clulas musculares. Las clulas que estn
justo al borde de la cavidad reciben la sangre desde fuera, por lo que los vasos tienen que atravesar toda la capa de
msculo para transportar el oxgeno hasta all. Si se da un taponamiento va a haber una zona del corazn que se va a
quedar sin oxgeno--> infarto. Dependiendo de a qu altura se d el tapn habr una mayor o menor regin de tejido
afectada.
1

FISIOPATOLOGA
Existen dos mecanismos por los que puede disminuir el riego cardaco:
-

Disminucin de flujo por aterosclerosis coronaria o espasmos


Aumento de necesidades: ejercicio, emociones, valvulopatas (aumentan la presin arterial)

PATOLOGA
ARRITMIAS
Es el hecho de que el corazn no se contraiga correctamente y, por tanto, no bombee bien la sangre. Falla la sincronizacin. No nos interesan mucho, porque no tiene nada de bioqumica.

VALVULOPATAS
El flujo de la sangre es unidireccional. Para que esto ocurra necesitamos vlvulas en el corazn, que se cierran cuando el corazn se contrae. Tampoco nos interesan.

MALFORMACIONES CONGNITAS
INSUFICIENCIA CARDIACA
El corazn no funciona bien y no bombea.

INSUFICIENCIA CORONARIA O SNDROME CORONARIO AGUDO


La sangre de las arterias coronarias no es suficiente para irrigar al corazn. Por tanto, el corazn sufre isquemia y
pueden provocar daos severos al miocardio. Esto conduce al sndrome coronario agudo, que se diferencia en tres
tipos:
-

Angina: Se produce una desproporcin entre el aporte sanguneo que recibe y el que necesita, pero se resuelve sin llegar a muerte celular. Se caracteriza por episodios pasajeros de dolor. Produce un ECG (Electrocardiograma) anormal. Esto puede suceder por el esfuerzo (ejercicio, emociones, digestiones).
Infarto: La insuficiencia es intensa, persistente y circunscrita a una necrosis isqumica de una zona del miocardio. Con la necrosis tisular se produce la liberacin a la circulacin sistmica de enzimas celulares.
Muerte sbita

DIAGNSTICO DEL INFARTO AGUDO DE MIOCARDIO


El diagnstico precoz del IAM es importante, porque cuanto antes comience el tratamiento, mejor es el pronstico.
Por ello cuando llega alguien con dolor torcico hay que actuar muy rpidamente. Las muestras van al laboratorio de
urgencias, da igual la hora que sea.

HISTORIA CLNICA
Depende de la extensin y duracin de la isquemia. Con esto sntomas es con los que llega al hospital, no tienen por
qu darse todos.
-

Dolor precordial
o Inicio gradual, duracin > 30 minutos
o Irradiado a hombro, brazo y cuello
o No se calma con reposo ni vasodilatadores
o Motivo frecuente de consulta en urgencias
o Aproximadamente el 10% diagnosticados de IAM
Confusin aguda
Debilidad fsica
Sncope (perdida brusca de consciencia y tono corporal)
Ansiedad, inquietud, sudoracin
Taquicardia o bradicardia
2

Normalmente duele el brazo tambin porque las neuronas que captan el dolor del corazn se excitan muchsimo. Las
de los brazos estn muy cerca por lo que lo normal es que se exciten tambin y manden seal de dolor. La confusin
aguda se debe a la falta de riego en el cerebro.

PRUEBAS COMPLEMENTARIAS
-

ECG:
o Puede no aparecer cambios hasta transcurridas 24 h
o Slo es diagnstico en el 40% de los casos
Imagen: Rx, ECO
Cateterismo
o Diagnstico
o Teraputico

El anlisis bioqumico es el ms importante, porque lo que ms rpido se alteran son los marcadores de infarto de
miocardio, que luego veremos, antes de poder ver algo en un ECG o con Rx, por ejemplo.

MARCADORES BIOQUMICOS
-

Troponina
CK-MB
Otros:
o Leucocitosis
o VSG

DIAGNSTICO BIOQUMICO DE LA CARDIOMIOPATA


IMPORTANCIA DEL LABORATORIO
LAS PRUEBAS DE DIAGNSTICO PERMITEN
-

Colaborar en el diagnstico
Fechar el infarto
Evidenciar el xito del tratamiento
Realizar el pronstico

MECANISMO BIOQUMICO
Al producirse rotura celular, salen a la circulacin constituyentes de la clula:
-

K+:

o Al principio, cuando el proceso an es reversible


o Durante las primeras 6 horas y despus se normaliza
o Muy poco especfico
Lactato: Posteriormente, sustancias intermedias del metabolismo celular.
Enzimas: Alto PM. Dao irreversible, con alteracin del metabolismo celular.

Hay marcadores ms especficos y otros menos, pero ayudan tambin en el diagnstico.

PARA LA OMS
Para que se diagnostique un IAM se necesitan cumplir 2 de 3 requisitos:
-

Dao precordial de ms de 20 min


Cambios en ECG
Elevacin de CK y CK-2

MARCADORES
CREATINQUINASA (CK)
Es el enzima que permite producir ATP a partir de creatina-P:

+ +

Esto le permite al msculo obtener energa rpidamente. Su mayor actividad se encuentra en el msculo esqueltico
y, por tanto, tambin en el miocardio. Mediante la unin de 2 subunidades pueden formarse 3 isoenzimas, cada una
co localizaciones tisulares diferentes:
Subunidades: M (musculo)

B (cerebro)

CK-MM
CK-MB
CK-BB
(m. esqueletico) (miocardio, diafragma, bazo, prostata) (Cerebro)
Para detectar el IAM miramos a ver si en sangre la creatinquinasa del corazn (CK-MB) se encuentra elevada. Si la CK
total est elevada pero concretamente la del miocardio no, puede que la fuente sea otra, por ejemplo una rotura del
msculo esqueltico.
Isoenzimas:

ELEVACIN DE CK-MB
>6% CK-total:
-

IAM
Empieza a elevarse a las 4-6 h con mximo a las 16-24
Permanece hasta 48-72 h
Baja especificidad
Tiene baja sensibilidad si el infarto es pequeo o precoz,pero permite detectar reinfartos.

Para medir este marcador es importante usar suero, y no plasma ya que la actividad se ve bastante reducida. No hay
que usar tubos hemolizados.
<6% CK-total:
-

Politraumatismos
Quemadras
Enfermedades musculares inflamatorias
Hipo/hipertermia

Advertencias: no conviene usar plasma por baja actividad enzimtica, hay que tener cuidado con la luz y la temperatura. Tampoco hay que emplear sueros hemolizados por la liberacin de adenilato quinasa, que interfiere con la
medida de creatina.

TROPONINAS CARDACAS
Es una protena miofibrilar del msculo esqueltico. Est compuesta de 3 pptidos: Troponina-T; Troponina-I y Troponinc-C.
Las formas de troponina I y T son diferentes en el msculo cardaco y esqueltico, por lo que se puede hacer una
determinacin especifica de la T-T y T-I cardacas por inmuno anlisis especficos. Si aparece troponina es que la
clula se ha roto, es decir, es un infarto y no una angina de pecho.
Como marcador bioqumico de I:
-

Es muy sensible, excepto en la fase precoz (<6h), dndonos falsos negativos.


Muy especficas de IAM:
o Especfica de miocardio, aun en presencia de dao de msculo esqueltico
o Slo se elevan con lesiones celulares irreversibles (muerte celular)
o Gran ayuda en la datacin por su amplia ventana diagnstica:
Troponina I: desde 5-6 h hasta 5-10 das
Troponina T: desde 6-12 h hasta 5-15 das
4

Advertencia: su larga permanencia en plasma puede enmascacarar la aparicin de un reinfarto. Por


ello es necesario utilizar conjuntamente un marcador de vida media ms corta: CK-MB

Troponina de alta sensibilidad


-

Lmite de deteccin. Vemos el aumento de la troponina antes que con otra maquinaria.
Permite un diagnstico ms precoz
Pero disminuye la especificidad, ya que se diagnostican sanos como enfermos. Puede haber falsos positivos.

La troponina que se analiza en este caso es la misma solo que la maquinaria es ms sensible.

MIOGLOBINA
Protena presente en msculo cardaco y esqueltico. Es un marcador bioqumico de lesin miocrdica. Su ventaja es
que es muy precoz, aumentando a partir de las 2h de la isquemia (1 a 4 h), y manifestndose el pico a las 6 7 horas.
Se elimina en 24 h. La ventaja, adems, es que es muy sensible; pero es poco especfico por s sola, debido a su amplia distribucin por el msculo esqueltico. Por tanto, tiene un valor predictivo negativo; si no tiene mioglobina en
menos de 24h, no tendr IAM.

LACTADO DESHIDROGENASA (LDH)


Es un marcador histrico, hoy en da en desuso. Se encarga de producir lactato y tiene un rol fundamental en la obtencin de energa. Pueden formarse diferentes isoenzimas mediante la unin 4 a 4 de las cadenas peptdica: M
(muscular) y H (cardiaca). As, tenemos cinco isoformas: LD1 (H4) y LD2 (H3M1) son de miocardio, LD3 (H2M2) es de
pulmn, LD4 (H1M3) es de rin y LD5 (M4) es de msculo, hgado y rin.
En el infarto agudo de miocardio se eleva la LDH, sobretodo la LD1, de modo que LD1/LDT > 0,4 y LD1/LD2 > 1. Se
empieza a elevar a las 12-16h con un mximo de 30-40 h, y se puede mantener elevada entre 8 y 12 das. Tambin se
ve alterada en alteraciones hepticas y cncer.
Cuando se analizaba LDH convena no usar plasma por tener poca actividad enzimtica, y no se podan usar sueros
hemolizados, ya que los hemates contienen LDH.
En resumen, el marcador ms especfico es la troponina, sustituyendo as a la LDH. Aun as se estudian el resto de
marcadores para poder fechar el infarto. Del momento en el que se haya producido va a depender tanto el pronstico del paciente como us tratamiento. Cabe recordar que no se hace la determinacin nicamente cuando llega el
paciente, sino que se le va pinchando cada x tiempo para ver cmo varan los marcadores.

9. ACTIVACIN
El activador (A) es un efector que aumenta la velocidad de una reaccin cataliza por un enzima. Se distinguen dos tipos
de activacin:
1. Activacin esencial: el enzima no funciona si no est el A. En algunos casos el verdadero sustrato es el S unido
al A como en ATP-Mg2+.
2. Activacin no esencial: el enzima va a funcionar aunque no est presente el A, pero la reaccin va a ocurrir a
menor velocidad que si A lo estuviera.

1. ACTIVACIN ESENCIAL
Se van a dar dos casos:
A. Que se forme complejo binario ES, pero que sea catalticamente inactivo y solo sea activo el complejo ternario
EAS.
B. Que no se forme complejo binario ES, por lo que la unin de ligando ser ordenada.

A) CON FORMACIN DE COMPLEJO BINARIO ES


Tanto A como S se van a poder unir al E de
forma reversible, al azar, y de forma dependiente o independiente (en funcin del valor de ).
ES = 0

EAS 0

= [] y [] = [] + [] +
[] + []

[] = [] 1 +
[][]

[] [] [][]
+
+

[]
[]
[][]
[] 1 + + +

[]

1 +

[]

[]

+ [] 1 +

[]

+ [] +

1+

[]

[]

Cuando [] = =
Cuando [] <

[]

[]

[]

[][]

[]

[] +

[]

1+

[]

1+

[]

1+
1
1
1 + 1

=
[] +

[] []

Hay tres subcasos:


A1) = 1 = =
=

1+

[]

[]

[]
[] +

= /
[]

[]

1+
1 1 + 1

=
+
[]
[]
[]

No es necesario hacer control porque a [A]=0 la actividad ser nula ya que A es esencial.
Se puede saber si el efector es A o es I con la doble recproca ya que la [I] crece hacia arriba mientras que la [A] lo
hace hacia abajo.
Para comprobar que es pura/total y que solo hay un complejo productivo se hace la representacin anloga de
Dixon. Se denomina anloga porque se representa en inverso de v frente al inverso de [A]. Si se hace frente a la [A]
se van a obtener curvas siempre, a pesar de que la activacin sea pura o total.
1
1

1
=
1 + +
1 +
[]
[] []

Realizamos las representaciones secundarias:


=

+
[]

1
1

+
[]

A2) < 1 < < ;


[]

[]

1+
1 1 + 1

=
+
[]
[]
[]

Anloga de Dixon:

/
1
1

1
=
1 + +
1 +
[]
[]
[]

Representacin secundaria con b:


2

1
1

+
[]

A3) > 1 > > ;


[]

[]

1+
1 1 + 1

=
+
[] []
[]

Anloga de Dixon:

1
1
=
1 + +
1 +
[]
[]
[]

Representacin secundaria con b:


=

1
1

+
[]

B) SIN FORMACIN DE COMPLEJO BINARIO ES


= [] y [] = [] + [] + []
[] = [] 1 +
[][]

[] [][]
+

[][]

=
[]
[][]
[]
[][]
[] 1 + +
1 + +

=
[]

[]

+ + []

[]

[] + 1 +

[]

= /
Doble recproca:
1

1
1
=
1 +

+
[] []

Anloga de Dixon:


1
= 1 + +

[]
[]

[]

Para calcular K s realizamos la representacin secundaria con m:


=

1
+

[]

2. ACTIVACIN NO ESENCIAL
Es el mecanismo ms empleado para caracterizar un enzima.
La reaccin ocurre haya no A: [A]=0 v0
El S y el A se van a unir al enzima libre al azar, de forma
reversible, y de manera dependiente o independiente
(en funcin del valor de ).
Va a haber dos complejos productivos: ES y EAS; pero el
complejo ternario ser ms activo.
Se pueden dar tres casos:
A) < 1 < < ;

B) > 1 > > ;

> /
4

cir, combinando los espectros modelo se puede obtener un espectro que se ajuste al del problema. la precisin en el
establecimiento de la estructura es de:

0,97 para las -hlices


0,75 para las hojas
0,5 para los giros
0,89 para otros tipos de estructura

LIMITACIONES DEL ANLISIS

Es un mtodo de gran simplificacin, ya que el aparato nos da un espectro de CD en 4 o 5 componentes.


Los espectros referencia corresponden con un 100% de hlices, hojas beta o giros, y no pueden aplicarse
directamente a protenas que contienen secciones cortas de varias estructuras. Por ejemplo, el CD de una
hlice aumenta con su longitud, y las hojas beta son muy sensibles al entorno y a la geometra.
No existe un patrn total en la estructura desordenada, y que faltan patrones para ciertas estructuras.
Espectros en el UV-lejano pueden contener una contribucin de aa aromticos, por lo que en la prctica se
mide a longitudes de onda menores.
La forma de las curvas en el UV-lejano depende de la estructura terciaria y de la secundaria.

ESTUDIO DE PROTENAS DE MEMBRANA


Como ya hemos mencionado, el CD es muy til en el estudio de protenas de membrana, ya que resultan difciles de
cristalizar (precisan el uso de detergentes).
El CD (idealmente) puede realizar espectros de protenas en vesculas lipdicas.

CD DE ALFA-HEMOLISINA
Vemos que en sus tres conformaciones presenta un espectro de CD similar.
Significa esto que no vara la estructura secundaria?Es esto habitual en una
protena de membrana? Vamos a verlo
La -hemolisima forma un poro en lpidos, y est constituida por casi todo hojas
. Recientemente se ha descubierto su estructura de monmero soluble.
Podemos deducir que como su estructura secundaria es casi siempre la misma,
los espectros no varan.

ESTRUCTURA TERCIARIA DE LAS PROTENAS


Los cromforos implicados en el CD son:

La Phe (250-270nm), la Tyr (270-290) y el Trp (280-300).


Los puentes disulfuro dan una banda ancha en la zona.
Residuos aromticos pticamente inactivos per se, pero ubicados en entornos asimtricos, como H
Grupos prostticos (hemo) y metaloprotenas

Si la estructura terciaria est bien definida, obtendremos una buena seal en el UV-cercano.

EJEMPLO: la calbindina es una protena que participa en la regulacin de la apoptosis, y que en teora une calcio. Sin
embargo, se sabe que tambin puede unir Zn, y los CD que obtenemos son diferentes:
9

CONFORMACIN DE CIDOS NUCLEICOS


A pesar de que el dicrosmo circular es una tcnica que se basa en el
estudio de molculas pticamente activas y las bases nitrogenadas
son compuestos simtricos que carecen de esta actividad, la unin de
estas al grupo fosfato y a los azcares por el enlace n-glicosdico
confiere propiedades pticas a los cidos nucleicos. Esta actividad
aumenta cuando adquieren estructura helicoidal.
Los tres tipos de DNA (conformaciones A, B y Z) tienen bandas
positivas y negativas en la misma regin. La conformacin B tiene un
mnimo en 240 nm y un mximo a 280 nm. La gran diferencia con A
es que esta tiene una banda positiva de mayor magnitud. La Z, en
cambio, tiene un mnimo a 240 nm y poca banda positiva.

APLICACIONES
-Verificar correcto apareamiento de las bases. Por ejemplo, una hebra
modificada con su hebra complementaria. Cmo? Estudiando la
formacin de cudruples de guanina. Estos cudruples de guanina hacen referencia a la estructura tridimensional
que adoptan los anillos planares de la guanina. Para determinar si se forman se sigue por incremento de la seal a
260nm y decrecimiento a 240nm.
-Cambios en estructura secundaria debidos a temperatura, agentes desnaturalizantes, clculo de Tm
-Estudiar isomerizaciones conformacionales (helix-coil, B-A, B-Z)

10

TEMA 7. ANLISIS DE UNA SECUENCIA PROTEICA


1. ESTRUCTURA DE LAS PROTENAS:
1.1. ESTRUCTURA PRIMARIA:
La estructura primaria consiste en determinar la secuencia de aminocidos de esa protena y normalmente se
obtiene de la secuencia del gen.

1.2. ESTRUCTURAS SECUNDARIA Y TERCIARIA:


La secuencia primaria ofrece informacin sobre una protena pero no toda, porque la estructura
suele ser responsable de su funcin. Suele adoptar niveles superiores de organizacin como alfa
hlices, estructuras beta, y estructuras al azar que adquieren normalmente una estructura tridimensional. Si la protena pierde su estructura terciaria generalmente pierde su funcin.

1.3. ESTRUCTURA CUATERNARIA:


En muchos casos las protenas como unidad funcional constan de varias cadenas polipeptdicas. En este caso cada subunidad es el conjunto de protena funcional y por separado no son
funcionales. Tienen un nivel superior de organizacin sin el cual se inactivan. La estructura
cuaternaria puede estar formada por 2, 3 o 200.

1.4. DOMINIOS PROTEICOS:


Entre la estructura secundaria y la terciaria hay
niveles intermedios que son los dominios proteicos. Este encima de la glucolisis est organizada
en el espacio de manera que se pueden distinguir
tres regiones funcionales distintas (pueden ser
independientes.)

3 funciones distintas en regiones bien separadas


y son regiones de plegamiento autnomo, pueden estar 2 naturalizados (funcionales) y uno desnaturalizado (no
funcional). Son independientes si cada uno de ellos est asociado a una funcin determinada.
Proteinas que comparten dominios con diferente orientacin, numero lo que denominamos arquitectura modular de las protenas. Suelen estar relacionados con una funcin caracteristica
1

1.5. ESTRUCTURAS SUPERSECUNDARIAS:


1. :
Estructuras supersecundarias: no son dominios porque no
suelen tener una funcin asociada pero son bloques QUE
forman protenas distintas. Se piensa que las distintas estructuras secundarias dan lugar a los plegamientos.

La naturaleza, una vez que encuentra un dominio para una


funcin se aprovecha de ello y los mdulos funcionales se
intercambian entre las protenas. Tenemos estructuras secundarias basadas en hlices .

2. :
Otras estn formadas exclusivamente por hebras beta. Barril
beta comn en membranas de bacterias.

3. (-):
Y las hay mezcladas.
Hay de tipo alfa-beta: aquellas protenas que tienen las alfa
lado y beta por otro

por un

Alfa + beta sera cuando tienen las dos estructuras


mezcladas entre si.

1.6. PROTENAS DE MEMBRANA:


Luego tenemos otra categora de protenas, que son las de membrana que no suelen seguir las reglas porque
tienen que estar embebidas en una membrana hidrofbica, por lo que los algoritmos son distintos en estos casos.
Se estima que alrededor del 30% del genoma que se transcribe son protenas de membrana.

2. ANLISIS
MARIA:

DE LA ESTRUCTURA PRI-

2.1. PROPIEDADES DE LOS AMINOCIDOS:


Para analizar la estructura primaria desde el punto de
vista estadstico hay que tener en cuenta que una protena est compuesta por 20 aa distintos y cada uno de
ellos est caracterizado.

Lo que distingue a un aminocido de


otro es su cadena lateral, que puede
ser polar, apolar, tener carga, ser hidrofbica, ser aliftica o tener mayor o menor volumen.
Por ejemplo si quiero insertar una
Cys para aderirle un fluoroforo y necesito introducirlo, lo sustituir en
un sitio en el que haya un aminocido con caractersticas qumicas y
tamao similar.

1. Diagrama de Venn de los aminocidos:

Aqu tenemos el diagrama de Venn que


agrupa los aa en funcin de sus cadenas
laterales

2. ProtParam: http://web.expasy.org/protparam/
ProtParam es un programa del instituto suizo de bioinformtica y
nos da la contabilidad de la protena, nos ofrece los parmetros
fsico-qumicos.

Resultados de ProtParam:
Estos son los parmetros que nos da, peso molecular, punto isoelctrico, cuantos aminocidos hay de cada tipo,
nmero total de tomos Lo que hace es contar.
Tambin nos da el coeficiente de extincin molar (valor calculado tericamente). No es exacto al 100% pero tiene
un error tolerable. El pI por ejemplo s que puede ser muy distinto del real, porque no se tienen en cuenta las
modificaciones postraduccionales de la protena.
El coeficiente de extincin solo depende de los residuos aromticos de forma que se aproxima bastante. Tambin
te da la vida media estimada: cunto durar en el citoplasma hasta que las proteasas la rompan (tambin llamado
ndice de estabilidad). Los adtos del coeficiente estan en agua, asi que hay que tener en cuenta la composicin de
nuestro tampn.

2.2. PROTELISIS VIRTUAL:


Otra cosa que nos puede interesar saber es si posee puntos de corte para
determinadas proteasas. Si conocemos la secuencia podemos saber en que
puntos acta la proteasa y qu tipo de fragmentos va a generar
Herramientas:
1 PeptideCutter: http://web.expasy.org/peptide_cutter/
Este programa nos realiza una protelisis virtual
2. PeptideMass: http://web.expasy.org/peptide_mass/
Este programa no es idntico, porque hace una protelisis pero solo utiliza tripsina o quimiotripsina (utilizados en
protemica para realzar la huella peptdica). Se generan una serie de fragmentos y nos determina cual es su masa.
Podemos comparar la real con la virtual.
4

Resultados:

3. MODIFICACIONES POST-TRADUCCIONALES:
Las protenas frecuentemente necesitan ser modificadas antes de convertirse en activas en la clula, son las llamadas modificaciones postraduccionales. Estas ocurren despus de la traduccin de la protena (su sntesis). Estas
modificaciones implican la adicin de azcares, modificacin de aminocidos, o eliminacin de fragmentos en la
protena recin sintetizada.
Hay una serie de herramientas que se basan en la secuencia. Hay informacin de las protenas que es interesante
y que no estn codificadas en el genoma, que son las modificaciones postraduccionales. Se altera el punto isoelctrico y otras caractersticas. Las modificaciones postraduccionales consisten bsicamente en la adicin de carbohidratos y los azucares pueden pesar incluso ms de la protena. Se distingue glicoprotena de proteoglicano:

Glicoprotena: poca protena


Proteoglicano: ms proporcin de protena.

Esta informacin no viene en el genoma y hay que determinarla experimentalmente.

3.1. FOSFORILACIN DE PROTENAS:


Una de las modificaciones ms sutiles es la fosforilacin, pero el efecto sobre la actividad de la protena puede ser
radical, porque determina si la protena est de forma activa o inactiva. Son tres los residuos de una protena que
se pueden modificar, treonina, serina y tirosina. Se realiza por la adicin de enlaces covalentes con grupos fosfato.
La regulacin por fosforilacin es uno de los mecanismos ms habituales para regular la funcin proteica.
La fosforilacin reversible regula muchos aspectos de las
clulas vivas. Un evento clave en la regulacin celular es la
fosforilacin reversible de protenas.
Una protena quinasa transporta un grupo fosfato del ATP
hasta la protena. Las modificaciones postraduccionales
estn implicadas en numerosos procesos de regulacin
que hacen que la protena este operativa o no Su tamao
y funcin se ven alterados con esta modificacin. Una protena fosfatasa elimina los fosfatos y la protena revierte a
su estado original.
5

Herramientas:
1. NetPhos: http://www.cbs.dtu.dk/services/NetPhos/
Predice los sitios y asigna probabilidad segn los aa circundantes.
La fosforilacin no se produce en cualquier tipo de residuos. Aqu podemos seleccionar en que residuo queremos
determinar posibles sitios de fosforilacin y predice posibles sitios de fosforilacin.
La secuencia consenso de los sitios de fosforilacin es muy corta (3 aminocidos) lo que genera muchos falsos
positivos, pero no todo sern falsos positivos, as que nos resulta til para saber si se fosforila o no y en que regin.

2. NetPhosK: http://www.cbs.dtu.dk/services/NetPhosK/
Predice los sitios y detalla las kinasas especficas. Esta herramienta es muy parecida y se utiliza en distintos tipos
de quinasas.

3.2. GLICOPROTENAS:
El otro tipo de modificacin postraduccional es la glicosilacin: En unos casos el componente total de azucares puede ser grande o pequeo
La glicosilacin es el anclaje de la mitad de azcares a las protenas, es una modificacin postraduccional (PTM) que proporciona una mayor diversidad protemica que
otras PTM. Es crtica para un amplio para el anclaje de la clula a la matriz extracelular
y las interacciones protena-ligando en la clula.

Esta PTM est caracterizada por varios enlaces glicosdicos, incluyendo enlaces N-,O- y C-glicosdicos, el anclaje de
GPI y la fosfoglicosilacin. Las glicoprotenas pueden ser detectadas, purificadas y analizadas por diferentes estrategias, incluyendo la tincin de glicanos y la visualizacin, los enlaces entrecruzados de glicano en la agarosa o las
resinas magnticas para el marcaje o purificacin, o el anlisis
protemico por espectrometra de masas, respectivamente.

Existen distintos tipos de glicosilacin:

La N-glicosilacin se da en residuos NH2 de asparragina y


Arginina
La O-glicosilacin se da en treonina y serina. (Y, S, T, OH-K, OH-P)
La C-glicosilacin cadela lateral del W (Triptofano)
Fosfoglicosilaciones (SerP-azucar)
Glipiacin (anclajes GPI)(prot Cterm-azucar-Plipido) permite el anclaje de protenas a membrana mediante
el fosfatidil inositol

1.Herramientas:
6

1. NetNGlyc: http://www.cbs.dtu.dk/services/NetNGlyc/
Predice sitios de N-glicosilacin en protenas humanas. Basado en datos experimentales.
2. NetOGlic: http://www.cbs.dtu.dk/services/NetOGlyc/
Predice O-glicosilacin en protenas de mamferos.
2. Adicin de glicosilfosfatidilinositol (anclaje GPI):
En muchos casos hay protenas unidas a la membrana, no
porque tengan segmentos que la atraviesen sino porque
tienen un ancla de glicosilfosfatidilinositol. El glicosilfosfatidilinositol es un glicolpido que puede anclarse al extremo C-terminal de una protena durante la modificacin
postraduccional. Est compuesta de un grupo fosfatidilinositol unido a travs de un carbohidrato.

Estructura del glicosilfosfatidilinositol (GPI anchor):


La protena no interacciona para nada con la membrana
hasta que se aade el glicofosfatidilinositol que tiene dos anclas y lo que hace es anclar a la protena a la membrana.

Sntesis de protenas con anclaje GPI:


El ancla est por un lado y en algn momento de la sntesis de la protena se transfiere la protena al ancla y luego
va directamente a la membrana plasmtica.
En la imagen tenemos una representacin esquemtica de los pasos principales en la sntesis de protenas ancladas
a GPI. Las protenas (normalmente glicoprotenas) adquieren el anclaje de GPI en el retculo endoplasmtico, se
rompe la secuencia
seal (en un residuo
omega consenso) y
el anclaje GPI queda
anclado por una
etanolamina fosfato terminal al Cterminal de la protena aceptora. La
mitad de la glicoprotena
puede
despus ser modificada en el aparato de Golgi. La glicoprotena madura es finalmente localizada en la membrana
plasmtica.

Herramienta: Big-Pi Predictor: http://mendel.imp.ac.at/gpi/gpi_server.html


7

Compara nuestra secuencia (si tiene pptido seal para GPI) con BD de protenas anotadas. Predice sitios donde
se puede aadir GPI. Metemos la secuencia, le decimos que haga la prediccin y nos dir si la protena presenta
sitios caractersticos de este tipo de modificacin. Compara nuestra secuencia (si tiene pptido seal para GPI) con
BD de protenas anotadas.

4. TRFICO INTRACELULAR DE PROTENAS - SECUENCIAS SEAL:


Otra cosa que nos puede interesar determinar en una secuencia proteica es
que tenga secuencias seal (ayudan a la clula a llevar esa protena a su destino
intracelular: secrecin, protena de membrana, orgnulos determinados)
El hecho de que las protenas se sinteticen en el citosol, las de secrecin y membrana se van al RE, y tienen una
secuencia seal que dice donde tiene que terminar la protena.
Una secuencia seal es un pptido corto (5-30 aminocidos de largo), presente en el extremo N-terminal de la
mayora de las protenas de nueva sntesis que estn destinadas a rutas de secrecin. Estas protenas incluyen
aquellas que residen tanto dentro de ciertos orgnulos, como las que se secretan fuera de la clula o las que se
insertan en la mayora de membranas celulares.
El ncleo del pptido seal contiene una cadena larga de aminocidos hidrofbicos que tiene tendencia a formar
una alfa hlice simple. Adems, muchos pptidos seal empiezan con una cadena corta de aminocidos cargada
positivamente, que podra ayudar a reforzar una correcta topologa del polipptido durante la translocacin por lo
que se conoce como regle dentro-fuera.

4.1. TIPOS DE SEAL:

Si identificamos ese tipo de seales podemos predecir donde va a terminar funcionando. Tenemos el orgnulo de
destino y el tipo de seal (en que extremo est o si est interno) y la naturaleza de la seal (tipo de aminocidos
presentes).

4.2. BASES DE DATOS DE SECUENCIAS SEAL:


Hay muchos tipos de secuencia seal de forma que se han creado bases de datos de secuencias seal, tenemos
todas las bases de datos que se han caracterizado.
1. SPdb: http://proline.bic.nus.edu.sg/spdb/index.html
Signal Peptide Resource data base
2. SignalPeptide: http://www.signalpeptide.de/
3. Signal-CTF: http://compgenomics.utsa.edu/minniweb/
Predice dnde se corta la secuencia seal.
4. SingnalP: http://www.cbs.dtu.dk/services/SignalP/
Predice dnde se corta la secuencia seal.
5. PSORT: http://psort.hgc.jp/
Predice secuencias seal
6. PrediSi: http://www.predisi.de/
Predice secuencias seal
7. Signal-3L: http://www.csbio.sjtu.edu.cn/bioinf/Signal-3L/
Predice secuencias seal
8. Phobius: http://phobius.sbc.su.se/
Predice secuencias seal de protenas de membrana.

5. HELICOIDES ENROLLADOS (COILED COILS):


Otra cosa que se puede determinar es la presencia de helicoides enrollados.

5.1. FUNCIONES DE LOS HELICOIDES ENROLLADOS:


Estas estructuras tienen unas caractersticas interesantes. Es importante predecirlas porque su presencia nos indica que se trata de regiones implicadas en:

Interacciones protena-protena
Conecta dos dominios proteicos

Interacciones DNA-protena

5.2. HPTADAS REPETIDAS


- Cremalleras de leucina:

Presentan una hptada repetida, 7 aa que se repiten. La


hptada tiene la caracterstica de que el primero y el
cuarto aminocidos son hidrofbicos pero cuando se
adopta una estructura tridimensional, los helicoides interaccionan entre ellos por las zonas hidrofbicas y muchas son leucinas (cremalleras de leucinas).

Base de datos:
1. COILS: http://embnet.vital-it.ch/software/COILS_form.html
Este programa nos encuentra estas estructuras. En algunos casos hay gente que prefiere no determinar estas estructuras, porque los parecidos se pueden deber al motivo estructural y no a la secuencia, por lo que a veces, la
presencia de coiled coils puede entorpecer las bsquedas en bases de. En estos casos, ignorar estas regiones puede
ser una buena idea.
2. Multicoil: http://groups.csail.mit.edu/cb/multicoil/cgi-bin/multicoil.cgi
Tenemos herramientas que predicen la presencia de estas estructuras.
3. 2Zip: http://2zip.molgen.mpg.de/
Predice cremalleras de leucina.

10

6. PROTENAS INTRNSECAMENTE DESORDENADAS:


Como se puede anotar una protena en base a su secuencia. Hay un aspecto novedoso de las protenas, son un
tipo de protenas descubiertas recientemente: las protenas intrnsecamente desestructuradas. Estas protenas se
caracterizan porque parece ser que contradicen todas las normas.
Las protenas no estn quietas, tienen cierto grado de flexibilidad y no son estructuras estticas. Y es esta flexibilidad la que les confiere su capacidad de adoptar distintas estructuras. Hay muchas zonas que estn estructuradas
formando hlices alfa o hojas beta. Los grupos carboxilo son los que ms movilidad tienen.

11

Se mueven tanto que cuando las someten a rayos


X, las estructuras cristalogrficas presentan estructuras ausentes. En el cristal hay movilidad, en
las condiciones en las que estaran quietas sera
en el cero absoluto, siempre hay un mnimo de
movilidad. Por esto hay protenas que solo tienen
una parte cristalizada y la otra no se puede saber.
Aqu tenemos la amelogenina. Esta es la protena
que se une a iones metlicos. Esta tiene la mayor
parte de su estructura al azar, hay una regin con
alfa hlices definidas, pero no tienen una estructura secundaria o terciaria definida.

6.1. LAS PROTENAS INTRNSECAMENTE DESORDENADAS INTERVIENEN EN MUCHOS PROCESOS CELULARES:


Las protenas intrnsecamente desordenadas (intrinsically unestructured proteins, IUP) tienen una flexibilidad intrnseca que les permite tener un desorden particularmente enriquecido en las protenas implicadas en la sealizacin celular, la transcripcin y las funciones de remodelacin de la cromatina.

6.2. SE ESTRUCTURAN AL UNIRSE AL LIGANDO:


Lo bueno de estas protenas es que son muy verstiles, pueden adoptar mltiples
estructuras en funcin de las circunstancias y unirse a muchos sustratos. Una vez
que se unen al sustrato si que se organizan y forman el complejo.

6.3. THE PROTEIN QUARTET MODEL:


Ahora se habla de un modelo de cuarteto de protenas con 4 categoras
estructurales. Random-coil y pre-molten globule que son los desestructurados.
Molten globule y ordenado son las conformaciones estructuradas.
Recientemente se ha descubierto que las protenas y las regiones proteicas deben existir en al menos cuatro estados diferentes de organizacin
estructural: ordenada, glbulo fundido (molten globule), pre-glbulo fundido y random coil.
Adems la funcin de la protena se asocia con cualquiera de estos estados
distintos o con la transicin entre ellos. Estas protenas intrnsecamente
12

desordenadas o las regiones intrnsecamente desordenadas estn implicadas en procesos biolgicos clave incluyendo la regulacin de la transcripcin, el control del ciclo celular, el reconocimiento, y la sealizacin.

6.4. BASES DE DATOS:


1. DisProt: http://www.disprot.org/index.php
Se han detectado muchas protenas que funcionan as y estn desordenadas intrnsecamente y esta base de datos
las cataloga.
2. Disprot: Para regiones desordenadas: http://www.disprot.org/pondr-fit.php
Nos dice que regiones estn desestructuradas
3. GeneSilico: http://iimcb.genesilico.pl/metadisorder/
Predice zonas desestructuradas en las protenas
4. DisEMBL: http://dis.embl.de/
Predice regiones desestructuradas
5. IUPred: http://iupred.enzim.hu/
Predice regiones desestructuradas. Hay un umbral a
partir del cual el extremo carboxilo parece que
est intrnsecamente desestructurado. Resultados:

6. BD y herramientas para predecir modificaciones post-traduccionales

13

Una serie de bases de datos y recursos online para predecir modificaciones postraduccionales.

14

7. HERRAMIENTAS DE ANLISIS ON-LINE PARA ANOTAR PROTENAS

7.1. PAQUETE DE PROGRAMAS EMOTIF: HTTP://MOTIF.STANFORD.EDU/PROJECTS.HTML


Hay una serie de programas que podemos descargar de internet de manera gratuita como eMOTIF. El pack incluye
3 programas:
1. eMOTIF search: Dada una secuencia de una protena, este programa sugiere familias de protenas a las que
al protena de anlisis podra pertenecer. A partir de una secuencia nos sugiere cual es la funcin de la
protena.
2. eMOTIF scan: Este programa convierte un alineamiento mltiple de secuencias sin huecos en un set de
motivos. Con el motivo que le hemos dado escanea en una base de datos de protenas y seala aquellas
que aparentemente tienen ese motivo.
3. eMOTIF maker: Dada una expresin regular, este programa encuentra todas las veces que aparece esa
expresin regular en una base de datos de secuencias particular.

7.2. EMATRIX: HTTP://MOTIF.STANFORD.EDU/DISTRIBUTIONS/EMATRIX/INDEX.HTML


Este paquete realiza las siguientes funciones:

15

1. eMATRIX-Search: este programa determina la funcin de una secuencia. Dada la secuencia de una protena,
identifica la secuencia encontrando coincidencias con una base de datos con matrices de puntuacin.
2. eMATRIX-Maker: este programa convierte un bloque de alineamientos en una matrix de puntuacin de
mnimo riesgo.
3. eMATRIX-Scan: busca una base de datos de protenas para secuencias que encajan en una determinada
matriz de puntuacin. Seala aquellas protenas que puedan compartir la funcin.

8. PROTENAS DE MEMBRANA
Analizaremos la secuencia proteica. Determinacin de para metros fisicoqumicos. Puntos de corte por proteasas.
Lugares de modificacin postraduccionales. Secuencias seal. Perfil hidrofbico y regiones trasnmembrana.
Vamos a estudiar las protenas integradas en la membrana plasmtica. Son desconocidas porque es difcil purificarlas fuera de su entorno por el hecho de que son bastante hidrofbicas, son inestables y precipitan. Por eso hay
que aplicar mtodos para tenerlas en disolucin, como el uso de detergentes.
Tambin tienen otros problemas y es que estn en un numero de copias muy reducido en una membrana (para
estudiarlas necesitamos muchas). Adems existen muchos tipos de protenas de membrana. Parece ser que aproximadamente el 30% de las protenas de nuestro genoma son protenas de membrana y son la diana de los frmacos

Herramienta bsica: MemType-2L: http://www.csbio.sjtu.edu.cn/bioinf/MemType/


Hay una herramienta bsica: Mem Type-2L que con una secuencia da dos tipos de informacin de predicciones:
*Dice si esa secuencia corresponde a una protena de membrana o no
Como hay distintos tipos de protenas de membrana te dice a cul de ellos puede pertenecer.

8.1. TIPOS DE PROTENAS DE MEMBRANA:


Paso simple transmembrana tipo I
Paso simple transmembrana tipo II
Paso simple tipo III
Paso simple tipo IV
Mltiples pasos transmembrana
Anclaje a la membrana mediante cadena lipdica
Anclaje a membrana mediante GPI
Perifricas.

Tenemos principalmente dos tipos de estructuras transmembrana.


protenas de membrana tienen regiones de su secuencia que la atraviesan de un lado a otro y aparentemente dos estructuras secundarias
protenas son capaces de atravesar la membrana: hlices- y barriles-

Las
de
.

16

8.1. PREDICCIN DE HLICES TRANSMEMBRANA:


Tenemos algunos ejemplos de protenas con hlices transmembrana.

Las hlices transmembrana son hidrofbicas. Cuando una hlice atraviesa la


membrana pasa de un entorna o polar a un entorno hidrofbico, de forma
que los aminocidos que atraviesen la membrana tienen que ser hidrofbicos
porque la constante dielctrica es dos.
Hay que tener en cuenta que adems de ser aminocidos hidrofbicos, la
longitud del segmento transmembrana tiene que ser la misma que la de la
membrana. Aproximadamente entre 19-22 aminocidos de alfa hlice ya cubren esa distancia, normalmente. Los aminocidos estn uno detrs de otro.

La longitud de la hlice depende de su inclinacin, no todas estn verticales. Las


hlices transmembrana pueden tener una longitud de entre 15 y 30 residuos.
Entre 8-12 residuos suficientemente hidrofbicos en bariles

Organizacin de las hlices transmembrana.


Cuando hay varias hlices transmembrana tambin es importante determinar
cmo se agrupan y su orientacin. Cuando predecimos las hlices transmembrana lo importante es saber cmo estn orientadas para formar la estructura
nativa.

1. Bases de datos: OPM database: http://opm.phar.umich.edu/


Esta base de datos rene distintas protenas de membrana y en funcin de cmo estn orientadas las clasifica, en tipo, clase, familia

2. Topologa de las protenas de membrana:


Una de las caractersticas ms importante que nos interesa conocer es la
topologa, que consiste en saber si el extremo que est dentro es el amino
o el carboxilo. Aunque detectemos que hay 3-TM, nos interesa saber cul
es el extremo interior, y eso nos condiciona para saber si la primera hlice
va de dentro a fuera o de fuera a dentro.

17

Regla "positive inside":

La regla que parece que se cumple en casi todos los casos es positive
inside: en
el citoplasma tiene que haber mayor numero de cargas positivas que en el exterior. Esto tambien pasa en las
membranas de los orgnulos, en el citosol tiene que haber ms cargas positivas.
Tenemos un ejemplo de cmo funciona: una
protena con 3 segmentos transmembrana y lo que
se hace es contar el numero de aminocidos con
cargas potivias que hay en cada bucle. En el primero
tenemos dos, en el siguiente 5, en el siguiente 3 y
en el siguiente 1, y arriba tenemos la longitud del
bucle (5,10,6,5). Entonces el primero estara fuera.
Los componentes membranales se encuentran preferentemente cargados positivamente en el lado citoplsmico
y son ligeramente ms negativos en la cara que ve al exterior celular.
OCTOPUS predice la topologa de protenas de membrana
Prediccin de segmentos TM: Ventanas deslizantes
Utilizamos las propiedades qumicas y una lista de valores asociadas
casa uno de los 20 aminocidos. Esta propiedad puede ser cualquier
parmetro fsico-qumico medible, como el tamao, la polaridad, la hidrofobicidad. Los valores de las tablas son valores de escala de aminocidos.

con

Despus, con esta tabla escogemos un tamao de ventana y la deslizamos a lo largo de la secuencia. El valor resultante se asocia con el aminocido central de la ventana. Cuando la operacin de deslizamiento haya finalizado, los
valores asociados con cada aminocido se representan frente a la secuencia (perfil de propiedades).
Las predicciones basadas en la ventana deslizante no son muy sensibles o muy precisas, pero son robustas. Si
vemos una seal fuerte cuando usamos un mtodo basado en la ventana deslizante, lo ms probable es que estemos mirando algo que es una seal biolgica genuina.
La localizacin de -hlices se hace mediante el mtodo de la ventana deslizante, donde lo ms importante, para
que funcione es el tamao de la ventana. Por regla general el tamao de la ventana tiene que coincidir con el
segmento de la caracterstica que queremos describir, si es el tamao del segmento transmembrana, usaremos 19
residuos.

18

Vamos deslizando la ventana y en cada paso calcularemos un valor y en cada deslizamiento calculamos un parmetro que es la hidrofobicidad, y existen distintas escalas de hidrofobicidad. Independientemente de la escala
utilizada para medir la hidrofobicidad de los residuos de la ventana todas tienen que dar lo mismo.
Otra debilidad del mtodo de la ventana deslizante es
tamao arbitrario de la ventana, ya que el tamao de la
ventana debe ser del mismo rango que el tamao de la
caracterstica que queremos medir. Por ejemplo para
caractersticas estructurales de las protenas globulares,
rango ente 7 y 11 sera el apropiado.

el

las
un

Perfiles de hidropata de protenas de membrana:


El mtodo de prediccin ms comn es el del perfil de
hidropata. Para ello se toman ventanas de 19 aminocidos y, en funcin de mltiples tablas en internet con
puntuaciones para aminocidos, puntuamos cada una
de nuestras ventanas. As, po ejemplo, una ventana
con un Trp ser ms probable que est asociada a una
ventana con lisina, ya que la hidrofobicidad del Trp le
confiere la propiedad de estar en membranas.
Otros programas no slo emplean las escalas de hidrofobicidad para interpretar la presencia de hlices
transmembrana, sino que lo combinan con motivos
ocultos de Markov. Este MOM va a tener mltiples estados: hlice, globular, lazo, etc; con subestados (8 aas de lazo, 7
aas de hlice, etc.). Cada estado y subestado va a estar asociado a una probabilidad de emisin; por ejemplo, si tenemos
una hlice con 5 aas hidrofbicos, la probabilidad de emisin ser baja, ya que se suelen requerir 15-30 aas para que se
inserte.
Otro ejemplo, si despus de 5aas hidrofbicos tengo 5 aas cargados, lo ms seguro es que haya una transicin de hlice
a loop, o una secuencia con cambio de estructura. Depender de la puntuacin del MOM a la hora de analizar la secuencia para saber si realmente se trata de la estructura que estamos interpretando.
Teniendo en cuenta las bases de datos con protenas trasnmembrana podemos calcular las
probabilidades de transicin y emisin, a partir
las cuales realizaremso las predicciones sobre
nuestras protenas a analizar.

de

Herramientas:
1. ProtScale:
tscale/

http://web.expasy.org/pro-

Tenemos en ProtScale distintas escalas para realizar el anlisis, seleccionar el tamao de la ventana y seleccionar
coeficientes de ponderacin para dar ms o menos importancia a los residuos de los extremos de la ventana.
ProtScale realiza perfiles fsico-qumicos.

19

Permite calcular y representar el perfil producido por cualquier escala de aminocidos en una protena seleccionada . Una escala de aminocidos se define por un valor numrico asignado a cada tipo de aminocido .
Las escalas ms utilizadas son las escalas de hidrofobicidad
o hidrofilicidad y los parmetros conformacionales de la
estructura secundaria, pero existen muchas otras escalas
que se basan en diferentes propiedades fsicas de los aminocidos y qumica . Este programa cuenta con 57 escalas
predefinidas introducidos por la literatura .
Las escalas que pueden usar las ventanas deslizantes aparecen en la pagina. (No incluidas):
Masa molecular, polaridad (Graham), hidrofobicidad (Kyte
Doolitle), estrucutras secundarias como. Alfa hlices, hojas
beta
Hay muchas escalas de hidrofobicidad. Cinco de las ms populares son:
-

La escala de Eisenberg y Weiss, basada en el clculo de los momentos dipolares de las regiones de una
cadena polipeptdica y el clculo de la energa libre requerida mara mover residuos de aminocidos del
interior a la superficie de una protena hidratada.
Escala de Engleman, Steits y Goldman, basada en la determinacin de energas implicadas en la particin
de las cadenas de aminocidos entre soluciones acuosas y membranas.
La escala de Kyte-Doolittle es un tipo de escala consenso basada en la combinacin de observaciones experimentales de otros estudios.
La escala Hoop-Woods es una escala de hidrofobicidad basada en la solubilidad en agua de aminocidos
individuales.
La escala Janin basada en mediciones estadsticas de la tendencia de un residuo de ser encontrado dentro
de una protena en vez de en su superficie.

Seleccionamos la escala, el tamao de la ventana, ponderamos la contribucin de los elementos de la ventana e


introducimos la secuencia.

2. TMHMM: http://www.cbs.dtu.dk/services/TMHMM-2.0/
Utiliza modelos de Markov ocultos
para predecir hlices transmembrana. Los resultados: tambin para
citocromo oxidasa humana. Esta
sera la grfica para una protena de
hlices TM. Observamos que, a diferencia de plots hidropticos, estas
grficas representan probabilidades
insercin.

la
dos

de

3. Tmpred: http://www.ch.embnet.org/software/TMPRED_form.html

20

Predice regiones transmembrana. Nos dice si van de dentro a fuera o de fuera a dentro. Adems nos sugiere un
par de modelos. Basado en un anlisis estadsitico de la TMbase (BD de protenas transmembrana). Consigue un
score con matrices de puntuacin. Resultados:

No todas las herramientas funcionan igual y a veces es bueno


mirar ms de una herramienta.

4.
TopPred:
http://mobyle.pasteur.fr/cgi-bin/portal.py?#forms::toppred
Predice regiones transmembrana. Resultados:
Vemos que dos hlices sobrepasan el umbral y la que era considerada por el programa anterior aqu es discriminado

5. HMMTOP: http://www.enzim.hu/hmmtop/index.php
Predice hlices transmembrana. Resultados, el output:

21

8.2. HLICES ANFIPTICAS:


Las hlices anfipticas son importantes en la interaccion con las membranas. Se denominan anfipticas porque sus residuos estn distribuidos de manera que los residuos de carcter hidrofbico se encuentran hacia el lado contrario que los hidroflicos.

Estructura de la bicapa lipdica


Tenemos el perfil de una membrana. El punto cero es donde
el grupo metilo de los lpidos que forman la bicapa. La regin
donde se acumulan la cabeza polar, el grupo fosfato y el
glicerol es una regin NO hidrofbica, es polar y es la interfase
entre las cabezas polares y el interior hidrofbico. Esta regin
excluye el agua y tiene unas dimensiones que se acomodan
bien a las dimensiones de una hlice alfa.

est

no
muy

Perfil de polaridad de la bicapa lipdica:


Si una helice alfa tiene carcter
anfipatico, una regin hidrofobica y otra
se
acomoda
en
esta
regin
perfectamente.

soluble,

Las hlices anfipticas tienen afinidad por la interfase:


Existen protenas de membrana cuya nica interaccin con la membrana es una
anfipticas que mantiene anclada a la protena a la bicapa. El tamao de la
interfase permite acomodar una hlice . El tamao de la hlice cabe perfectamente en la interfase y la hlice anfiptica encuentra ah su entorno ideal.

hlice

Cada aminocido tiene una afinidad distinta por la interfase:


Wimley and White (WW) hydrophobicity-at-interface scale
Cada aminocido tiene una afinidad distinta por la
interfase. En este tipo de hlices los residuos hidrofbicos e hidroflicos estn alternados y esta alternancia se puede detectar y cada aminocido tiene
sus preferencias (no solo hacia estar en medio
acuoso o apolar, sino hacia una interfase (polaridad
intermedia)).
22

*El triptfano es el que tiene mayor afinidad por la interfase:

Las hlices anfipticas forman parte de los canales inicos:


Las helices anfipaticas tambien son importantes
aquellas protenas que funcionan como canales
porque tienen que pasar compuestos solubles.Por
lado se acumulan residuos hidrofilicos y pos otro
hidrofobicos como el canal de potasio.

en
un

Las hlices anfipticas pueden formar poros en


membranas
Este tipo de hlices anfipticas ha sido utilizado adems por organismos como armas de defensa y existen muchos antibiticos
que tienen actividad microbiana producidos por especias diversas (magainina y cecropina (polillas))
Cuando alcanzan un umbral de
concentracin en la bicapa son capaces de agregarse entre ellos y
formar poros, en el que cada pptido es una duela (el listn de madera del barril) y se
carga la membrana por choque osmtico.
Helical wheel: una forma interesante de representar hlices a
Una forma de detectar estas hlices anfipticas es mediante helical wheel. Cuando
tienes un fragmento de la secuencia de la protena que adopta esta estructura. Empezamos en el 392.

Paginas para estudiar las protenas de membrana:


1. Helical Wheel Projections: http://rzlab.ucr.edu/scripts/wheel/wheel.cgi
2. pepwheel: http://emboss.bioinformatics.nl/cgi-bin/emboss/pepwheel
3. AmphipaSeek:
http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_amphipaseek.html
Predice hlices anfipticas.

23

8.3. PREDICCIN DE BARRILES TRANSMEMBRANA:


Este es el otro tipo de estructura capaz de
atravesar la bicapa. Necesita un nmero mnimo de hebras beta que se asocien entre s
para formar el barril.
Mnimo de 8 hebras , y mnimo de 8-12 residuos/hebra (ms estirada que la hlice )
Alterna residuos polares y apolares
Se diferencian dos regiones: Regin interna
hidroflica, regin externa hidrofbica. Los residuos aromticos en la interfase. Son como filtros, controlan el dimetro de las sustancias que pueden pasar por ellas.
La polaridad del barril :
En la secuencia del barril beta alternan residuos polares y apolares: su interior tiene carcter hidroflico, mientras
que la pared externa (orientada hacia la bicapa) tiene carcter hidrofbico. Estas hebras beta tienen sus caractersticas que nos permiten detectarlo mediante algoritmos informticos. Necesitamos un nmero mnimo de hebras
beta. La estructura beta se caracteriza porque: el barril beta, en un lado est orientado hacia la membrana y otro
hacia el interior y forma un poro por el que pueden entrar sustancias al periplasma.
Los residuos que miren hacia el interior de la porina sern hidroflicos y los que
miren hacia la membrana sern hidrofbicos. Se van alternando aminocidos hidrofbicos e hidroflicos y esto puede detectarse por algoritmos informticos. La
longitud que tiene que tener la hebra beta para atravesar la membrana es de 8
aminocidos. Adems tiene una preferencia en la que los aminocidos aromticos
ocupan las regiones de las cabezas polares formando un cinturn.
Las cadenas laterales en una estructura estan ubicados hacia el exterior. Tambien
los aminoacidos aromticos hacia el exterior
1. PredTMBB: http://biophysics.biol.uoa.gr/PRED-TMBB/input.jsp
Una de las herramientas que suelen utilizarse es Pred TMBB. Tenemos un modelo de Markov oculto con distintos
estados. Resultados:
2. BOCTOPUS: http://boctopus.cbr.su.se/
Predice barriles transmembrana. En vez de utilizar el algoritmo de prediccin basados en motivos de Markov
ocultos est basado en redes neuronales. Resultados:

24

TEMA 5. DISPERSION DE LUZ


Hasta el momento, hemos estudiado la absorcin de luz que inducen transiciones electrnicas y una emisin producto de esta transicin. Ahora vamos a estudiar otro tipo de respuesta que va a tener la materia al interaccionar con la
luz: dispersarla. Nos va a dar informacin sobre tamaos, composicin
Si la materia a la que incidimos luz no la absorbe, la dispersa. Por qu? Estamos haciendo llegar la radiacin que va
a producir una deformacin de la nube electrnica de la molcula. Producto de esa deformacin, cada una de estas
molculas se convierte en una fuente de irradiacin en todas las direcciones. Segn donde nos pongamos a analizar
vamos a obtener caractersticas de estas molculas.

TIPOS DE DISPERSIN
DISPERSION RALEIGH: Sin cambio de energa. Frecuencia incidente y frecuencia dispersada son iguales. Por incidencia de una luz incidente, producimos un cambio en el momento dipolar (se favorece la formacin de dipolos-dipolos
inducidos). Esto hace que si pudisemos representar el nivel energtico decimos que alcanza uno superior, pero no
es una transicin a un nivel energtico superior, solo tiene un contenido energtico superior. Esto es lo que va a
hacer que la molcula, tras esa induccin de momento dipolar, dispersa luz y vuelve al punto de partida.
DISPERSION RAMAN: Dos tipos de dispersiones denominadas inelsticas, en los que la luz dispersada tiene un contenido energtico distinto, lo que implica que hay cambios energticos en la molcula.
-Si la luz dispersada es de menor energa que la absorbida, se produce un aumento de la energa de la molcula y se
trata de dispersin Stokes-Raman.
-Si el contenido energtico final es inferior al inicial, la molcula est dispersando luz a frecuencias mayores y se
denomina dispersin Anti-Stokes-Raman.
En este tema vamos a centrarnos en dispersiones elsticas

CONCEPTO
Si la incidencia de un haz sobre una partcula produce un dipolo oscilante en la nube electrnica, la molcula se transforma en una antena que dispersa luz en todas las direcciones
(lo que explica la irradiacin de luz). Entonces decimos que la
molcula es polarizable.
La intensidad de la luz que es dispersada depende de cunto
oscilen los electrones. Pero estas partculas no son siempre
perfectas, la dispersin de la luz puede verse acompaada de
transmisin, refraccin y todo junto provoca turbidez. Por
ello la dispersin no se mide en todas las direcciones, si no en
ciertas direcciones en las que la intensidad de luz ser mayor
1

INFORMACIN
Qu informacin puede proporcionarnos la dispersin de luz?
Por dispersin pretendemos obtener informacin sobre forma, dimensin, tamao, movimiento, difusin, velocidad Y de esa manera calcular masas moleculares, coeficientes de difusin, pureza (para cristalizacin y difraccin
de rayos x, se necesita que la muestra sea lo ms homognea posible para poder cristalizar), seguir reacciones de
oligomerizacin, formacin de complejos, fibras
-La intensidad de luz dispersada va a ser proporcional a la masa molecular de la partcula y a su concentracin. Esta
propiedad la vamos a utilizar para obtener parmetros de inters
-La presencia de agregados puede modificar enormemente la intensidad de luz dispersada. Nos puede dar informacin sobre si en nuestra preparacin se han formado agregados o no, estructuras ordenadas
-Polidispersidad (criterio de homogeneidad): Podemos detectar si hay ms de una molcula dispersando luz.

FACTORES DE LOS QUE DEPENDE LA DISPERSIN


Aunque Masa molecular y concentracin sean lo que ms influyen existen otros factores que tienen bastante relevancia en el estudio de la dispersin:
-El arreglo del sistema*
-Tamao de la partcula: la dispersin depende de esto ya que la lambda que estudiaremos depende de ello
-La distancia y el ngulo al que te posiciones para observar la dispersin, ya que aunque la luz se disperse en todas
direcciones, nosotros vamos a seleccionar un sitio concreto
*Cuando hablamos de ARREGLOS MOLECUALRES quiere decir cmo estn nuestras molculas ordenadas. Si estn
perectamente ordenadas (como en un cristal), debemos observar si la distancia entre ellas es menor o mayor que la
lambda.
Esto tambin debemos tenerlo en cuenta si tenemos un arreglo fluctuante, en el que nuestras molculas estn en
disolucin.

TIPOS DE RADIACIN Y DISPERSIN


TIPOS DE RADIACIN
Nos vamos a mover en el campo visible (aplicada a disoluciones), pero tambin podemos aplicar rayos X (cristales) y
neutrones.

TIPOS DE DISPERSIN
Depende de lo que queramos obtener tenemos dos tipos de medidas o conceptos:
-Si nos interesa MM, tamao estaremos midiendo un promedio de luz dispersada por la poblacin de partculas:
estudio de DISPERSIN DE LUZ ESTATICA (SLS: static light scattering). En este tipo de medida se ve cmo va variando
la intensidad de luz dispersada variando el ngulo de medida. Vemos como la intensidad de luz dispersada por esta
muestra vara en funcin del ngulo
-Si queremos conocer si existe polidispersidad, cul es el radio de hidratacin de la molcula, forma nos interesa
saber cmo vara la intensidad de luz dispersada a lo largo del tiempo: DISPERSIN DE LUZ DINMICA (DLS, dynamic
light scattering). En este caso estamos trabajando a un ngulo determinado, que no puede ser 180 porque nos confundira la transmisin e luz. Vemos cmo evoluciona a lo largo del tiempo, nos da idea de un movimiento, asociamos a formas, grados de hidratacin de las molculas
2

DISPERSIN ESTTICA
ECUACIN DE RAYLEIGH.
La intensidad de la luz dispersada es una intensidad promediada de todas las molculas, suponiendo que es homognea, depende de la masa molecular y de un segundo coeficiente virial, que tiene que ver con las interacciones
de esas molculas con el medio en que se encuentran.

1
1
= + 22

()

La obtencin de la ecuacin es complicada. Vamos a analizar intensidades de luz dispersada, hay relacin entre la
constante que depende de los ndices de refraccin del disolvente (K), de C/ R (relacin Raleigh donde intervienen
las intensidades de luz de las molculas), la forma, la masa y el coeficiente.
K = constante ptica
MM = masa molecular
A 2 = segundo coeficiente virial
C = Concentracin (g/L)
R = relacin de Rayleigh (trmino que incluye la intensidad)
P ()= factor forma

SUB-ECUACIONES
Relacin Raleigh (R ): Intensidad de luz dispersada por la muestra relacionada con la intensidad dispersada por un
patrn. Influyen los factores de dispersin de la muestra y del medio.
=

: Intensidad del analito (Intensidad de la muestra Intensidad del disolvente)

: RI del disolvente

: Intensidad del standard (tolueno)

: RI del standard (tolueno)

: Ratio de Rayleigh del standard (Tolueno)

Constante: influye como varia la variacin del ndice de refraccin y la lambda.

: Longitud de onda del laser

2 2
2

: Numero de Avogadro
: RI del disolvente

dn/dc: Incremento diferencial de RI


El factor forma va a depender del radio de giro y el ngulo de medida.

: Radio de giro

: ngulo de medida

= 1 +

16 2 2 2
32

sin2
2
3

La intensidad de luz dispersada depende de masa y concentracin En dispersin esttica medimos a distintos ngulos, por si la forma influye en la luz dispersada. Si vemos que no hay dependencia con el factor forma, podemos
permitirnos el lujo de medir solo a un ngulo (90 generalmente) para medir con mucha precisin la masa molecular.
Cuando se cumple esta ltima condicin decimos que se comportan como dispersores ideales Rayleigh.
Cmo transformamos la intensidad de luz media en los parmetros? Se suelen realizar diferente tipos de graficas

DEBYE PLOT:
Nos permite determinar la Masa Molecular Absoluta y el segundo coeficiente virial
Cmo se hace? Preparamos muestras con cinco concentraciones diferentes (habitualmente 0, 1, 2, 3 y 5 mg/ml).
Vamos a suponer que no hay una dependencia angular con la intensidad y as tenemos la ecuacin de una recta de
Rayleigh. Hacemos KC/R vs C
El punto de corte con el eje y nos da la masa
molecular y la pendiente nos da el segundo
coeficiente virial
El segundo coeficiente nos da informacin
sobre la fuerza de interaccin entre las molculas y el disolvente
A 2 >0: La protena tiende a permanecer en el buffer, no se agregan
A 2 =0: la fuerza de interaccin molcula-solvente es igual a la de molculamolcula (solvente theta)
A 2 <0 la protena tiende a precipitar o
agregar

Los estudios de dispersin tambin nos proporcionan informacin sobre la adecuacin del tampn para que no se
formen agregados. Para ello, se trabaja con tampones de diferente porcentaje de sal.
Es decir, sin sal, la protena es muy soluble, y con mucha sal tiende a agregar. Nos indican una ventana donde no
tiene preferencia por el tampn y son condiciones de ordenamiento para cristalizacin.

El experimento se realiza en una cubeta con un ngulo y lo voy variando. Hoy en da intentan introducir un acoplamiento con cromatografa de exclusin molecular. Primero tenemos el sistema de separacin con un detector UV
para ver cuando sale la molcula. A continuacin las muestras pasan por otro detector de dispersin de luz y otro de
4

ndice de refraccin. As t puedes llegar a identificar la pureza y las caractersticas de la molcula que estamos estudiando. Las molculas de mayor tamao dispersan mucha ms luz que las pequeas.

En la imagen superior tenemos un cromatograma en el que detectamos por UV una banda a volmenes ms pequeos de una especie de mayor masa molecular (una pequea contaminacin). Pero cuando aplicas dispersin de luz a
las muestras que salen de columna de tamizado molecular vemos un agregado que dispersa an ms la luz (imagen
inferior, primer pico)

PARTCULAS DE GRAN TAMAO-DEPENDENCIA ANGULAR


Siempre hablamos de los agregados como algo inespecfico, pero no tiene por qu ser as. Podemos considerar los
agregados como molculas grandes que van a dispersar ms fuertemente la luz. La variacin del ngulo presenta
una relacin de dependencia con el tamao de la molcula, no as en monmeros y dmeros, ya que en una molcula grande vamos a tener muchos ms focos dispersores que en una molcula pequea Cuanto mayor es el tamao,
mayor va a ser la variacin del ngulo.
Como la luz es dispersada en todas las direcciones, segn donde coloques t el detector, los trenes de onda provocados por un foco cancelan a las de otro o se suma con las del otro (en fase). Vamos a hacer las medidas a diferentes
ngulos con objeto de ver la relacin de intensidad con ese ngulo.

Para establecer la dependencia angular nos basamos en el factor forma () exp( 2 3 ), que tiende a 1 cuando
tiende a 0. En la ecuacin R G es el radio de giro, que nos da idea de la masa y la morfologa de la molcula. Estos
valores se pueden obtener de diferentes representaciones:

REPRESENTACIN DE GUINIER
Representamos ln (I ) vs Q2. En esta representacin, el factor
Q anteriormente mencionado es dependiente del ngulo
2

( = (4/)(/2)) y la pendiente es -3

REPRESENTACIN DE ZIMM
Existen muchos tipos de representaciones para obtener parmetros de inters. Adems de masas y radio de giro.
Cuando hacemos representacin de Zimm representamos
dispersin Rayleigh frente a ngulos
Si se representa un monmero como Zimm se ve que la pendiente es cero
Estas representaciones pueden complicarse un poco ms y por regla general suele hacerse medidas de dispersin de
luz a distintos ngulos, concentraciones y extrapolamos a ngulo y concentracin = 0, cuyo punto de corte es 1/M y
pendiente = Rg

RESUMEN DISPERSIN ESTTICA


Pros:
-Determinacin rpida y exacta del promedio de MM (si tenemos
especies con distintos estados oligomricos con tcnicas de separacin tendremos una MM falsa).
-Combinado con SEC-MALS se determina MM con una precisin +5%. Dependencia angula de seal de LS detecta agregados. SECMALS permite detectar y purificar
Contras:
-Mide MM promedio si no hemos separado suficientemente bien.
Posible prdida de muestra durante filtracin y fraccionamiento.

DISPERSIN DINMICA
Permite determinar el tamao de molculas y nanopartculas. Mide las fluctuaciones de la intensidad de dispersin
con el tiempo para determinar el coeficiente de difusin traslacional y el radio hidrodinmico
La intensidad vara porque las molculas, en dispersin, tienen un movimiento browniano. Esto puede correlacionarse con el coeficiente de difusin y el tamao. Uno de los parmetros que determinamos es el radio de Stokes o hi6

drodinmico, relacionado con el coeficiente de difusin de la molcula. Cuanto mayor sea la difusin, menor ser el
radio.

Analizando la ecuacin con detalle sera conveniente tener una temperatura constante, que modifica la viscosidad y
genera conveccin, las partculas grandes se mueven lentamente, es decir, menor difusin. Si aumentamos la temperatura, ms rpido se mueven las molculas. La velocidad de movimiento browniano est definido por D.
Las fluctuaciones en las intensidades estn relacionadas con movimientos y posiciones relacionadas. No son oscilaciones al azar, sino consecuencia del confinamiento de las partculas a sitios cercanos a la posicin inicial en tiempos
muy cortos. La molcula al cabo de un tiempo se encuentra en una posicin distinta
Con las fluctuaciones de intensidad se obtiene una funcin de correlacin, se saca un factor de correlacin y se hace
una representacin (correlograma respecto al tiempo)
Cuanto ms tiempo pase en que la curva disminuya,
quiere decir que corresponde a movimientos de partculas grandes, si aparece pronto la pendiente, partculas
ms pequeas.
Si se alcanza la lnea de base o se estandariza/establece a
valores de correlacin distintos a cero podramos decir
que nuestra protena ha llegado a formar agregados. El
ngulo que se nos forma (theta) segn la pendiente, nos
va a dar informacin sobre si la muestra es muy homognea o no.
Como la dispersin dinmica nos puede describir la presencia de especies distintas en mi muestra y como puede
influir en los datos obtenidos: si compramos dos grficas, aunque tengamos un tamao de radio idntico, la anchura
de la banda da informacin de que la muestra no es homognea en cuanto a tipos de especies
Aunque se trate de la misma partcula, segn las condiciones, tendr tendencia a agregar.
Polidispersidad: nos comparan partculas esfricas que coexistan. Dependiendo de la forma de medida puede ser
muy llamativo el resultado, pero la informacin ser la misma. Partculas ms grandes dispersan ms la luz. La intensidad de la seal no me da informacin de la cantidad de molcula
Quien trabaja en difraccin de rayos x le interesa un cristal. Utilizan las medidas de dispersin dinmica para saber si
la molcula es homognea desde el punto de vista del tamao.
Dependiendo del valor del coeficiente virial, tenemos varios casos:
7

Muy positivo, demasiado solubles


Cero: perfecto, cristalizan
Una impureza: baja calidad o no cristalizan;
Muy negativo, estn agregadas.

RESUMEN
Pros
Una de las mayores ventajas es que me puede dar un ndice de polidispersidad en la muestra.
Contras:
Mide radios hidrodinmicos, pero tambin pueden dar informacin que pueden inducir a error. Puede ser que no
nos d informacin sobre estados de oligomerizacin. Necesita fraccionamiento para resolver oligmeros.

EFECTO DE LA LUZ DISPERSADA EN AL DIRECCIN DE LA TRANSMISIN


Hay vece s que en un fluormetro medimos luz dispersada. Que mejor aparato que el fluormetro para medir dispersin en un determinado ngulo. Hacemos llegar luz a una determinada longitud de onda y detectamos a esa misma
longitud, para que as sea dispersada.
Sin embargo, cuando trabajamos con un espectrofotmetro, puede ser que las caractersticas de mi muestra hagan
que cada una de las partculas funcionen como dispersores y muchas veces consideramos que la luz que no llega al
detector es porque ha sido absorbida, pero en realidad es porque est siendo DISPERSADA, ya que es muy turbia.
La turbidez puede estar siendo debida a un fenmeno de dispersin y no de absorcin. Por ejemplo, en un cultivo
bacteriano, mido en el espectrofotmetro como aumenta la absorcin, pero en realidad no se ha absorbido, si no
que mucha de esa luz ha sido dispersada.
Turbidez:
= (/0 )

La turbidez se relaciona con la dispersin mediante el cociente de Raleigh (R ):

= 90
= 16
3

COMPARACIN DE SECUENCIAS
El pilar fundamental de la bioinformtica es el anlisis de secuencias que, resumiendo, se basa en la comparacin de
las secuencias. El objetivo actual de anlisis de secuencias es extraer informacin funcional, estructural y evolutiva
contenida en las secuencias biolgicas:
-

Determinar (cuantificar) el grado de similitud entre secuencias


Determinar si existe relacin entre ellas
Detectar la presencia de motivos estructurales conservados
Construir rboles filogenticos

Dos conceptos fundamentales son la homologa y similitud, que no son lo mismo. Similitud se relaciona con el parecido
(identidad) entre dos secuencias: n significativo de residuos en la misma posicin. No implica homologa, aunque en
muchos casos, dos secuencias similares suelen ser homlogas. La homologa es relacin que existe entre dos secuencias similares que provienen de un ancestro comn. Es decir, que a menos que no encontremos un ancestro comn,
las secuencias slo sern similares o anlogas, pero nunca homlogas.
Sin embargo, cuando dos secuencias tienen un 40% de similitud, suelen ser homlogas en un 90% de los casos. Si la
similitud es del 20%, no podemos estar tan seguros de la homologa, por lo que se requerirn mtodos ms complejos
para determinar la homologa.
De los dos conceptos anteriores derivamos ms conceptos:
-

Analoga: dos elementos que, sin tener orgenes idnticos, tienen parecidos y, por tanto, tienen evolucin
convergente. Estos elementos pueden confundirse con homologas, y nos pueden confundir, ya que podemos
construir falsos rboles filogenticos.
Dentro de las homlogas tenemos:
o En el mismo organismo, las secuencias homlogas pueden derivar de los PARLOGOS, secuencias de
dos genes que originalmente eran un solo gen que se duplic en algn momento de la evolucin.
o Entre diferentes especies:
Ortlogos: Hubo una especiacin y una evolucin divergente (como los brazos humanos y las
aletas de ballenas)
Xenlogas: hubo una transferencia horizontal de genes. El ejemplo ms tpico es el de una
transferencia del gemona de un rotavirus a un eucariota. Con el tiempo las secuencias van
variando, pero si las comparas, ambas tienen el mismo origen, siendo elementos completamente diferentes (un virus y un organismo eucariota)

METODOLOGA
Es el mtodo por excelencia para determinar homologas. Tenemos dos tipos: alineamiento de dos secuencias, y de
mltiples secuencias.

ALINEAMIENTO DE DOS SECUENCIAS


Existen dos posibilidades:
1

Alineamiento global: intenta alinear todos los residuos de


ambas secuencias. Es til para secuencias similares en
composicin, longitud, relacionadas o con dominios conservados en el mismo orden. Este alineamiento nos dar huecos en los que haya posibles inserciones y deleciones. Nos da informacin para construccin de rboles filogenticos o de homologa de secuencias.
Alineamiento local: alinea una o ms regiones de una secuencia con una o ms regiones de otra secuencia. Es til
para secuencias que diverjan en com posicin o longitud
pero que s tengan regiones similares (en el mismo orden o no). Estas secuencias en alineamientos globales
nos daran puntuaciones muy malas.
Alineamiento semiglobal: se trata de un alineamiento en
el que haya regiones q ue no se puedan alinear, pero que
tengan secciones de similitud (que sern los que se comparen). Por tanto, nos ser til para secuencias divergentes en
longitud que estn solapadas (el fin de una se solapa con el inicio
de otra). Esto nos ser til, por tanto, para detectar solapamientos a la hora de ensamblar cntigos o para comparar ESTs o DNAc
con DNA genmico.

A veces es interesante comparar una secuencia consigo misma. En un


dot-plot las caractersticas ms sobresalientes de la secuencia se identifican fcilmente, que suelen resaltarse por ser lneas de puntos que aparezcan en diagonal. Para realizar un dot-plot realizamos un cuadro en el
que enfrentamos dos secuencias, iguales o no, y marcamos las casillas
donde las bases coincidan. Analizando los puntos, si encontramos una
diagonal ese trozo de secuencia es significativa.

ALINEAMIENTO MLTIPLE DE SECUENCIAS


Nos es til, por ejemplo, a la hora de comparar una
protena de diferentes organismos, de modo que las
regiones similares aparecern solapadas, adems de
indels o cambios de aminocidos. Esto nos es til ya
que as podemos saber que regiones se conservan
ms y, por tanto, no convendra alterar la protena;
y que regiones son menos conservadas y, por tanto,
podramos modificar para estudiar funcin proteica.

CONSEJOS SOBRE ALINEAMIENTO


Siempre que podamos, ser mejor comparar protenas en vez de nucletidos. Si no hay secuencia proteica realizaremos siempre que podamos una traduccin conceptual. Las razones de esto son:
-

En las bases de datos, los 4 nucletidos aparecen con la misma frecuencia


Todos los cambios posibles tienen una probabilidad similar en los cidos nucleicos pero no en las protenas
Es un mtodo ms lento, porque las bases de datos de cidos nucleicos contienen un nmero muy elevado de
caracteres: Es preferible traducir una secuencia de DNA a 6 protenas (los 6 ORF) y alinear las secuencias de
protenas.
No queda ms remedio que hacerlo si se trata de secuencias no codificantes, intrones, tRNA, rRNA, etc.
Las protenas aportan ms informacin (4 bits por aa y 2 por nucletido)
Se obtienen resultados estadsticamente significativos con alineamientos ms cortos
El cdigo gentico es redundante (64 codones, 20 aas) casi 1/3 de las bases no estn sometidas a presin
selectiva y generan ruido, lo que afecta a la sensibilidad de la bsqueda.
Las bsquedas en bases de datos de cidos nucleicos son ms lentas porque son mucho ms grandes a causa
de los proyectos genmicos y, adems, contienen muchas secuencias no codificantes.

EJEMPLOS DE ALINEAMIENTOS
Si consideramos las secuencias:

Y hacemos un alineamiento de ambas secuencias

Observamos un 55% de similitud que, a priori, nos indica una baja homologa. Sin embargo, la secuencia de aminocidos en ambas secuencias es MELISAISALIVE.

ALINEAMIENTO PTIMO. % DE IDENTIDAD


Para determinar cul es el mejor alineamiento (si las secuencia estn relacionadas o se parecen por azar) se necesita,
por tanto, un sistema de puntuacin. Si dos secuencias pueden tener ms de un alineamiento, debemos escoger el
que ms lgico sea, en base a la puntuacin y al criterio del investigador.

SISTEMAS DE PUNTUACIN DEL ALINEAMIENTO


1. El sistema de puntuacin consta de dos componentes:
o Una matriz de puntuacin o de sustitucin que asigna un valor a cada una de las posibles sustituciones:
Ac. Nucleicos: elegir una matriz segn el modelo evolutivo o al azar
Protenas: elegir una matriz evolutiva (PAM; BLOSUM; etc.)
o Una penalizacin por la introduccin de indels.
2. La puntuacin del alineamiento resulta de sumar la puntuacin de cada posicin, en funcin de que los residuos coincidan (match), sean distintos (mismatch) o haya huecos (indels).
3. Mtodos para determinar la significacin estadstica del alineamiento (% de identidad no slo debido al azar).

SISTEMAS CON MATRICES


MATRIZ DE IDENTIDAD
En muchos casos se emplea una matriz de puntuacin o de sustitucin donde a cada sustitucin se le asigna una
puntuacin distinta, porque no todos los nucletidos sustituyen a otros con la misma probabilidad y no todos los
aminocidos sustituyen a otros con la misma probabilidad.
En el modelo al azar se otorga una puntuacin discreta a las coincidencias, otra a las diferencias y otra a los huecos.
Podemos, por ejemplo, sumar 1 punto a cada match y restar 1 a cada mismatch, adems de restar 2 a cada indel. Ese
tipo de matrices se denominan matrices identidad. Segn las condiciones, por tanto, podran establecerse multitudes
de matrices en funcin a lo que establezcan los investigadores.

MATRICES BASAD EN EL MODELO EVOLUTIVO. MATRICES PAM (POINT ACCEPTED MUTATION)


Es un tipo de matriz que tiene en cuenta que muta una base cada 10 millones de aos 1 de cada 100 bases (99% de
conservacin entre dos secuencias). En caso de protenas es ms complejo y la puntuacin vara en las caractersticas
fsico-qumicas de los aas de la protena. Para aplicar las matrices PAM hemos de asumir una tasa de cambio evolutivo
constante, que las mutaciones son aleatorias e independientes (modelo de Markov de orden 0) y que, por tanto, la
probabilidad de mutar de A a B sea la misma que de B a A. Por ltimo, la puntuacin asignada a secuencias cercanas
en la evolucin debe ser distinta a las que son ms lejanas (el parecido es menos destacable si estn cerca, y las diferencias son ms destacables).

MODELO DE JUKES-CANTOR
Emplea una matriz PAM-1, que tiene en cuenta un tiempo evolutivo, por lo que la posibilidad de que el nucletido se
mantenga ser 0,99; y el 0,01 se distribuir entre las dems mutaciones. Sin embargo, debido a los decimales, es ms
til trabajar con el log odds score. Definimos el logaritmo como la probabilidad de que se cambie una base por otra
como resultado de la evolucin en vez de azar.
La frmula del log odd score (s ij ) es:
= log 2

Donde es la probabilidad de que aparezca esa base al azar (si suponemos un modelo de MArkov de orden cero, ser
0,25; y es la probabilidad de transicionar la base en funcin de la matriz.
Si, por ejemplo, queremos la probabilidad de mutar C en A, la probabilidad es:
= log 2

La probabilidad de mutar A en A (mantenerse) es:

0,25 0,0033
6
0,252

= log 2

0,25 0,99
2
0,25 0,25

As por ejemplo, si tenemos un alineamiento ACGTAT/AGGTTT, son 4 bases iguales y dos diferentes: 4x2+2x(-6) = -4
MODELO DE KIMURA
Este modelo tiene en cuenta que las transiciones (A G, C T) son ms
frecuentes que las transversiones (las dems), puesto que es el mismo tipo de
base (prica o pirimidnica). El modelo dice que una transicin es 3 veces ms
frecuente que una transversin, por lo que la matriz de probabilidad y de log
sern las siguientes.
As por ejemplo, para ACGTAT/ATGTTT ser +2,-5,+2,+2,-7+2 = -4

Si queremos aceptar ms de un tiempo evolutivo, lo que tenemos que hacer es multiplicar esa matriz por el nmero
de cambios que deseemos, es decir:
= (1 )

As por ejemplo, para una PAM1 de Jukes-Cantor, las PAM modificadas para un tiempo evolutivo de 10x10 = 100
millones de aos son:
4

Podemos observar que los nmeros de la matriz no estn tan radicalizados y que las diferencias son menores. La
primera tabla nos muestra valores de porcentaje de diferencias y los para un match y un mismatch. Si hacemos el
cociente match/mismatch tenemos que, por ejemplo, para una PAM10 el cociente es 1,86/3 = 0,62; mientras que para
una PAM125 es 0,65/0,3 = 2,2. Es nos indica que en tiempos evolutivos cortos van a importar ms las posiciones que
no coincidan, ya que tendremos muchas posiciones que no varen; y en tiempos evolutivos largos las posiciones que
coincidan porque eso nos indicar que son posiciones conservadas y que pese a todo ese tiempo no se han cambiado.
Otra cosa a tener en cuenta es que conforme ms tiempos evolutivos aplicamos, al ser menos diferentes los valores
entre si, necesitaremos muestras ms largas para alcanzar la significancia estadstica.

MATRICES DE PUNTUACIN PARA PROTENAS

Contienen valores proporcionales a la probabilidad de que el aminocido i mute a un aminocido j, para todos los
aminocidos. Deben reflejar probabilidades reales de que una mutacin determinada ocurra en un periodo de tiempo
evolutivo concreto, para lo cual se emplean datos conocidos, a partir de bases de datos. Las matrices sern, por tanto
de 20x20 y trabajaremos con dos tipos: PAM y BLOSSUM.

MATRICES PAM PARA AMINOACIDOS


Fueron diseadas por Margaret Dayhoff y se basan en un modelo de Markov evolutivo. Para realizarlas, realiz unas
asunciones, no completamente certeras:
-

Mutaciones independientes y aleatorias: sabemos que las mutaciones no son independientes, ya que hay zonas de mayores mutaciones y, adems, pese a que pueda ser aleatorio que se d una mutacin, que se mantenga no es completamente aleatorio.
P(B A) = P(A B). Por estudios de mutaciones se sabra fcilmente que, si bien el cambio AB es de la
magnitud del de BA, no son exactamente los mismos valores.
Asume una tasa constante de cambio evolutivo, lo cual tampoco es cierto, ya que se sabe que ha habido pocas de mayor tasa de mutaciones.

Para construir una matriz se bas en 71 rboles filogenticos de 34 superfamilias de protenas (citocromo c, globina,
insulina) con secuencias con 85% o ms de identidad. Los cambios que se observan son mutaciones aceptadas por
la evolucin. Al final cont 1572 cambios y calcul las probabilidades de conversin de un aa a otro.
Para hacer el rbol filogentico tuvo en cuenta que todas las secuencias compartan el 85% de los aminocidos, pero
que en parejas de 2 hubiera diferencias de un 1% con el elemento hijo comn (para conservar los tiempos evolutivos). Una vez diseado el rbol, se fueron contando una a una las mutaciones, y agregndolas a la matriz.

Una vez diseada la matriz (denominada matriz A), se tiene que tener en cuenta la presencia del aminocido, ya que
puede haber dos aas que muten mucho, pero que uno sea mucho menos frecuente que otro, lo cual no puede pasar
desapercibido, ya que a fines prcticos, cuanto menos frecuente sea ese aminocido, ms raro debera ser que mute.
Para ello se realiza la mutabilidad relativa. Para ello, con los valores de la matriz se sacan los valores m:
=

# veces que ha mutado


# veces que aparece

As, se realiza una nueva matriz, la matriz M, que lo que nos indica es que de 10000 veces que aparece un aminocido,
para cada tiempo evolutivo, ese aminocido mutar X veces a un aminocido j.

La mutacin ms comn es la E D / D E, que se observa en 56 de cada 10000 casos.


Al igual que con los nucletidos, podemos multiplicar la matriz n veces consigo misma segn un nmero de cambios
evolutivos. Recordemos que cuanto mayor es n, mayor ha de ser la cadena para tener algn resultado estadsticamente significativo.
Tambin, al igual que para los nucletidos, vamos a trabajar con logaritmos. En este caso, cambiamos log2 por log10,
y multiplicamos por 10 para normalizar los resultados a un nmero entero del orden de las unidades. El resultado es
6