Está en la página 1de 10

Diseo computacional aleatorio de promotores para la mejora de la

afinidad de la polimerasa nativa de Escherichia coli, con base en una


biblioteca de 68 promotores constitutivos de sigma 70, probando su
eficiencia expresando GFP en Escherichia coli en comparacin con el
sistema de expresin T7
Introduccin

El objetivo principal de la ingeniera gentica con fines industriales es lograr


la correcta expresin de altos niveles de un gen dado, clonado en el
microorganismo husped elegido. Sin embargo, la clonacin directa (sin
manipulacin adicional) de un gen en un vector normal (como el pBR322) no
suele asegurar que un gen de inters se vaya a expresar de la manera ms
eficiente, sobre todo cuando procede de especies alejadas
filogenticamente. Por esta razn se recurre al diseo de vectores
especializados y a menudo a modificaciones del gen de inters, con objeto
de que este pueda transcribirse y traducirse bien en el organismo husped.
Algunos de los elementos que se suelen manipular para este fin son:

La naturaleza de las secuencias de iniciacin y finalizacin de la


transcripcin (promotores, operadores, terminadores)
Secuencias sealizadoras para la iniciacin de la traduccin,
especialmente sitios de unin del ribosoma y el codn de inicio de la
traduccin
Optimizacin de la traduccin, lo que puede obligar a utilizar codones
sinnimos adaptados a la abundancia de los correspondientes ARNt del
husped
Estabilidad de la protena en la clula husped
Localizacin celular de la protena a expresar: en muchos casos
interesa que la protena se secrete, por lo que el diseo gentico debe
incluir seales de procesamiento postraduccional adecuadas.
Otras veces interesa que la protena se quede en el espacio
periplsmico de la bacteria Gram-negativa husped, o que se retenga
en el citoplasma
Nmero de copias del gen clonado. Cuando se pretende que el gen se
exprese a alto nivel, se suele escoger un plsmido de control relajado,
es decir, con gran nmero de copias, mientras que si interesa un nivel
bajo de expresin se escoge un plsmido de control estricto (poco
nmero de copias) o se recurre a integrar el gen de inters en el
cromosoma
(Pareja, 2005).
Cada vez que queramos clonar y expresar un gen, debemos ajustar
especficamente muchos de estos parmetros, construyendo vectores de
expresin ad hoc, escogiendo las cepas huspedes, etc. Se trata de una
labor que frecuentemente es bastante ardua, y que pone en juego una gran
cantidad de conocimiento de biologa molecular y de pericias tcnicas
(Pareja, 2005).

Uno de los microorganismos huspedes ms usados es Escherichia coli,


probablemente el ser vivo ms estudiado a nivel molecular, y del que se
dispone de una vasta batera de mtodos de manipulacin gentica in vitro.
Pero para muchos experimentos se debe recurrir a otros huspedes,
como Bacillus subtilis, la levadura Saccharomyces cerevisiae, o incluso
clulas de insectos o de mamfero (Pareja, 2005).

Lo que debe tener un vector de expresin en E. coli (se citan los elementos
genticos siguiendo el orden desde el lado 5 al lado 3):

Un promotor eficiente, dotado de las regiones conservadas 35


(TTGACA o parecida) y 10 (TATAAT o parecida)
A corta distancia del promotor, una regin que al transcribirse
suministre el sitio de entrada al ribosoma: la denominada secuencia de
Shine-Dalgarno, que es complementaria del extremo 3 del ARNr 16S
A unos 3-11 pb rio abajo de la secuencia de Shine-Dalgarno, debera
situarse el codn ATG que seala el comienzo de la traduccin del
ARNm. Este codn lo puede suministrar el gen a clonar, o bien el
vector puede disponer de ese codn, seguido de alguna diana que
permita la insercin del gen a expresar
Finalmente, y situado al lado 3 de todo lo anterior, una secuencia que
funcione como terminador de la transcripcin (que en su forma de ARN
constituye la tpica horquilla por emparejamiento intracatenario, donde
la ARN polimerasa se desliga del ARN recin formado).

En principio, uno podra pensar que si queremos expresar un gen a alto nivel,
deberamos escoger un promotor fuerte y constitutivo. Sin embargo, la
mayor parte de las veces no conviene usar tal tipo de promotores, porque al
estar expresando permanentemente el gen de inters a alto nivel, pueden
sustraerse recursos para el normal crecimiento de las clulas. Esto es
especialmente delicado si la protena fornea tiene efectos negativos para el
husped. Por lo tanto, lo normal es emplear promotores regulables, que el
investigador puede activar y desactivar a voluntad. Una estrategia habitual
es aquella en la que se cultiva la bacteria recombinante hasta que se logran
grandes densidades, momento en que se suministra la seal para que el
promotor se active y transcriba el gen insertado (Pareja, 2005).
Los promotores regulables de E. coli que se emplean en los vectores de
expresin ms habituales son promotores fuertes pero que bajo ciertas
condiciones estn reprimidos por las correspondientes protenas represoras,
lo que suministra la base para inducir o reprimir el gen adyacente a voluntad
(Pareja, 2005).
El promotor del opern de la lactosa (lac) ha servido para disear elementos
de control de expresin en numerosos vectores. Mientras en el medio no
exista lactosa (o un inductor apropiado), el promotor est reprimido por el
represor (producto del gen lacI). En el laboratorio, la induccin se suele
lograr aadiendo al medio un inductor gratuito (que a diferencia de la
lactosa, no se metaboliza, pero se une al represor, inactivndolo). Ejemplo de
inductor gratuito es el IPTG (isopropil-b-D-tiogalactsido). Para que el
promotor lac se exprese a alto nivel, tenemos que evitar la represin
catablica: en ausencia de glucosa la protena CAP se une con AMPc, y el
complejo se une cerca del promotor, ayudando a la ARN polimerasa a
comenzar la transcripcin (Pareja, 2005).
En los vectores de expresin se suele emplear un promotor lac mutante,
conocido como lacUV5 (con una sustitucin en la regin 10), que es ms
potente que el promotor silvestre. Por supuesto, esta variante es reprimible
por LacI e inducible por IPTG (Pareja, 2005).
El opern trp contiene los genes estructurales que determinan las enzimas
para la sntesis del triptfano. Su promotor se ve reprimido, en presencia del
triptfano en el medio, por el complejo represor-triptfano. Si no hay
triptfano disponible, el represor queda inactivo, y por lo tanto el opern trp
se transcribe. En los vectores basados en el promotor trp, la expresin se
logra en medio sin triptfano, mientras que se reprime en presencia del
aminocido, o aadiendo el compuesto cido 3-indol-acrlico (Pareja, 2005).
En los aos 80 se dise un promotor artificial combinando la regin 35
del promotor trp y la 10 del promotor lac, ponindole de nombre promotor
tac. Dicho promotor result ser 5 veces ms potente que el de trp y 10 veces
ms que el de lac. A semejanza del promotor de lac, el tac es inducible por
IPTG y reprimible por glucosa. Se ha usado mucho en vectores de expresin
de alto rendimiento. Se llegan a alcanzar niveles de protena recombinante
del 10-30% de la total (Pareja, 2005).
El promotor del fago T7 necesita la ARN polimerasa especfica del mismo
fago, por lo que si queremos expresar genes bajo ese promotor, hay que
clonar simultneamente el gen de la polimerasa de T7. Normalmente este
gen de la polimerasa se inserta en el cromosoma de E. coli o en el profago l
(la versin insertada del cromosoma del l en las clulas lisognicas) y bajo el
control del promotor de lac. Entonces se procede a transformar las clulas
con la construccin gentica dotada del gen de inters aguas abajo del
promotor del T7. Cuando aadimos el inductor IPTG, se induce el gen de la
polimerasa de T7, protena que transcribe a gran nivel el gen que hemos
clonado (Pareja, 2005).
En este trabajo se presenta el diseo computacional de promotores con base
en un una biblioteca de 68 promotores constitutivos de sigma 70 para
Escherichia coli, dicho programa selecciona aleatoriamente una secuencia
de la biblioteca antes mencionada, extrae un fragmento de longitud y
posicin aleatoria, para la formacin del nuevo promotor hibrido, el proceso
se repite para la extraccin de otro fragmento aleatorio, los fragmentos
resultantes son concatenados hasta alcanzar o superar una longitud de 55
nucletidos.
Este proceso se repite para crear una nueva biblioteca de n promotores
hbridos, que posteriormente son sometidos un proceso de seleccin en
donde se evala con un programa distinto su potencial como promotor, los
promotores con altas probabilidades de actuar como promotores fuertes,
son probados experimentalmente expresando Green Flourescent Protein
(GFP), bajo la induccin de Isopropil--D-1-tiogalactopiransido (IPTG), en E.
coli.
Antecedentes

Justificacin

Objetivo
Diseo de un promotor fuerte para su uso en la ingeniera gentica
Creacin de un vector que cuente con el promotor diseado, inducible
por IPTG.
Superar la eficiencia del sistema de expresin T7
Diagrama de flujo
*Cambiar la simulacin de sigma 70, por Evaluar el potencial promotor de la
secuencia por medio del programa Promoter Hunter.
Cambiar el vector psf-oxb15 por uno inducible por iptg..
Cambiar el gen GBP por GFP.
Metodologa.
El programa elaborado para evolucin gentica de los promotores, fue
programado en Matlab 2015a, la idea principal de este programa consiste en
el diseo computacional de nuevas secuencias promotoras para la
70
subunidad de E. coli, con la intencin de mejorar los niveles de
expresin de un gen dado en un vector de expresin con la utilizacin de
nuestras secuencias promotoras.
El programa utiliza una biblioteca de 68 secuencias promotoras conocidas
70
constitutivas de obtenidas de
http://parts.igem.org/Promoters/Catalog/Ecoli/Constitutive , con base en esta
biblioteca, el programa:
1. Selecciona una secuencia de las 68 disponibles de manera aleatoria.
2. Extrae una porcin de la secuencia en una posicin aleatoria de la
misma y longitud igualmente aleatoria.
3. Dicha porcin extrada formara parte de la nueva secuencia promotora
generada por el programa.
4. A partir de aqu empiezan los ciclos, se repiten los pasos 1-3, para
extraer el siguiente fragmento que formara parta de la secuencia
promotora final.
5. Una vez que la secuencia promotora final alcanza o supera los 55
nucletidos (requerimiento del programa Promoter Hunter) de longitud,
es almacenada como una secuencia promotora para ser analizada.
6. Se repiten los pasos 1-5 para generar un numero n de secuencias
promotoras susceptibles a anlisis.
7. Una vez obtenida la cantidad deseada se secuencias promotoras
hibridas se someten a un proceso de discriminacin mediante el
programa Promoter Hunter, obtenido de
http://www.phisite.org/main/index.php?nav=tools&nav_sel=hunter , el
cual evala por el potencial de una secuencia para fungir como
promotora, solo las secuencias que obtengan un mayor puntaje sern
introducidas al vector de expresin para probar su eficiencia en la
produccin de GFP en E. coli.
8. Si alguna secuencia generada por este mtodo supra los niveles de
produccin alcanzados por T7, se habr logrado el objetivo del estudio.
Enseguida se muestra el cdigo que contiene el programa con todos sus
elementos explicados:
function promoters
%% Definicin de variables--------------------------------------------------
longitud_del_promotor_final = 0;
final_promoter = [];
resultados = cell ([1000 2]);
resultados (1,1)= cellstr('Secuencia promotora');
resultados (1,2)= cellstr('Longitud');
resultados (1,4)= cellstr('Contador');
resultados (1,3)= cellstr('Nombre');
i=1;
data = ['ttgacaagcttttcctcagctccgtaaact
';
'ttgacaatatatatatatatataatgctagc
';
'ttgacaatatatatatatatatataatgctagc
';
'tgtaagtttatacataggcgagtactctgttatgg
';
'ttgacggctagctcagtcctaggtacagtgctagc
';
'tttacagctagctcagtcctaggtattatgctagc
';
'ttgacagctagctcagtcctaggtactgtgctagc
';
'ctgatagctagctcagtcctagggattatgctagc
';
'ttgacagctagctcagtcctaggtattgtgctagc
';
'tttacggctagctcagtcctaggtactatgctagc
';
'tttacggctagctcagccctaggtattatgctagc
';
'tttacggctagctcagccctaggtattatgctagc
';
'ctgacagctagctcagtcctaggtataatgctagc
';
'tttacagctagctcagtcctagggactgtgctagc
';
'tttacggctagctcagtcctaggtacaatgctagc
';
'ttgacggctagctcagtcctaggtatagtgctagc
';
'ctgatagctagctcagtcctagggattatgctagc
';
'ctgatggctagctcagtcctagggattatgctagc
';
'tttatggctagctcagtcctaggtacaatgctagc
';
'tttatagctagctcagcccttggtacaatgctagc
';
'ttgacagctagctcagtcctagggactatgctagc
';
'ttgacagctagctcagtcctagggattgtgctagc
';
'ttgacggctagctcagtcctaggtattgtgctagc
';
'ttgacagctagctcagtcctaggtataatgctagc
';
'tttacggctagctcagtcctaggtattatgctagc
';
'ttgatggctagctcagtcctaggtacaatgctagc
';
'tttacggctagctcagtcctaggtactatgctagc
';
'ttgacaatatatatatatatatatataatgctagc
';
'ttgacaaaaaaaaaaaaaaaaaatataatgctagc
';
'ttgacggctagctcagtcctaggtacagtgctagc
';
'tttacagctagctcagtcctaggtattatgctagc
';
'ttgacagctagctcagtcctaggtactgtgctagc
';
'ctgatagctagctcagtcctagggattatgctagc
';
'tttacggctagctcagtcctaggtatagtgctagc
';
'ctgatggctagctcagtcctagggattatgctagc
';
'tttatggctagctcagtcctaggtacaatgctagc
';
'ttgacagctagctcagtcctagggattgtgctagc
';
'ttgacggctagctcagtcctaggtattgtgctagc
';
'ttgacaaaaaaaaaaaaaaaaaaatataatgctagc
';
'tttaattatatatatatatatataatggaagcgtttt
';
'ttgacaatatatatatatatatatatataatgctagc
';
'tataagatcatacgccgttatacgttgtttacgctttg
';
'tttacactttatgcttccggctcgtatgttgtgtggac
';
'tttacactttatgcttccggctcgtatggtgtgtggac
';
'ggcacgtaagaggttccaactttcaccataatgaaaca
';
'ttgacaatatatatatatatatatatatataatgctagc
';
'tttaattatatatatatatatatataatggaagcgtttt
';
'taatcagtatgacgaatacttaaaatcgtcatacttattt
';
'cattattgcaattaataaacaactaacggacaattctacctaaca
';
'aatctccgttgtactttgtttcgcgcttggtataatcgctgggggtc
';
'cccgtctaatgcgcttccctgtttttatgttattctctctgtaaagg
';
'tctttttgatgcaatccgctttgcttctgactataatagtcagggtaa
';
'aattcacctcgaaagcaagctgataaaccgatacaattaaaggctcct
';
'tattaacgtttacaatttaaatatttgcttatacaatcttcctgtttt
';
'gcaaccattatcaccgccagaggtaaaatagtcaacacgcacggtgtta
';
'ttaaatttcctcttttcaggccggaataactccctataatgcgccacca
';
'ggtaaaccatatgaattttctattgattgtgacaaaataaacttattcc
';
'ttgataaattcactattgactcttctcagcgtcttaatctaagctatcg
';
'ccgtgacggatcctggtgcaaaacctttcgcggtatggcatgatagcgcc
';
'ccaacgtcctgactggtataatgagccagttcttaaaatcgcataaggta
';
'tggtgcaaaacctttcgcggtatggcatgatagcgcccggaagagagtcaattcagg
';
'tcagaaaattattttaaatttcctcttgtcaggccggaataactccctataatgcgcca
';
'gatatcaattcacctcgaaagcaagctgataaaccgatacaattaaaggctcctgctagc
';
'ttaatttttattaatatatgtaaaatccccccccccgaaagcttaagaatataattgtaagc
';
'ttaatttttattaatatatgtaaaatccccccccccccgaaagcttaagaatataattgtaagc
';
'ttaaatttcctctcgtcaggccggaataactccctataatgcgccaccacactgatagtgctagtgtag
atcac ';
'ttagggcttgacggaaataaaagtattgagattttgttcttaatcaatatgttatttaccgtgacgaac
taattgctcgtg ';
'gctagcccaaaaaaacggtatggagaaacagtagagagttgcgataaaaagcgtcaggtaggatccgct
aatcttatggataaaaatgctatggcatagcaaagtgtgacgccgtgcaaataatcaatgt'];
%%---------------------------------------------------------------------------
%%inicio del clculo de promotores.
promoters_library = cellstr (data);%%definicin de la librera de promotores
while i < 1001 %% ciclo para la creacin de 1000 secuencias promotoras
aleatorias con base en la biblioteca
while longitud_del_promotor_final < 55 %% se considera al promotor
terminado una vez alcanza o supera los 55 nucletidos de longitud segn los
requerimiento del programa Promoter Hunter
y = final_promoter; %% vector para la concatenacin de los fragmentos
promoter_fragment = promoters_library {(randi (68))}; %%selecciona una
secuencia de la biblioteca de promotores
longitud = length (promoter_fragment); %% mide la longitud de la
secuencia seleccionada para el establecimiento de lmites para la extraccin
de un fragmento aleatorio
lim_sup = randi (longitud); %% lmite superior del fragmento definido
aleatoriamente
lim_inf = randi (lim_sup); %% lmite inferior del fragmento, definido
aleatoriamente
promoter_fragment = promoter_fragment (lim_inf:lim_sup); %%porcin del
promotor a extraer
final_promoter = strcat (y,promoter_fragment); %% concatena los
fragmentos seleccionados para crear una sola string, hasta que la secuencia
promotora final que alcance o supero los 55 nucletidos de longitud
longitud_del_promotor_final = length (final_promoter); %%mide la
longitud del promotor final para terminar o continuar con la concatenacin de
fragmentos.
resultados (i+1,1) = cellstr (final_promoter);%%almacena el vector
terminado en una cell array of strings
resultados (i+1,2) = cellstr(num2str(longitud_del_promotor_final));%
%almacena la secuencia promotora resultante del proceso
resultados (i+1,4) = cellstr(num2str(i));
resultados (i+1,3)= cellstr('>Promotor_');

end
longitud_del_promotor_final = 0;%%reinicio de variables para el clculo de
un nuevo promotor
final_promoter = [];%%reinicio de variables
i = i+1;%%contador para la creacin de 1000 secuencias
end
resultados %% despliegue de los resultados obtenidos
filename = 'C:\Users\ABRAHAM\Desktop\promotores.xlsx';
xlswrite(filename,resultados); %%exporta los resultados en un archivo Excel

end %% final del programa


Gracias a la biblioteca de 68 secuencia promotoras de distintas longitudes,
con este programa es posible generar un nmero virtualmente ilimitado de
secuencias de las cuales existe la probabilidad que alguna supere la
eficiencia de los mejores promotores conocidos incluyendo al sistema T7, es
por esto que el diseo computacional de secuencias es una herramienta
potencial para el mejoramiento de los sistemas de expresin actuales.
El programa Promoter Hunter, es una herramienta que permite la bsqueda
de secuencias promotoras potenciales a lo largo del genoma en procariotas,
entregando como resultado los 10 mejores puntajes obtenidos de las
secciones -35 y -10, evaluadas en un rango de espaciamientos, es por esto
que nos permite discriminar los resultados de nuestro programa, a
secuencias que no cumplan como requerimiento mnimo superar el puntaje
obtenido por el promotor T7. Sera ideal contar con un programa capaz de
medir la afinidad de la 70 por secuencias generadas por nuestro
programa para discriminar an ms resultados, sin embargo no fue posible
obtener dicho programa.
Una discriminados los datos, seleccionamos las 100 secuencias promotores
mejor calificadas por el programa promoter Hunter, y procedemos a crear el
vector de expresin inducible por IPTG con nuestras secuencias promotoras.
Expresin de GFP en E. coli inducible por IPTG, como mtodo de prueba de la
eficiencia de las secuencias promotoras generadas.

También podría gustarte