Está en la página 1de 30

Primer Informe de Avance de Tesis Doctoral

Periodo 2019 - 2020

DESARROLLO DE NOVEDOSAS METODOLOGIAS


DE ELUCIDACIÓN ESTRUCTURAL BASADAS EN
CÁLCULOS COMPUTACIONALES DE RMN

LIC. MARIBEL O. MARCARINO

Dirección: Dr. Ariel M. Sarotti


Codirección: Dra. María Marta Zanardi
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

Contenido
1. Introducción .............................................................................................................. 2
i. Relevancia de los Cálculos Cuánticos de RMN................................................ 2
ii. Bases Teóricas de los Cálculos Cuánticos ..................................................... 2
iii. Cálculos Cuánticos de RMN .................................................................................. 9
iv. Resultados Preliminares y Aportes del Grupo.............................................. 10
2. Objetivos .................................................................................................................. 15
i. Objetivos Generales............................................................................................ 15
ii. Objetivos Específicos........................................................................................ 15
3. Resultados y discusiones ..................................................................................... 16
4. Conclusiones ............................................................................................................ 26
5. Plan de trabajo para el próximo período ........................................................ 26
6. Actividades Académicas de posgrado .................................................................. 27
i. Publicaciones ....................................................................................................... 27
ii. Congresos............................................................................................................... 27
iii. Seminarios............................................................................................................. 27
iv. Cursos .................................................................................................................... 27
7. Referencias .............................................................................................................. 27

1
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

1. Introducción
i. Relevancia de los Cálculos Cuánticos de RMN
La elucidación estructural es una etapa crucial en el descubrimiento de un nuevo compuesto
químico y,+ en particular, la espectroscopia de resonancia magnética nuclear (RMN) constituye
una de las herramientas más valiosas que disponemos los químicos orgánicos para llevar a cabo
dicha tarea.1 La configuración relativa ha sido determinada históricamente por la trasferencia
de polarización del spin nuclear a través del espacio, reflejada en las constantes de acoplamiento
escalar H-H (3JHH), contantes de acoplamiento escalar C-H de larga distancia (2,3JCH) y
experimentos de efecto nuclear de Overhauser (nuclear Overhauser effect -NOE). Los avances
en esta disciplina han sido extraordinarios, intensificados por la introducción de mediciones de
acoplamientos residuales dipolares (residual dipolar couplings -RDC)2 y anisotropía de
desplazamiento químico residual (residual chemical shift anisotropy-RCSA).3 Aun así, más allá
del advenimiento de espectrómetros cada vez más poderosos y de nuevas metodologías, dada
la naturaleza indirecta de la espectroscopia de RMN, la tarea de interpretar las señales de
resonancia para obtener estructuras congruentes esta generalmente plagada de obstáculos y
ambigüedades, haciendo el proceso arduo y desafiante. Esto se entiende mejor cuando se
analiza la gran cantidad de productos naturales incorrectamente asignados, el cual podría ser
mucho más grande si tenemos en cuenta que los errores generalmente son detectados luego
de lograr la síntesis total de las estructuras propuestas.4
En los últimos años se ha incrementado el uso de estrategias de química cuántica para
resolver problemas de validación estructural,5 facilitado por la capacidad de los paquetes de
software de química computacional para calcular parámetros de RMN de una forma sencilla.6
Desde comienzos del siglo XXI, el desarrollo de cálculos computacionales con métodos de
química cuántica, y en particular los cálculos de resonancia magnética nuclear (RMN, incluyendo
desplazamientos químicos y constantes de acoplamiento) han venido a auxiliar el proceso de
elucidación, validación y revisión estructural de moléculas orgánicas.7
La asignación incorrecta de productos naturales complica la evaluación de esquemas
biosintéticos y puede tener grandes consecuencias si un grupo de investigación se embarca en
la síntesis total de esta estructura mal asignada. 4 La química computacional moderna ha
contribuido en gran parte a prevenir la frustración del gasto de tiempo y energía para desarrollar
la síntesis total de un producto para luego detectar una discordancia entre los espectros de RMN
del producto sintetizado y el aislado.8,4a

ii. Bases Teóricas de los Cálculos Cuánticos 9


La mecánica cuántica, a través de la ecuación de Schrödinger, describe la función de onda
para el movimiento de partículas como los electrones:
−ℎ 2 𝑖ℎ 𝜕𝛹(𝑟̅ , 𝑡)
{ 2 ∇2 + 𝑉} 𝛹(𝑟̅ , 𝑡) =
8𝜋 𝑚 2𝜋 𝜕𝑡

Si V (energía potencial) no es función del tiempo, la ecuación se puede simplificar separando


variables y reescribiendo la función de onda como producto de una función dependiente del
espacio y otra del tiempo:
𝛹 (𝑟̅ , 𝑡) = 𝜑(𝑟̅ )𝜏(𝑡)

Luego, reemplazando en la ecuación de Schrödinger, podemos obtener dos ecuaciones, una


de las cuales es la ecuación de Schrödinger independiente del tiempo:

𝐻𝜑 (𝑟̅ ) = 𝐸𝜑(𝑟̅ )

2
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

Donde E es la energía del sistema, y H es el operador Hamiltoniano de energía, que tiene dos
términos, uno cinético y uno potencial.

−ℎ 2 2
𝐻= ∇ +𝑉
8𝜋 2 𝑚
La energía, entre muchas otras propiedades de las moléculas, puede ser obtenida
resolviendo la ecuación de Schrödinger para 𝜑.

En una molécula, 𝜑 es función de la posición de todos los electrones y los núcleos. El término
cinético del Hamiltoniano es la sumatoria de la energía cinética de todas las partículas, y el
término potencial es la interacción Coulombica entre cada par de entidades cargadas.

−ℎ 2 1 𝜕2 𝜕2 𝜕2
𝑇= ∑ ( + + )
8𝜋 2 𝑚𝑘 𝜕𝑥𝑘2 𝜕𝑦𝑘2 𝜕𝑧𝑘2
𝑘

1 𝑒𝑗 𝑒𝑘
𝑉= ∑∑
4𝜋𝜖0 ∆𝑟𝑗𝑘
𝑗 𝑘<𝑗

1 𝑍𝐼 𝑒 2 𝑒2 𝑍𝐼 𝑍𝐽 𝑒 2
𝑉= (− ∑ ∑ ( ) + ∑∑( ) + ∑∑( ))
4𝜋𝜖0 ∆𝑟𝑖𝐼 ∆𝑟𝑖𝑗 ∆𝑅𝐼𝐽
𝑖 𝐼 𝑖 𝑗<𝑖 𝐼 𝐽<𝐼

Si aplicamos la aproximación de Born-Oppenheimer podemos separar el movimiento de los


núcleos del de los electrones, y el Hamiltoniano del sistema puede ser escrito como:

𝐻 = 𝑇 𝑒𝑙𝑒𝑐 (𝑟̅ ) + 𝑇 𝑛𝑢𝑐𝑙 (𝑅̅ ) + 𝑉 𝑛𝑢𝑐𝑙−𝑒𝑙𝑒𝑐 (𝑅̅, 𝑟̅ ) + 𝑉 𝑒𝑙𝑒𝑐 (𝑟̅ ) + 𝑉 𝑛𝑢𝑐𝑙 (𝑅̅ )
Esto permite separar el Hamiltoniano en dos partes independientes, y podemos construir el
Hamiltoniano electrónico despreciando el término cinético de los núcleos:

𝑒𝑙𝑒𝑐
1 𝜕2 𝜕2 𝜕2 𝑍𝐼 1
𝐻 = − ∑ ( 2 + 2 + 2 ) − ∑ ∑ ( ̅̅̅ ) + ∑∑( )
2 𝜕𝑥𝑘 𝜕𝑦𝑘 𝜕𝑧𝑘 |𝑅𝐼 − 𝑟̅𝑖 | |𝑟̅𝑖 − 𝑟̅|
𝑗
𝑖 𝑖 𝐼 𝑖 𝑗<𝑖
𝑍𝐼 𝑍𝐽
+ ∑∑( )
̅̅̅𝐼 − ̅̅̅
|𝑅 𝑅𝐽 |
𝐼 𝐽<𝐼

(nota: si se trabaja en unidades atómicas las constantes físicas fundamentales se cancelan)

Este Hamiltoniano entonces es usado en la ecuación de Schrödinger que describe el


movimiento de los electrones en un campo de núcleos fijos:

𝐻𝑒𝑙𝑒𝑐 𝜑𝑒𝑙𝑒𝑐 (𝑟̅ , 𝑅̅) = 𝐸 𝑒𝑓𝑓 (𝑅̅)𝜑𝑒𝑙𝑒𝑐 (𝑟̅ , 𝑅̅)

Donde 𝐸 𝑒𝑓𝑓 es la función de potencial nuclear efectivo, que describe la superficie de energía
potencial del sistema. 𝜑 cumple los requisitos de estar normalizada y ser antisimétrica, ya que
| 𝜑|2debe permanecer invariante con respecto al intercambio de dos electrones cualquiera por
ser partículas idénticas.

Solucionar esta ecuación de Schrödinger de forma exacta, para encontrar (entre otras cosas)
la energía del sistema, no es posible excepto para los sistemas más triviales. Para poder
proceder, se hacen una serie de suposiciones que permiten simplificar el proceso y encontrar
una solución aproximada para una gran cantidad de moléculas.

3
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

En el método de Hartree-Fock, para cumplir el requisito de antisimetría, cada 𝜙𝑖 orbital


molecular es multiplicado por una función de spin (α o β), formando los spin-orbital, y se
construye la 𝜑 del sistema como un determinante de Slater de cada spin-orbital por un factor
de normalización. Un sistema de n electrones hay n/2 orbitales moleculares y se asignan
electrones a estos en pares de spin opuesto:

𝜙1 (r̅1 )α(1) 𝜙1 (r̅1 )β(1) … 𝜙𝑛/2 (r̅1 )α(1) 𝜙𝑛/2 (r̅1 )β(1)
1 ⋮ ⋮ ⋮ ⋮
𝜑(𝑟̅ ) = | ⋮ ⋮ |
√𝑛! ⋮ ⋮
𝜙1 (r̅ 𝑛 )α(n) 𝜙1 (r̅ 𝑛 )β(n) ⋯ 𝜙𝑛/2 (r̅ 𝑛 )α(n) 𝜙𝑛/2 (r̅ 𝑛 )β(n)

Así, 𝜑 tiene en cuenta todos los posibles orbitales de todos los electrones en el sistema
molecular para formar la función de onda.

Los orbitales moleculares individuales 𝜙𝑖 son expresados como una combinación lineal de
funciones base primitivas arbitrarias 𝑥𝜇 :

𝜙𝑖 = ∑𝑁
𝜇=1 𝑐𝜇𝑖 𝑥𝜇 𝜇 = 1,2,3, … , 𝑁

Por el Principio Variacional sabemos que la energía del estado basal de cualquier función
antisimétrica normalizada de las coordenadas electrónicas, es siempre mayor al valor esperado
para la función exacta del sistema, entonces el problema se resume en encontrar el set de
coeficientes 𝑐𝜇𝑖 de las funciones base primitivas en los orbitales moleculares que minimizan la
energía de la función de onda resultante. Este principio llevó a las ecuaciones de Roothaan-Hall:
𝑁

∑(𝐹𝜇𝜈 − 𝜀𝑖 𝑆𝜇𝜈 ) 𝑐𝜈𝑖 = 0 𝜈 = 1, 2, 3 … 𝑁


𝜈=1

ó 𝐹𝐶 = 𝑆𝐶𝜀
Donde cada elemento es una matriz: 𝜺 es la matriz diagonal de las energías orbitales. 𝑺 es la
matriz de solapamiento cuyos elementos son las integrales de solapamiento de las funciones de
la base y 𝑪 es la matiz de los coeficientes que definen los orbitales. 𝑭 es la matriz de Fock, y
representa el efecto promedio del campo de todos los electrones en cada orbital. Está
𝑐𝑜𝑟𝑒
compuesta por 𝐻𝜇𝜈 matriz de energía de cada electrón individual en el campo de los núcleos
desnudos, y 𝑃𝜆𝜎 , la matriz de densidad electrónica de los orbitales ocupados. Para un sistema
de capa cerrada son:
𝑁 𝑁
𝑐𝑜𝑟𝑒
1
𝐹𝜇𝜈 = 𝐻𝜇𝜈 + ∑ ∑ 𝑃𝜆𝜎 [(𝜇𝜈|𝜆𝜎) − (𝜇𝜆|𝜈𝜎)]
2
𝜆=1 𝜎=1
𝑜𝑐𝑢𝑝𝑎𝑑𝑜𝑠

𝑃𝜆𝜎 = 2 ∑ 𝑐𝜆𝑖 𝑐𝜎𝑖
𝑖=1

Donde (𝜇𝜈 |𝜆𝜎) son las integrales de repulsión electrónica que representan la repulsión
Coulombiana clásica entre los electrones; y el término (𝜇𝜆|𝜈𝜎) representa las integrales de
intercambio, término puramente cuántico que surge como consecuencia de la antisimetría de
la función de onda.

La matriz de Fock y los orbitales dependen de los coeficientes de expansión de orbital


molecular, por ende no es lineal, y la ecuación 𝑭𝑪 = 𝑺𝑪𝜺 debe ser resuelta de forma iterativa
por medio del método de Campo Autoconsistente (Self-Consistent Field - SCF).

4
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

Procedimiento de cálculo:

 Se eligen las funciones base


 Calculan todas las integrales
 Se estiman los coeficientes de la
expansión de los orbitales
moleculares
 Se construye la matriz de Fock
 Se evalúa 𝐹𝐶 = 𝑆𝐶𝜀 y obtiene
una nueva matiz de coeficientes
con sus respectivas energías
 Se comprueba la convergencia
Figura 1 Representación gráfica del procedimiento de cálculo de los del proceso. En caso negativo se
coeficientes y energías de un sistema según teoría de Hartree-Fock
estiman nuevos coeficientes y se
repite el proceso
El método de Hartree-Fock incluye algo de correlación electrónica dinámica (donde el
movimiento de cada electrón está correlacionado con el movimiento de todos los otros
electrones) cuando el termino interectrónico del Hamiltoniano se sustituye por un campo
promedio, pero no la trata correctamente. El problema reside en que cuando para cumplir con
el requisito de antisimetría se forman los spin-orbital y se asignan los electrones en pares de
spin puesto, no se está contemplando la correlación entre ellos en la φ(r̅ ) y existe una
probabilidad de encontrar dos electrones de distinto spin en el mismo lugar del espacio,
sabiendo que esto no es posible. Se incluye correlación de Fermi (electrones igual spin) pero no
la correlación por las repulsiones de Coulomb (electrones distinto spin). La correlación no
dinámica (cuando dos o más determinantes de Slater son igualmente posibles) no se tiene en
cuenta ya que HF trabaja con un solo determinante, esto resulta inadecuado para describir
situaciones en las que hay varias configuraciones que están degeneradas o que tienen energías
muy próximas entre sí.

Para mejorar el tratamiento de la correlación electrónica surgieron distintos métodos:


Métodos post-HF
Métodos CI (Configuration Interaction - Interacción de Configuraciones)

Indican que la función de onda exacta no puede ser expresada como un único determinante
como lo asume la teoría de Hartree-Fock, entonces se proceden a construir otros determinantes
reemplazando uno o más orbitales ocupados en el determinante de Slater de H-F con orbitales
virtuales no ocupados. El método de interacción de configuraciones completo o full (FCI) forma
la función de onda 𝜑 como combinación lineal del determinante de Hartree-Fock y todos los
determinantes sustituidos posibles.

𝜑 = 𝑏0 𝜑0 + ∑ 𝑏𝑠 𝜑𝑠
𝑠>0

Donde s son todas las posibles sustituciones y los coeficientes b son aquellos a determinar
que minimizan la energía del sistema. 𝜑 es la función de onda exacta del sistema y representa
todos los estados electrónicos posibles para una molécula.

El número de determinantes de Slater que se puede construir para un sistema de N


electrones utilizando K funciones bases corresponde al número de formas de distribuir esos
electrones en 2K spin-orbitales

5
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

2𝐾 2𝐾!
( )=
𝑁 𝑁! (2𝐾 − 𝑁)!
Este número aumenta rápidamente al aumentar el número de electrones del sistema y el
número de funciones base, lo cual hace que el proceso sea computacionalmente muy costoso.
Por ende, normalmente se usan los métodos CI truncados, incluyendo solo algunas de las
configuraciones excitadas pero el problema es que no son consistentes en tamaño: las energías
de dos sistemas calculadas a una separación grande en la que no interaccionan no es igual a la
suma de los sistemas separados. Se han desarrollado variantes que corrigen esto.

Métodos Perturbativos de Møller-Plesset

Agrega estados de excitación más altos a la teoría de Hartree-Fock como una corrección no
iterativa. Se basa en dividir el Hamiltoniano exacto en dos partes:

𝐻 = 𝐻0 + 𝜆𝑉 𝐻0 = ∑𝑖 𝐹 𝑖

Donde 𝐻0 es la suma de los operadores de Fock monoelectrónicos (el operador de Fock


actuando en el iésimo electrón). 𝜆𝑉 es una perturbación q se define pequeña en comparación a
𝐻0 . Las autofunciones de 𝐻0 forman un conjunto ortogonal y completo, y la autofunciones
exactas 𝜑𝑖 se pueden expresar como combinación lineal de ellas. Esto permite desarrollar las
autofunciones y los autovalores del 𝐻 exacto como series de Taylor en 𝜆.

𝐻0 𝜑𝑛 0 = 𝐸𝑛 0 𝜑𝑛 0 𝜑𝑖 = ∑𝑛 𝜆𝑛 𝜑𝑖 (𝑛) 𝐸𝑖 = ∑𝑛 𝜆𝑛 𝐸𝑖 (𝑛)

𝐻𝜑(𝑛) = 𝐸𝑛 𝜑(𝑛)

Donde 𝐸𝑖 (𝑛) es la energía a orden 𝑛 = 1,2,3 …. y 𝜑𝑖 (𝑛) son los determinantes de Slater
generados por incluir de estados excitados de orden 𝑛.

De reemplazar 𝐻, 𝜑𝑖 y 𝐸𝑖 en la ec. de Schrödinger y haciendo 𝜆 = 1, surgen una serie de


ecuaciones sucesivas q representan ordenes de perturbación 𝑛 cada vez más altos, donde la de
orden cero 𝑛 = 0 es simplemente la ecuación de Schrödinger para el sistema no perturbado.

Luego, la corrección a la energía de primer orden (MP1, 𝑛 = 1) termina devolviendo la


energía de HF.

𝐸𝑖 (1) = 〈𝜑𝑖 (0) |𝑉|𝜑𝑖 (0) 〉


(0) (1)
𝐸𝑖 + 𝐸𝑖 = 〈𝜑𝑖 (0) |𝐻0 |𝜑𝑖 (0) 〉 + 〈𝜑𝑖 (0) |𝑉|𝜑𝑖 (0) 〉 = 〈𝜑𝑖 (0) |𝑯|𝜑𝑖 (0) 〉 = 𝐸 𝐻𝐹
A partir de la corrección de segundo orden (MP2, 𝑛 = 2) se incluye la correlación
2
|𝜑𝑖 (0) |𝑉|𝜑𝑛(0)|
electrónica. 𝐸𝑖 (2) = 〈𝜑𝑖 (0) |𝑉|𝜑𝑖 (1) 〉 = ∑𝑛
𝐸𝑖(0)−𝐸𝑛 (0)

2
|𝜑𝑖 (0) |𝑉|𝜑𝑛 (0) |
𝐸 (𝐻𝐹) + 𝐸 (2) = 〈𝜑𝑖 (0) |𝐻|𝜑𝑖 (0) 〉 + ∑
𝑛
𝐸𝑖 (0) − 𝐸𝑛 (0)

Como el estado fundamental es el determinante de Hartree-Fock, y los estados excitados son


del Hamiltoniano, se escriben como combinación de determinantes de Slater correspondientes
a excitaciones simples, dobles, etc.

6
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

La introducción de correlación en los cálculos de segundo orden (MP2) o de mayor solo tiene
utilidad si se emplea una base suficientemente buena. Si se emplea una base “pobre” (como las
STOnG), suelen obtenerse resultados peores que los del método de Hartree-Fock.

Métodos DFT (Density Functional Theory - Teoría del Funcional de Densidad)10

La teoría del funcional de densidad está basada en modelar la energía de la nube electrónica
del sistema con una función de densidad electrónica.

Hohenberg y Khon desarrollaron dos teoremas que se pueden resumir en uno solo, que
afirma la existencia de un único funcional de densidad electrónica que minimiza la energía del
estado fundamental de forma exacta, y que cada densidad fundamental determina salvo una
constante el potencial externo del sistema de partículas interactuantes. La energía entonces se
puede escribir como:

𝐸(𝜌) = 𝑇(𝜌) + 𝐸𝑒𝑁 (𝜌) + 𝐸𝑒𝑒 (𝜌)

Donde el término 𝑇 es la energía cinetica real que surge del movimiento de los electrones,
𝐸𝑒𝑁 es la energía potencial de la atracción nucleo-electrón y 𝐸𝑒𝑒 la interacción electrón-electrón.
Esto sienta las bases para el correcto tratamiento de la correlacion electronica, aunque no define
la forma exacta del funcional o como sustituirlo.

Para solucionar esto, Khon y Sham condideraron un sistema de 2N electrones sin intraccionar
descrito por ciertos orbitales 𝜙𝑖 , de forma que la densidad electronica de ese sistema coincida
con la del sistema real (donde si hay intracciones).
𝑁

𝜌𝑜 (𝑟) = 2 ∑ |𝜙𝑖 |2 = 𝜌(𝑟)


𝑖=1

Y separaron el funcional de energía en términos que se pueden calcular exactamente mas un


nuevo término que llamaron de correlación e intercambio:

𝐸(𝜌) = 𝑇𝑠 (𝜌) + 𝐸𝑒𝑁 (𝜌) + 𝐽(𝜌) + 𝐸𝑋𝐶 (𝜌)


El término 𝑇𝑠 es una aproximacion a la energía cinetica real 𝑇, ya que 𝜌 se aproxima mediante
𝜌𝑜 , que corresponde a un sistema sin interaccion electrónica, 𝐸𝑒𝑁 es la energía potencial de la
atracción nucleo-electrón, 𝐽 corresponde a la interaccion de Coulomb clásica, y 𝐸𝑋𝐶 es el
termino de intercambio y correlación,que es un ajuste a la energía cinetica aproximada,
englobando aquella que no se tuvo en cuenta por asumir un sistema de partículas
independientes (correlación dinámica en el movimiento de los electrones individuales) y la
energía de interacción electrón-electrón no clásica que surge de la antisimetría de la función de
onda.

La dificultad en esta metodología reside en encontrar expresiones adecuadas para 𝐸(𝜌),


pero asumiendo que se conoce dicho funcional, el problema se resuelve encontrando el
conjunto de orbitales 𝜙𝑖 ortogonales que minimicen la energía del sistema de forma iterativa
por el método de campo autoconsistente.

Aunque no se conoce el valor real del funcional de densidad se puede aproximar con varios
métodos para conseguir valores muy cercanos a los de energías y densidades reales. Se han
desarrollado distintos tipos de funcionales, los cuales se pueden agrupar en tres categorías,
dependiendo de las aproximaciones utilizadas para estimar 𝐸𝑋𝐶 (𝜌).

7
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

𝐸𝑋𝐶 (𝜌) se divide en un funcional de intercambio y otro de de correlación:

𝐸𝑋𝐶 (𝜌) = 𝐸𝑋 (𝜌) + 𝐸𝐶 (𝜌)

 Aproximación de la densidad local

Consiste en suponer que en cada punto, la energía de intercambio y correlación depende


sólo de la densidad en ese punto. Para expresar el funcional de intercambio se considera un
gas uniforme de electrones cuya densidad que viene dado por la fórmula de Dirac:
1
9𝛼 3 3 1
𝐸𝑋𝐿𝐷𝐴 [𝜌(𝑟)] =− ( ) 𝜌3 (𝑟)
8 𝜋
Con 𝛼 = 1 para el modelo de Slater (S)

Un funcional de correlación importante dentro de esta aproximación es el desarrollado por


Vosko, Wilk y Nusair (VWN).

Los métodos DFT se definen combinando un funcional de intercambio con uno de


correlación, la combinación los previos mencionados da origen al funcional SVWN.

 Aproximación del gradiente generalizado

Considera que el potencial (ya sea de correlación o intercambio) en cada punto es


funcional de la densidad y sus gradiente. Se expresa como una expansión de Taylor:

𝐺𝐺𝐴 𝐿𝐷𝐴
|∇𝜌(𝑟)|
𝐸𝑋/𝐶 [𝜌(𝑟)] = 𝐸𝑋/𝐶 [𝜌(𝑟)] + ∆𝐸𝑋/𝐶 [ ]
𝜌4/3 (𝑟)

Para algunas propiedades estas aproximaciones dan mejores resultados que LDA, en
particular para geometrías moleculares y energías del estado fundamental.

Becke formuló un funcional de intercambio en 1988 por corrigiendo 𝐸𝑋𝐿𝐷𝐴 por fiteo con 6
gases nobles, logrando remediar muchas de las deficiencias de los funcionales de aproximación
de densidad local. Hoy sigue siendo ampliamente utilizado
4
𝜌3 𝑥 2 4
𝑋
𝐸𝐵𝑒𝑐𝑘𝑒88 = 𝑋
𝐸𝐿𝐷𝐴 −𝛾 ∫ 𝑑3 𝑟̅ 𝑐𝑜𝑛 𝑥 = 𝜌−3 |∇𝜌|
(1 + 6𝛾𝑠𝑖𝑛ℎ −1 𝑥)
Lee, Yang y Parr desarrollaron el funcional de correlación LYP en 1988, y es uno de los más
usados entre aquellos que no son correcciones a modelos locales.

Un funcional DFT muy usado de intercambio y correlación es BLYP.

 Funcionales Híbridos

Se sabe por lo visto anteriormente que la teoría de Hartree-Fock incluye un término de


intercambio en su formalismo. Becke formuló funcionales de intercambio como una
combinación del intercambio tradicional proveniente de Hartree-Fock y el proveniente de la
teoría DFT, junto con funcionales de correlación DFT, de la forma:
𝑋𝐶 𝑋 𝑋𝐶
𝐸ℎ𝑖𝑏𝑟𝑖𝑑𝑜 = 𝑐𝐻𝐹 𝐸𝐻𝐹 + 𝑐𝐷𝐹𝑇 𝐸𝐷𝐹𝑇

Donde 𝑐’s son constantes que parametrizan el aporte de Hartree-Fock y DFT al funcional
hibrido.

8
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

Becke logró así, entre otros, uno de los funcionales más exitosos y comúnmente
empleados, hibrido de tres parámetros ajustados empíricamente: B3LYP
𝑋𝐶 𝑋 𝑋 𝑋 ) 𝑋 𝐶 𝐶 𝐶
𝐸𝐵3𝐿𝑌𝑃 = 𝐸𝐿𝐷𝐴 + 𝑐0 (𝐸𝐻𝐹 − 𝐸𝐿𝐷𝐴 + 𝑐𝑋 ∆𝐸𝐵88 + 𝐸𝑉𝑊𝑁3 + 𝑐𝐶 (𝐸𝐿𝑌𝑃 − 𝐸𝑉𝑊𝑁3 )

Donde 𝑐0 = 0.2, 𝑐𝑋 = 0.72 y 𝑐𝐶 = 0.81

Los cálculos DFT se resuelven de la misma forma que los de Hartree-Fock, y su el costo
computacional es similar, pero con la diferencia de que sí incluyen la correlación electrónica
(de forma aproximada a través de la aproximación del funcional de densidad).

iii. Cálculos Cuánticos de RMN


Etapas para el cálculo de RMN10b

1-Seleccionar la molécula objetivo

2-Optimización de la geometría

Se encuentran las coordenadas nucleares que minimizan la energía del sistema por métodos
de mecánica molecular, semiempíricos, ab initio o DFT.

3-Cálculo de las constantes de apantallamiento de RMN


𝛾𝐴 𝐵0,𝑧
La frecuencia de resonancia 𝜈𝐴 = de un núcleo magnético A en un campo magnético
2𝜋
externo 𝐵0 está determinada por su momento magnético 𝜇𝐴 = 𝛾𝐴 𝑰𝐴 , el cual esta relacionado
con el spin nuclear 𝑰𝐴 y la relación giromagnética 𝛾𝐴 .

En moléculas reales, la aplicación de 𝐵0 induce corrientes electrónicas, que general un campo


magnético local adicional.

En sistemas no simétricos esféricamente:

𝐵𝑙𝑜𝑐𝑎𝑙 = (1 − 𝜎 𝑡𝑜𝑡,𝐴 )𝐵0 con 𝜎 𝑡𝑜𝑡,𝐴 = 𝜎 𝑑𝑖𝑎𝑚𝑎𝑔,𝐴 + 𝜎 𝑝𝑎𝑟𝑎𝑚𝑎𝑔,𝐴 donde 𝜎 es el tensor


de desplazamiento magnético.

El tensor de apantallamiento se calcula como:

𝐴 𝜕 2 𝐸(𝜇⃗𝐴 , 𝐵0 )
𝜎𝛼𝛽 = | 𝛼, 𝛽 = 𝑥, 𝑦, 𝑧
𝜕𝜇𝛼 𝜕𝐵𝛽 𝜇⃗⃗
𝑛 𝑦 𝐵0 →0

Invariancia gauge11

Usando un set de bases infinito, el tensor de apantallamiento es independiente de 𝑅0 , que


es el origen arbitrario gauge del vector de potencial, pero en la práctica los set de bases son
finitos. Esta dependencia de 𝜎 con la posición de la molecula en el campo magnetico se puede
solucionar por medio de varios métodos, por ejemplo GIAO (Gauge-Including Atomic Orbitals)
donde las funciones base atómicas dependen explícitamente del campo magnético, cancelando
la dependencia gauge de los resultados.

4-Cálculo de los desplazamientos químicos de RMN

𝑨
𝜈
6 𝐴
− 𝜈𝑟𝑒𝑓 𝛾 𝐵 (𝜎 𝑟𝑒𝑓 − 𝜎 𝐴 )
6 𝐴 0,𝑧
𝜹 = 10 = 10 ≃ 𝟏𝟎𝟔(𝝈𝒓𝒆𝒇 − 𝝈𝑨 )
𝜈𝑟𝑒𝑓 𝛾𝐴 𝐵0,𝑧 (1 − 𝜎 𝑟𝑒𝑓 )

9
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

Como valores de referencia usualmente se usan los tensores del TMS, aunque nuestro
grupo de trabajo desarrollo un método Multi-Standard (MSTD).

Cálculo de RMN en sistemas flexibles


Cuando se realizan mediciones de RMN en solución, la interconversión conformacional por
rotación de enlaces simples en una molécula es generalmente rápida, por ende los
desplazamientos químicos observados son el resultado de un promedio ponderado de todas las
conformaciones del compuesto. En un esfuerzo por reproducir esto en los cálculos de RMN, los
desplazamientos y constantes de acoplamiento de cada conformación individual deben ser
computados por separado. Luego, asumiendo equilibrio térmico, la contribución de cada
confórmero al valor final es dada por la correspondiente amplitud de Boltzmann, estimado de
las energías relativas calculadas a niveles de DFT (Density Functional Theory – Teoría del
Funcional de Densidad).7c

iv. Resultados Preliminares y Aportes del Grupo


MSTD
En nuestro primer acercamiento a la disciplina, desarrollamos una importante modificación
en el procedimiento empleado para extraer los tensores magnéticos (σ, la derivada segunda de
la energía respecto al campo magnético externo y al momento magnético nuclear) y
transformarlos en desplazamientos químicos (δ). Este método, denominado MSTD (multi-
standard approach)12 goza de buena popularidad entre la comunidad internacional especializada
en la disciplina.
RNAs
Hasta ese momento todos los métodos disponibles que involucraban los cálculos cuánticos
de RMN para la elucidación estructural (como CP3 y DP4) funcionaban por comparación entre
dos o más candidatos, determinando así la estructura más probable (i tiene más chance que j de
ser la estructura correcta).13 El parámetro CP3 fue diseñado para asignar dos sets de datos
experimentales a dos posibles estructuras,13a mientras que DP4 es especialmente muy útil en
los casos más complejos de productos naturales o reacciones orgánicas con niveles muy altos
de estereoselectividad, donde generalmente se tiene un solo set de datos experimentales.13b
Pero cuando se quiere realizar una validación estructural, la ausencia de al menos otra segunda
posible estructura hace imposible la aplicación de estos métodos.
Otro problema son los tiempos de optimización de geometrías y de los propios cálculos de
RMN. Aunque estos se pueden reducir utilizando niveles de teoría bajo, no se obtendrían buenas
predicciones, y hasta para la estructura correcta la correlación con los datos experimentales
puede llegar a ser baja. Por ende, la dificultad yace en decidir qué nivel de correlación entre los
datos de RMN experimentales y calculados es esperado para la decidir si esa estructura
propuesta es correcta o no.
Para poder llevar a cabo la validación estructural de forma rápida y eficaz, cuando existe una
sola estructura propuesta, se propone el uso de una red neuronal artificial (RNA), ya que una
de sus propiedades más relevantes es su habilidad de poder ser entrenada para aprender a
reconocer patrones, clasificar data y más.14 Las RNA son modelos matemáticos en los cuales un
número de neuronas artificiales interconectadas imitan el comportamiento de un cerebro
biológico.

La combinación exitosa de cálculos cuánticos químicos con RNA para enfrentar diferentes
problemas ha sido reportada previamente15 pero este es el primer reporte de su aplicación para
validación estructural utilizando cálculos cuánticos de RMN.

10
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

Para la construcción de la red, se definieron los 3 componentes principales: la capa de


entrada, la oculta y la de salida, todas completamente conectadas, es decir, cada nodo está
conectado a todos los nodos de la capa anterior (Figura 2).

Durante el entrenamiento supervisado, tanto la


información de entrada como de salida es dada a la ANN para
realizar un trabajo particular.

El set de entrenamiento se compuso por 100 compuestos


de pequeño a mediano tamaño de espectros de 13C son bien
conocidos. También se crearon estructuras virtuales
incorrectas modificando deliberadamente las estructuras
correctas, correlacionándolas con la data experimental de la
estructura original correspondiente.

Se evaluaron las RNA creadas en casos reales de


asignación estructural errónea, teniendo un desempeño
excelente, no solo dando evidencia de la capacidad de las
RNA entrenadas para identificar errores estructurales en
compuestos no utilizados en el training set, sino que también
validó el uso de estructuras incorrectas “virtuales” en este.
Figura 2 - RNA prealimentada de dos
capas

Más allá del desempeño excelente de las RNAs creadas, los casos de estereoisomería
presentan un mayor desafío ya que el estereoisómero propuesto puede no ser el correcto y aun
así presentar desplazamientos de RMN calculados que se correlacionan con la data experimental
de una manera similar a las estructuras del set de entrenamiento.

Para enfrentar esta limitación y llevar la propuesta un paso más adelante, se desarrollaron
poderosas RNA con una habilidad de clasificación mejorada y lo suficientemente poderosas para
detectar errores tan sutiles como los encontrados en errores de asignación entre regio- o
esteroisomeros. Los experimentos 2D C−H COSY (comúnmente conocidos como HSQC) se
utilizaron como modelo para que el análisis de reconocimiento de patrones sea
multidimensional, y se incluyeron también los experimentos unidimensionales de RMN de 1H
NMR (y su correspondiente correlación con RMN de 13C) ya que se estableció que la información
proveniente de los espectros de RMN de 1H es la que tiene mayor peso en la decisión para la
elucidación estructural.16

Las redes nuevas fueron creadas y entrenadas de manera similar a las de primera generación,
y para validarlas, se evaluó su desempeño en pares diasteroisoméricos. Los resultados fueron
extremadamente satisfactorios en cuanto a la habilidad de reconocer patrones en moléculas
que no forman parte del set de entrenamiento.

Se demostró finalmente que usando una ANN con reconocimiento de patrón


multidimensional mediado de 2D C−H COSY experimentales y calculados se pueden identificar
errores en asignaciones estructurales muy sutiles como entre regio y estereoisómeros.

En ambos casos se lograron crear, entrenar y validar redes neuronales que mostraron una
sorprendente capacidad de clasificación cuando fueron evaluadas en numerosos casos reales de
productos naturales originalmente mal asignados.

11
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

DP4+
Otro importante avance realizado en esta temática fue el desarrollo de una metodología
denominada DP4+,17 una versión mejorada del método DP4 creado por el grupo de Goodman
(Cambridge University) para facilitar la asignación estereoquímica de moléculas orgánicas
complejas.13b

Fundamentos de DP413b

Smith y Goodman demostraron que los errores entre los desplazamientos químicos
calculados y experimentales escalados (e = δs − δexp) para un ser de moléculas orgánicas
obedece una distribución t de Student con media μ = 0, desvío estándar σ, y grados de libertad
ν. Para una molécula con N núcleos, la probabilidad de casa iesimo error puede ser computada,
y asumiendo que los errores son variables independientes, la productoria de cada iesima
probabilidad da como resultado la probabilidad de cada estructura candidata. Luego, usando
como base el teorema de Bayes, la probabilidad porcentual de que cada candidato sea el
isómero correcto es:

∏𝑁 𝜈 𝑖
𝑘=1(1 − 𝑇 (𝛿𝑠,𝑘 − 𝛿𝑒𝑥𝑝,𝑘 )/𝜎)
𝑃(𝑖 ) =
∑𝑚 𝑁 𝜈 𝑖
𝑗=1[∏𝑘=1(1 − 𝑇 (𝛿𝑠,𝑘 − 𝛿𝑒𝑥𝑝,𝑘 ) /𝜎)]

donde P(i) es la probabilidad de la que la iésima estructura (de entre los posibles candidatos)
sea la correcta.

Tv es la función de distribución t acumulada con ν grados de libertad y variancia σ. δexp,k es


el desplazamiento químico experimental para los núcleos k (hasta N) y δs,k representa el
desplazamiento químico calculado para los núcleos k (hasta N) luego del escalado empírico para
eliminar los errores sistemáticos de acuerdo a la ecuación δs = (δcalc − b)/m, donde b y m son
la ordenada al origen y la pendiente del grafico δcalc vs δexp.

Los términos claves σ y ν para el cálculo de la probabilidad DP4+ deben ser determinados por
el ajuste de los datos (errores entre los desplazamientos calculados y experimentales) de un
gran set a una distribución t usando programas estadísticos específicos. En particular, Smith y
Goodman computaron los desplazamientos para miles de moléculas usando cálculos GIAO de
RMN al nivel de teoría B3LYP/631G**//MMFF (fase gaseosa).

Desarrollo de DP4+
Identificamos dos potenciales inconvenientes en el desarrollo de DP4:
 El nivel de teoría B3LYP/6-31G**//MMFF utilizado para los cálculos de RMN no es el
más preciso,18particularmente para la predicción de desplazamientos de 1H.16
 El escalado lineal para eliminar los errores sistemáticos en los desplazamientos asume
que la magnitud de un error es independiente del entorno químico (por ejemplo la
hibridación de 13C), y generalmente no es así.

Entonces consideramos que computar los desplazamientos químicos de RMN a niveles de


teoría más altos, y agregar desplazamientos no escalados (“puros”) llevaría a probabilidades DP4
más confiables.
Después de evaluar 24 niveles de teoría, el que demostró llevar a mejores resultados fue
PCM/mPW1PW91/6-31+G**//B3LYP/6-31G*.

12
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

Figura 3 - Distribución de los errores de los desplazamientos químicos de 13C escalados (A) y no escalados (B)
calculados al nivel de teoría B3LYP/6-31G*//B3LYP/6-31G*

Cuando se procedió a evaluar la distribución de los errores no escalados del “test set”, se
encontró que no seguían una distribución t de Student, y se sospechó que se debía a los
errores en carbonos de hibridación sp2 y sp3 (o a protones enlazados a esos carbonos sp2 o
sp3). Luego de separar los datos y analizarlos, se encontró que cada serie (sp2 y sp3) seguían
individualmente distribuciones t.

Este descubrimiento permitió entonces postular la formulación matemática para la nueva


probabilidad DP4+:
∏𝑁 𝜈 𝑖 𝜈 𝑖
𝑘=1[1 − 𝑇 𝑠 (𝑒𝑠,𝑘 /𝜎𝑠 )][1 − 𝑇 𝑢−𝑠𝑝𝑥 ((𝑒𝑢,𝑘 − 𝜇𝑢−𝑠𝑝𝑥 )/𝜎𝑢−𝑠𝑝𝑥 )]
𝑃 (𝑖 ) = 𝑚
∑𝑗=1[∏𝑁 𝜈 𝑖 𝜈 𝑖
𝑘=1[1 − 𝑇 𝑠 (𝑒𝑠,𝑘 /𝜎𝑠 )][1 − 𝑇 𝑢−𝑠𝑝𝑥 ((𝑒𝑢,𝑘 − 𝜇𝑢−𝑠𝑝𝑥 )/𝜎𝑢−𝑠𝑝𝑥 )]

Y esta puede ser descompuesta en dos: sDP4+ y uDP4+, donde el primer término indica la
probabilidad que se obtiene cuando se utilizan exclusivamente los datos escalados (como en el
caso de DP4), y el segundo cuando solo se usan los datos no escalados:

∏𝑁 𝜈 𝑖
𝑘=1[1 − 𝑇 𝑠 (𝑒𝑠,𝑘 /𝜎𝑠 )]
𝑃 (𝑖 ) =
∑𝑚 𝑁 𝜈 𝑖
𝑗=1[∏𝑘=1[1 − 𝑇 𝑠 (𝑒𝑠,𝑘 /𝜎𝑠 )]

∏𝑁 𝜈 𝑖
𝑘=1[1 − 𝑇 𝑢−𝑠𝑝𝑥 ((𝑒𝑢,𝑘 − 𝜇𝑢−𝑠𝑝𝑥 )/𝜎𝑢−𝑠𝑝𝑥 )]
𝑃(𝑖 ) =
∑𝑚 𝜈 𝑖
𝑗=1[1 − 𝑇 𝑢−𝑠𝑝𝑥 ((𝑒𝑢,𝑘 − 𝜇𝑢−𝑠𝑝𝑥 )/𝜎𝑢−𝑠𝑝𝑥 )]

Asumiendo que la estructura propuesta i es la correcta, la probabilidad de obtener un dado


set de errores escalados (es = δs − δexp) y no escalados (eu = δu − δexp) está dada por la productoria
de cada termino de probabilidad independiente [1 − Tν(e −μ)/σ)], calculados para cada
desplazamiento escalado y no escalado.
En este caso, los valores μu‑spx, σu‑spx , and νu‑spx dependen de la hibridación del nucleo.Tvu‑sp2,
μu‑sp2, y σu‑sp2 son las funciones t acumuladas con ν grados de libertad centradas en μ y variancia
σ correspondientes a los carbonos sp2 no escalados (o los hidrógenos unidos a carbonos sp2). De
igual forma para los carbonos sp3.

Se evaluó el desempeño de la nueva y mejorada probabilidad DP4+ en un set de ejemplos


estereoquimicamente desafiantes, para los cuales el método original DP4 no resulta
satisfactorio (algunos incluidos en la publicación de su desarrollo).

13
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

Desde su publicación a finales de 2015, DP4+ ha sido empleado extensamente en la


elucidación estructural de una gran variedad de productos naturales y sintéticos. 19

Más recientemente, hemos validado DP4+ como método computacional para determinar la
configuración relativa de 32 epóxidos quirales.20

La figura 5 muestra la cantidad de


aciertos de las distintas probabilidades DP4+
(escalada, no escalada, 1H y 13C) entre los 31
ejemplos evaluados. DP4+ tuvo un
desempeño excelente para asignar la
configuración relativa de epóxidos spiro o
terminales. El mejor resultado (las 32 de
asignaciones correctas, 30 de ellas con
probabilidad DP4+>95%) se obtuvo
Figura 4 - Desempeño de las probabilidades DP4+ para los utilizando toda la data, 1H y 13C, junto con los
31 compuestos estudiados desplazamientos escalados y no escalados.

J-DP4

Tradicionalmente la determinación de configuraciones relativas se determina por


experimentos basados en constates de acoplamiento J hetero y homonucleares (3JHH; 2,3JCH) y/o
experimentos de efecto nuclear Overhauser (NOE).
Como se expresó anteriormente17 una de las principales fuentes de error en el análisis DP4
está relacionado a la capacidad del nivel de teoría utilizado (B3LYP/6-31G**//MMFF) para
representar la real distribución conformacional de la molécula en estudio.21 Entonces, aquellos
compuestos más flexibles generalmente presentan mayores errores y por ende peores
resultados en las predicciones.
Métodos mejorados (como nuestro DP4+ o DP4.2 por el mismísimo grupo de Goodman22 se
basan en agregar un paso extra de reoptimización de las geometrías como también un mejor
tratamiento de los cálculos de GIAO RMN, resultando en mejor desempeño pero
computacionalmente más costoso.
Propusimos entonces incorporar la información de 3JHH en el método DP4 original de manera
directa (dJ-DP4), y de manera indirecta (iJ-DP4).
En dJ-DP4 los valores de δH, δC, y 3JHH son computados a niveles DFT para luego ser
correlacionados con los valores experimentales a través de una ecuación obtenida de modificar
el formalismo del DP4 original para incorporar la probabilidad de la diferencia entre los valores
de 3JHH calculados y experimentales.

∏𝑁
𝑘=1 (1 − 𝑇
𝜈,𝛿 (𝛿 𝑖 𝑂 𝜈,𝐽 𝑖
𝑠,𝑘 − 𝛿𝑒𝑥𝑝,𝑘 )/𝜎𝛿,𝑠 ) ∏𝑘=1(1 − 𝑇 (𝐽𝑠,𝑘 − 𝐽𝑒𝑥𝑝,𝑘 )/𝜎𝐽,𝑠 )
𝑑𝐽 − 𝐷𝑃4(𝑖 ) =
∑𝑚 𝑁
𝑗=1[∏𝑘=1(1 − 𝑇
𝜈,𝛿 (𝛿 𝑖 − 𝛿
𝑠,𝑘
𝑂 𝜈,𝐽 𝑖
𝑒𝑥𝑝,𝑘 ) /𝜎𝛿,𝑠 ) ∏𝑘=1(1 − 𝑇 (𝐽𝑠,𝑘 − 𝐽𝑒𝑥𝑝,𝑘 )/𝐽𝛿,𝑠 )]

En el método iJ-DP4, los valores experimentales de 3JHH se usan para incorporar restricciones
geométricas a las distribuciones conformacionales: se calculan los desplazamientos químicos
solo para las conformaciones compatibles con los valores de 3JHH observados, que luego son
sometidas al tratamiento DP4 estándar.

Para evaluar ambas metodologías se seleccionó un set de ejemplos con variada complejidad
molecular y libertad conformacional. Los resultados se reflejan en la figura 6.

14
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

dJ-DP4 presentó una significante mejora con respecto a DP4 (asignando correctamente el
96% de los ejemplos vs 75 % para DP4). En solo 3 casos la probabilidad dJ-DP4 fue ligeramente
menor que el DP4 original, pero aun así el isómero correcto seguía siendo el más probable.
iJ-DP4 con dos valores 3JHH duplicó el número de aciertos y disminuyó en un 80% el costo
computacional. Esta metodología resultaría muy práctica para estudiar sistemas de gran tamaño
que requieren largos tiempos de cálculo.

Figura 5 – Mejora en el desempeño y costo computacional (relativo al método DP4 original)

Luego, se propuso la alternativa iJ/dJ-DP4 combinando las dos estrategias, donde los valores
3
JHH relevantes guían la búsqueda conformacional, y se realizan los cálculos de RMN para
aquellas conformaciones resultantes para proceder luego con el análisis dJ-DP4. Al usar un único
valor de 3JHH, iJ/dJ-DP4 dio un nivel de aciertos 2.3 veces mayor que DP4 original por el doble del
costo computacional. Pero al usar dos valores de 3JHH, el nivel de aciertos fue 2.5 veces mayor
que DP4, a un menor costo computacional.

Nuestra experiencia y logros alcanzados nos permitieron asociarnos a numerosos grupos de


investigación del país y del extranjero a través de fructíferas colaboraciones. De ellas, se destaca
la establecida con el grupo del Prof. Ronaldo Pilli (UNICAMP, Brasil), con quien hemos realizado
importantes avances en el campo de la síntesis total de productos naturales guiada por
computadoras.23

Resulta asimismo importante de destacar que todos estos desarrollos (ANN-PRA, DP4+)
fueron pensados para facilitar los procesos de elucidación estructural de moléculas complejas.
Por tal motivo, y para garantizar la implementación de estas metodologías, dedicamos gran
esfuerzo en volcar los complejos sistemas de ecuaciones en hojas de cálculo de Excel (ofrecidas
gratuitamente como información complementaria de los trabajos publicados).5,17

2. Objetivos
i. Objetivos Generales
El presente proyecto se basa en el estudio y desarrollo de novedosas herramientas
computacionales basadas en la química cuántica que faciliten los procesos de elucidación
estructural y estereoquímica de productos naturales y sintéticos complejos.

ii. Objetivos Específicos


De acuerdo a los objetivos generales formulados, y en virtud de los importantes logros
obtenidos con nuestra probabilidad DP4+, nos proponemos continuar avanzando en esta

15
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

temática mediante el estudio y desarrollo de nuevos y mejores métodos probabilísticos para la


elucidación estructural y estereoquímica de moléculas orgánicas complejas. Los objetivos
específicos del plan de tesis son:

 Desarrollo de DP4+ para moléculas altamente polares (w-DP4+)


 Desarrollo de DP4+ en sistemas perturbados (p-DP4+)
 Desarrollo de DP4+ con incorporación de análisis de J (j-DP4+)
 Empleo en la elucidación estructural de productos naturales.

3. Resultados y discusiones
Es reconocido que la elucidación estructural por medio de cálculos de RMN en sistemas
flexibles tiene una complicación adicional.24 La interconversión conformacional es rápida
comparada con el tiempo de experimentos de RMN, por ende los desplazamientos químicos
observados son un promedio ponderado de todas las conformaciones. Para reproducir este
efecto en los cálculos de RMN, los desplazamientos y los acoplamientos escalares J de cada
conformación individual son calculados por separado y la contribución de cada confórmero es
dada por su correspondiente amplitud de Boltzmann (wi), proveniente de las energías relativas
calculadas a niveles de DFT.7c Por ende, inconvenientes pueden presentare cuando esas energías
son pobremente estimadas.

Para sistemas flexibles con la posibilidad de formar puentes de hidrogeno intramoleculares,


su paisaje conformacional real en solventes próticos es un fino balance entre puentes de
hidrogeno intra- e intermoleculares.25 Los métodos DFT más populares tienden a sobreestimar
la contribución de las conformaciones con puentes de hidrogeno intramoleculares (PHI),
obteniéndose así modestas estimaciones de RMN, esta situación se ve simplificada en la Figura
7.

Figura 6 Situación conformacional de compuestos polihidroxilados flexibles en solventes próticos.

La inclusión explicita del solvente podría ser una solución,26 pero el incremento del costo
computacional lo haría inviable y por ello, el efecto del solvente en moléculas polihidroxiladas
se incluye típicamente de forma implícita con PCM 27 (polarizable continuum model) o modelos
similares.28

La limitación de DFT para reproducir correctamente la dinámica conformacional de sistemas


flexibles ha sido ampliamente reconocida,29 y distintos enfoques han sido desarrollados para
mitigar la fuente del error.17,29c,d,30Aun así, no se ha encontrado solución para la asignación in
silico adecuada de moléculas polares flexibles con la capacidad de formar puentes de hidrogeno
intramoleculares usando solo valores de 1H y 13C.

16
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

En esta primera instancia del presente trabajo de tesis, y con el objetivo de mitigar la fuente
de error en los puentes de hidrógenos intramolecuares, nos remitimos a las conocidas
hiacintacinas y evaluamos distintos niveles de teoría para así refinar las amplitudes de
Boltzmann de las conformaciones, lo que a su vez nos daría una mejor idea de la incertidumbre
energética en DFT.
OH OH OH OH
1
7
7a
6 2 OH OH OH OH
N 3 N N N
5
CH2OH CH2OH CH2OH CH2OH
8 3
1 2 4
Natural A1 Natural A2

OH OH OH OH

OH OH OH OH
N N N N
CH2OH CH2OH CH2OH CH2OH
5 6 7 8

Figura 7 Isómeros de las hiacintacinas naturales A1 y A2 inicialmente evaluados

Inicialmente, exploramos ampliamente los paisajes conformacionales de los compuestos 1-8


(Figura 8) con 4 populares funcionales DFT (mPW1PW91,31 B3LYP,32 M06-2X33 y ωB97XD34) y dos
modelos de solvatación: el ampliamente usado PCM (recomendado para DP4.222 y DP4+,17 entre
otros) y SMD, una variante de PCM que descompone la energía de solvatación en la contribución
general electrostática SCRF y las interacciones de corto alcance soluto-solvente en la primera
capa de solvatación.35

Se observaron marcadas diferencias en las distribuciones de Bolzmann respecto al nivel de


teoría del solvente utilizado, con R2 entre 0.04 y 0.27 correlacionando PCM con SMD, mientras
que el efecto de los distintos funcionales fue más modesto. (Figura 9)

Figura 8 Valores de regresión R2 obtenidos al correlacionar los factores wi para los compuestos 1-8 usando cuatro
funcionales (A: mPW1PW91; B: B3LYP; C: M06-2X; D: ωB97XD) y dos modelos de solvatacion (PCM y SMD) con las
funciones base 6-31+G** y geometrías optimizadas al nivel B3LYP/6-31G*.

Similares resultados se obtuvieron con el set completo de isómeros de la familia de las


hiacintacinas (compuestos 1-168 – Figura 10).

17
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

Como una tendencia general, PCM


mostró mayores ventanas energéticas
en los isómeros, con barreras más
profundas en la superficie de potencial y
menor número de conformaciones
significantemente contribuyentes que
SMD, consistente con reportes previos.36
La gran diferencia entre los paisajes
conformacionales de ambos modelos de
solvatación (mas realístico en el caso de
SMD) está principalmente relacionada
con la tendencia de PCM a sobreestimar
Figura 9 Posibles isómeros de la familia de las hiacintacinas la estabilidad de las conformaciones con
puentes de hidrogeno intramoleculares.
Esto se ilustra en la figura 11.

Figura 10 (a) Grafica de dispersión de las amplitudes de Boltzmann computadas para los compuestos 1−168 a los
niveles PCM/mPW1PW91/6-31+G**//B3LYP/ 6-31G* (eje X) y SMD/B3LYP/6-31+G**//B3LYP/6-31G* (eje Y). (b)
Distribución conformacional del compuesto 6 calculado a los niveles PCM/mPW1PW91/6-31+G**//B3LYP/6-31G* y
SMD/ mPW1PW91/6-31+G**//B3LYP/6-31G*. Se muestran también conformaciones seleccionadas con sus
poblaciones relativas entre paréntesis.

El cálculo de la energía al nivel SMD mejoró considerablemente los resultados, pero no pudo
revertir exitosamente las tendencias energéticas de conformaciones espurias en algunos
isómeros, los cuales siguieron siendo incorrectamente asignados para ambos métodos (6-9 para
DP4 y 3-4 para DP4+).

18
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

Ante este escenario, exploramos una estrategia complementaria más drástica, excluyendo
completamente las energías dadas por los cálculos DFT (claramente la fuente del problema), y
en cambio creando y evaluando diferentes ensambles con amplitudes conformacionales
aleatorias y luego promediando los resultantes valores de DP4/DP4+ (Figura 12).

Figura 11 Generación aleatoria de ensambles.

Esto implica romper con el enfoque tradicional de apoyarse en los resultados provenientes
de un único ensamble (ya sea generado con energías DFT o por ajuste). Mientras que un
ensamble individual puede eventualmente llevar a una predicción tipo DP4 incorrecta,
especulamos que los resultados provistos por un gran set de ensambles podría reflejar la
asignación correcta. Las distintas amplitudes fueron generadas por combinación de dos
variantes: 1) la generación aleatoria de subconjuntos removiendo conformaciones y 2)
colocación de energías arbitrariamente en las conformaciones restantes. 15 estrategias fueron
consideradas en este contexto, y cada una fue testeada luego de 1 millón de iteraciones por
isómero candidato usando un Script de Matlab de nuestra creación.

Figura 12 Resultados DP4/DP4+ obtenidos de correlacionar los datos experimentales de 40 hiacintacinas conocidas
con los datos de los compuestos 1 -168 calculados con distintos ensambles.

19
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

El desempeño de los ensambles aleatorios fue excelente con 100% de los compuestos
correctamente clasificados por DP4 y DP4+ (figura 13). La naturaleza estocástica del método no
permitió llegar a valores extremos de probabilidad (<99%), pero no se ve como una desventaja
ya que es sabido DP4 y DP4+ tienden a sobreestimar los valores de probabilidad.6b Los diferentes
ensambles devolvieron valores diferentes pero similares cualitativamente, indicando la
posibilidad de seleccionar unos pocos para realizar el análisis. También, las mismas tendencias
se observaron utilizando menos iteraciones (solo 1000 iteraciones llevaron estadísticamente a
los mismos resultados), lo cual puede ser implementado fácilmente en Matlab, Python o
ambientes similares, demandando solo algunos minutos en computadoras estándar. Con estos
resultados en mano, concluimos que esta metodología representa una estrategia simple, fácil
de llevar a cabo y conceptualmente diferente para fortalecer (o desafiar) la asignación
estereoquímica llevada a cabo bajo los formalismos estándar de DP4/DP4+ o sus variantes SMD.

Figura 13 Verificación o reasignación estereoquímica de hiacintacinas naturales

También aplicamos esta metodología para reafirmar la estructura correcta de 8 hiacintacinas


naturales cuyas estructuras habían sido rechazadas por síntesis total (C1, C3, C5 y B7) o estaban
pendientes de verificación (A4, A5, B6 y C4) (figura 14).

Durante la escritura del manuscrito correspondiente a esos hallazgos, al realizar el


aislamiento y elucidación de leptazolina A (169 - Figura 15) una publicación de Philip G. Williams
y colegas generó un gran debate en la comunidad científica.37 Ellos descubrieron una falla en un
script parte del famoso protocolo de Nature Protocols de 2014 reportado por WIlloughby,
Jansma y Hoye (WJH),7c que junta toda la información de los outputs de RMN. Bajo el sistema
operativo de Linux, el script de WJH devuelve valores de RMN calculados incorrectamente a
causa de un mal emparejamiento de los valores de energía y tensores de apantallamiento de las
confórmeros. Esto puede llevar a asignaciones estructurales erróneas, y fue sugerido entonces
que las estructuras de cientos de productos naturales podrían haber sido asignadas de forma
incorrecta.

20
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

Decidimos en primera instancia utilizar nuestro método previamente desarrollado para


aclarar este problema. Comparamos los datos experimentales reportados para 169 con los
tensores de apantallamiento para cuatro posibles diastereoisómeros recalculados al nivel
PCM/mPW1PW91/6-31+G**//B3LYP/6-31G* y utilizando el promedio de 5 ensambles para la
asignación final. El candidato correcto fue asignado con alto nivel de confianza, reafirmando la
amplia aplicación de esta metodología.

Luego, esta situación nos inspiró a


entender cuan nefasta pudo haber
sido la falla en el método de WJH, que
a su vez, provee la oportunidad de
evaluar la sensibilidad de DP4+ bajo un
escenario energético incierto.

Para lograr nuestros objetivos,


creamos un script de Matlab que
simula el emparejamiento incorrecto
del script de WJH y lo probamos en un
Figura 14 Probabilidades DP4+ computadas para los compuestos set de 66 ejemplos seleccionados con
169 − 172 usando 5 diferentes ensambles (10 000 iteraciones una amplia variedad estructural,
cada uno).
libertad conformacional y numero de
isómeros candidatos (Figura 16).
H OH OH O O OH O
O OH
OBn
O OH OH
O HO
OH O
Ph
174-175 176-177 178-181 182-184 185-188
173

OAc O
OH O O H H H O
HO O OAc
H Me
O Me
O O AcO OAc OH HO OH
Ph O H OH
Me OAc
O
189-191 192-196 197 198-200 201-203 204

HO2C
OH OH H H
O O
O O HO OH H
HO O
N O N OH O
N OHC H
O
N HO O O
O CH2OH
O N OH
Cl

205-206 207 208-209 210-216 217 218 219


O
O O
OH O O H
H O OMe
O O O
O H OH O O
H O O
H O O O O
OAc O O
H O OH
H O O
O
220 221-222 223 224 225-226 227-228

O O
S OH
F3C OMe O O OH
O O OMe O O HO OH
O
O O O
O MeO O

229-230 231-232 233-234 235-237 238

Figura 15 - Compuestos seleccionados para el set de prueba

21
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

El script “Mix” (Figura 17) calcula la probabilidad DP4+ bajo el procedimiento estándar
emparejando los valores de σ del confórmero j con la energía SCF correspondiente del mismo
confórmero j. Luego, de forma aleatoria cambia el orden de los confórmeros en la lista de
energías, correlacionando los valores de σ del conformero j con la amplitud de Boltzmann de
cualquier otro confórmero k, para finalmente recomputar la probabilidad DP4+. En otras
palabras, los tensores correspondientes a cada confórmero son promediados usando las
amplitudes de Bolzmann de otro.

Figura 16 - Representación gráfica del script Mix.

Para obtener datos estadísticamente significantes, este procedimiento fue iterado un millón
de veces para cada candidato pero en la figura 18 se muestran los resultados de las primeras
100 iteraciones ya que es representativo del resultado final.

Figura 17 - (a) Resultados obtenidos con DP4+Std y DP4+Mix (solo las primeras 100 iteraciones). (b) Aciertos
obtenidos con el set de prueba, definido como el porcentaje de compuestos correctamente asignados en cada caso.

Se podría pensar que modular las poblaciones debería tener un efecto pequeño cuando las
conformaciones tienen poca variabilidad en sus desplazamientos calculados (como es de
esperarse en las rotaciones simples de grupos alquilos por ejemplo). Pero en el caso de nuestro
set de prueba se encontraron grandes cambios en los valores de apantallamientos isotrópicos
entre las diferentes conformaciones, con Δδ máximos en el rango de 2.60-10.4 ppm para 13C y
0.21-1.30 ppm para 1H. Estos valores se obtuvieron promediando los resultados de todos los
isómeros para un dado sistema.

22
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

Algunas definiciones que usaremos de ahora en adelante:

 DP4+(Std, Mix o Stress) promedio es el promedio de los valores de DP4+ entre los 66
sistemas del set de prueba
 DP4+(Mix o Stress) es el promedio del valor de DP4+ de cada iteración para cada
compuesto.
 ΔDP4+(Mix o Stress) es la diferencia entre el valor de DP4+ Std y el valor de DP4+(Mix o Stress)
en cada compuesto.

El DP4+Std promedio fue de 91.4%, con 62 de 66 ejemplos correctamente asignados (94%) y


4 tuvieron muy baja probabilidad para el isómero correcto. Luego de aplicar el script Mix, el
DP4+Mix promedio fue menor (60.3%), con 40 aciertos de los 66 ejemplos, con valores mínimos
y máximos de 33/66 (50%) y 47/66 (71%) respectivamente. En consecuencia, probamos que la
falla de WJH no fue tan nefasta como se sugirió. Aun si todos los productos naturales hubieran
sido computados en la plataforma de Linux, en el peor de los casos, en más de la mitad de los
sistemas hubiera sido correcta la asignación. En algunos ejemplos, el intercambio de energías
resulto beneficioso (compuestos 214-216).

Cuando analizábamos los resultados de la figura 18a, el comportamiento heterogéneo de los


sistemas ante la perturbación nos llamó la atención. Es sabido que uno de los principales
problemas del cálculo de RMN está relacionado con la imposibilidad de los actuales métodos
DFT para computar las energías relativas con exactitud, y en consecuencia reproducir
correctamente las amplitudes conformacionales reales en sistemas flexibles. Asumiendo una
estimación razonable de las amplitudes conformacionales, en el mejor de los casos los actuales
métodos DFT tienen una exactitud de entre 1 kcal/mol. Tal variación en los valores de ΔE de dos
confórmeros invierte sus poblaciones relativas de ∼70:30 a ∼30:70 a 25°C, lo cual puede tener
un efecto significante cuando se calculan los desplazamientos y subsecuentemente, los valores
de DP4/DP4+.

Para analizar los resultados y aumentar nuestro entendimiento de la sensibilidad de DP4+ en


cuanto a la energía del sistema, creamos un segundo script llamado “Stress” (figura 19) que
correlaciona los valores de σ del confórmero j con la energía SCF computada para j, pero le
permite aumentar o disminuir aleatoriamente en una ventana energética de 2ΔE.

Figura 18 - Representación gráfica del script Stress

El script fue evaluado con el mismo set de prueba usando un millón de iteraciones por cada
isómero, se muestran los resultados de las primeras 100 iteraciones (figura 20).

23
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

Figura 19 - (a) Resultados obtenidos con DP4+ Estándar y DP4+ Stress (mostrando solo las primeras 100 iteraciones).
(b) Aciertos obtenidos para el set de prueba, definido como el porcentaje de compuestos correctamente asignados
en cada caso.

Como se muestra en la figura 20b, para ΔE=1, DP4+Stress tuvo ligeramente menos aciertos que
el tratamiento Estándar, sugiriendo que el método es bastante robusto bajo incertidumbres
moderadas de energía. El 55-78% de los casos permanecieron correctamente asignados
(dependiendo de la iteración), aun bajo un nivel de incertidumbre extremo (ΔE = 5 Kcal/mol), el
cual es mucho mayor que lo esperado para los métodos DFT. Esto es consistente con los
resultados obtenidos con el procedimiento Mix.

Para analizar porque muchos sistemas permanecen prácticamente inalterados mientras que
otros presentan una fuerte dependencia con la perturbación aplicada, clasificamos el set de
prueba según los valores de |ΔDP4+| obtenidos con los scripts Mix y Stress (figura 21).

24
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

Figura 20 - ΔDP4+ para el set de prueba y su clasificación según la sensibilidad de los sistemas respecto a los
métodos Mix y Stress.

El uso de ΔE hasta +-1Kcal/mol se tomó como una medida de la exactitud esperada para los
funcionales de DFT conocidos. De acuerdo a nuestra definición, valores de |ΔDP4+| en los
rangos de 0-10, 10-50, y 50-100 corresponden a sistemas tipo A, B y C respectivamente. Los
sistemas tipo A son altamente robustos arrojando valores de DP4+ constantes ante las
iteraciones de la perturbación, los tipo B son más sensibles, aunque tanto en estos como los
tipo A, el sentido de la asignación (correcta o no), en general no cambia en relación al
tratamiento DP4+ Standard. Por el contrario, en los tipo C el candidato más probable cambia
cuando se aplica la perturbación a la energía. Por otro lado, el signo de ΔDP4+ indica la
naturaleza del cambio: si ΔDP4+<0, la perturbación mejora la predicción hacia el isómero
correcto, y ΔDP4+>0 la empeora. En general, el signo de ΔDP4+ fue el mismo ya sea para el
tratamiento Mix o Stress. Más aun, esta fue la única relación encontrada entre ambas
perturbaciones.

Con respecto al método Mix, 46 casos son tipo A o B, mientras que 20 son tipo C. En general,
la aplicación de la perturbación los afecto negativamente, y de los 20 compuestos de tipo C, 16
presentaron ΔDP4+>0, cambiando el sentido de la asignación para peor. Por otro lado, los otros
4 compuestos de tipo C fueron incorrectamente asignados por el método Standard, y fueron
corregidos al aplicar el script Mix.

Para el método Stress, los resultados fueron muy interesantes ya que 64 sistemas del set de
prueba pertenecen a la categoría A o B, lo que quiere decir que, en general, la mayoría de los

25
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

sistemas son poco sensibles a moderadas fluctuaciones de energía. Los cuatro compuestos
incorrectamente asignados por el DP4+Standard resultaron tipo A, no siendo posible corregir la
asignación errónea con la perturbación: para las hiacintacinas 214 y 215 el problema es
puramente energético, donde se sobreestima la estabilidad de conformaciones formando
puente de hidrogeno intramolecular. Por otro lado, en 185 y 191 concluimos que el problema
es tensorial, donde los valores de apantallamiento correlacionaron mejor para otro candidato
parecido en estructura al correcto.

Es importante resaltar que, aunque el método DP4+ es sensible a perturbaciones


energéticas, cuando hay errores moderados en los cálculos DFT (aproximadamente 1 Kcal/mol),
generalmente, los resultados no varían cualitativamente. En caso contrario, cuando hay una
perturbación más agresiva que compromete completamente la distribución conformacional
(como podría suceder al cambiar el nivel de teoría de los cálculos) el resultado de la asignación
DP4+ podría cambiar drásticamente.

Finalmente, intentamos correlacionar la sensibilidad energética con las características


estructurales y flexibilidades conformacionales de los sistemas, pero no pudimos encontrar
ningún patrón visible. Esto se puede ver claramente analizando los resultados obtenidos con
ambas perturbaciones en isómeros similares en estructura. Se debe enfatizar que la sensibilidad
al cabo depende de la forma en que la perturbación afecta la concordancia de los valores
calculados con los experimentales de todos los candidatos. Por ende, más allá de analizar los
cambios sobre el isómero correcto, es igualmente importante analizar las variaciones de los
otros candidatos ante la perturbación, lo que es la razón principal de la diferencia de sensibilidad
entre candidatos estructuralmente relacionados.

4. Conclusiones
En esta primera etapa del doctorado se lograron abordar varios de los objetivos planteados en
el plan de tesis: el desarrollo de DP4+ para sistemas perturbados, y el comienzo de una nueva
metodología tipo DP4+ para moléculas altamente polares en solventes próticos, a su vez
utilizando estos nuevos métodos para la elucidación estructural de productos naturales.

5. Plan de trabajo para el próximo período


Para el próximo periodo se propone seguir con el desarrollo un método formal para
elucidación estructural de moléculas polihidroxiladas en solventes polares a través de cálculos
de RMN, que resulte sencillo para los usuarios sin tener que examinar en profundidad los
paisajes conformacionales o energías de las moléculas en estudio.

Se extenderá el estudio de la metodología random desarrollada previamente con las


hiacintacinas a otros motivos estructurales, evaluando distintos compuestos polihidroxilados
como metilhexosas, metilpentosas y nucleótidos, y con este nuevo y más extenso set de prueba
evaluar cómo se ve afectada la elucidación estructural bajo la plataforma de DP4+ removiendo
conformaciones con distintos filtros energéticos o cambios en el nivel de teoría de los cálculos.

Se continuará con el concepto de no depender de un solo calculo DP4+, sino de realizar una
serie de distintas determinaciones basadas en las variaciones mencionadas que, en conjunto,
apunten hacia la estructura correcta entre los candidatos.

26
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

6. Actividades Académicas de posgrado


i. Publicaciones
 "The Risks of Automation: A Study on DFT Energy Miscalculations and Its Consequences
in NMR-based Structural Elucidation". Marcarino, M. O.; Zanardi, M.M.; Sarotti, A. M,
Org. Lett. 2020, 22, 3561-3565.
 "Redefining the Impact of Boltzmann Analysis in the Stereochemical Assignment of Polar
and Flexible Molecules by NMR Calculations". Zanardi, M, M. ; Marcarino, M. O.; Sarotti,
A. M. Org. Lett. 2020, 22, 52-56.

ii. Congresos
 Presentación del Trabajo “Desarrollo de Novedosas Metodologías Computacionales
para la Asignación Estereoquímica de Sistemas Polihidroxilados”. Marcarino, M. O.;
Zanardi, M. M.; Sarotti, A. M. en el XXII Simposio Nacional de Química Orgánica en
Ciudad de Mendoza, Mendoza, Argentina, Noviembre de 2019.
 Presentación del Trabajo “Efecto de los Enlaces de Hidrógeno en la Asignación
Estereoquímica de Pirrolizidinas Polihidroxiladas por Métodos Computacionales”.
Zanardi, M. M.; Marcarino, M. O.; Sarotti, M.A. en el XXII Simposio Nacional de Química
Orgánica en Ciudad de Mendoza, Mendoza, Argentina, Noviembre de 2019.

iii. Seminarios
 "Reassignments and Corroborations of Oxo-Bridged Natural Products Directed by OSE
and DU8 + NMR Computation". Andrei G. Kutateladze, Elizabeth H. Krenske, and Craig
M. Williams Angew. Chem. Int. Ed. 2019, 58, 7107-7112. Presentado el 09 de diciembre
de 2019.

iv. Cursos
 Compuestos de Boro en Síntesis Orgánica
 Análisis Químico e Investigación Forense
 Química Orgánica Superior (Actualmente en curso)
 Espectroscopía de RMN de biomacromoléculas (Actualmente en curso)

7. Referencias
1
(a) Breton, R. C.; Reynolds, W. F. Nat. Prod. Rep. 2013, 30, 501. (b) Gil, R. R. Angew. Chem. Int. Ed. 2011,
50, 7222.
2
(a) Navarro-Vázquez, A.; Gil, R. R.; Blinov, K. J. Nat. Prod. 2018, 81, 203. (b) Troche-Pesqueira, E.; Anklin,
C.; Gil, R. R.; Navarro-Vázquez, A. Angew. Chemie. Int. Ed. 2017, 56, 3660.
3
Hallwass, F.; Schmidt, M.; Sun, H.; Mazur, A.; Kummerlöwe, G.; Luy, B.; Navarro-Vázquez, A.; Griesinger,
C.; Reinscheid, U. M. Angew. Chemie. Int. Ed. 2011, 50, 9487.
4
(a) Nicolaou, K. C.; Snyder, S. A. Angew. Chemie. Int. Ed. 2005, 44, 1012. (b) Yoo, H. D.; Nam, S. J.; Chin,
Y. W.; Kim, M. S. Arch. Pharm. Res. 2016, 39, 143.
5
(a) Sarotti, A. M. Org. Biomol. Chem. 2013, 11, 4847. (b) Zanardi, M. M.; Sarotti, A. M. J. Org. Chem.
2015, 80, 9371.
6
Para reviews recientes, ver: (a) “Bagno, A.; Saielli, G. Wiley Interdisciplinary Reviews: Computational
Molecules Science, 2015”. (b) Grimblat, N.; Sarotti, A. M. Chem. Eur. J. 2016, 22, 12246. (c) Lodewyk, M.
W.; Siebert, M. R.; Tantillo, D. J. Chem. Rev. 2012, 112, 1839.
7
(a) Bifulco, G.; Dambruoso, P.; Gomez-Paloma, L.; Riccio, R. Chem. Rev. 2007, 107, 3744. (b) Tantillo, D.
J. Nat. Prod. Rep. 2013, 30, 1079. (c) Willoughby, P. H.; Jansma, M. J.; Hoye, T. R. Nat. Protoc. 2014, 9, 643.

27
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

8
Para reviews principales, ver: Ref 4a y (a) Suyama, T. L.; Gerwick, W. H.; McPhail, K. L. Bioorg. Med. Chem.
2011, 19, 6675. (b) Maier, M. E. Nat. Prod. Rep. 2009, 26, 1105. Para referencias recientes, ver: (c)
Nicolaou, K. C.; Shah, A. A.; Korman, H.; Khan, T.; Shi, L.; Worawalai, W.; Theodorakis, E. A. Angew. Chem.,
Int. Ed. 2015, 54, 9203. (d) Zhu, L.; Liu, Y.; Ma, R.; Tong, R. Angew. Chem., Int. Ed. 2015, 54, 627. (e) Xiao,
Q.; Young, K.; Zakarian, K. J. Am. Chem. Soc. 2015, 137, 5907. (f) Willwacher, J.; Fürstner, A. Angew. Chem.,
Int. Ed. 2014, 53, 4217. (g) Nicolaou, K. C.; Hale, C. R. H.; Nilewski, C.; Ioannidou, H. A.; ElMarrouni, A.;
Nilewski, L. G.; Beabout, K.; Wang, T. T.; Shamoo, Y. J. Am. Chem. Soc. 2014, 136, 12137.
9
“Foresman, J. B.; Frisch, Æ. (1996) Exploring Chemistry with Electronic Structure Methods (Second
Edition). Gaussian, Inc.”
10
(a) “Martin, R. M. (2004). Electronic structure: basic theory and practical methods. Cambridge university
press”. (b) Material de la asignatura "Métodos computacionales en Química Orgánica”.
11
“Magyarfalvi, G.; Wolinski, K., Hinton, J.; Pulay, P. (2011). Shielding Calculations: GIAO Methods.
Encyclopedia of Magnetic Resonance”.
12
(a) Sarotti, A. M.; Pellegrinet, S. C. J. Org. Chem. 2009. 74, 7254. (b) Sarotti, A. M.; Pellegrinet, S. C. J.
Org. Chem. 2012, 77, 6059.
13
(a) Smith, S. G.; Goodman, J. M. J. Org. Chem. 2009, 74, 4597. (b) Smith, S. G.; Goodman, J. M. J. Am.
Chem. Soc. 2010, 132, 12946.
14
“Zupan, J.; Gasteiger, J. (1999). Neural Networks in Chemistry and Drug Design, Wiley VCH, Weinheim”
15
(a) Le, H. M.; Dinh, T. S.; Le, H. V. J. Phys. Chem. A. 2011, 115, 10862. (b) Le, A. T. H.; Vu, N. H.; Dinh, T.
S.; Cao, T. M.; Le, H. M. Theor. Chem. Acc. 2012, 131, 1158. (c) Nguyen, H. T. T.; Le, H. M. J. Phys. Chem. A.
2012, 116, 4629. (d) Makarova, K.; Rokhina, E. V.; Golovina, E. A.; Van As, H.; Virkutyte, J. J. Phys. Chem.
A. 2012, 116, 443. (e) Balabin, R. M.; Lomakina, E. I. J. Chem. Phys. 2009, 131, 074104.
16
(a) Chini, M. G.; Riccio, R.; Bifulco, G. Eur. J. Org. Chem. 2015, 2015, 1320. (b) Marell, D. J.; Emond, S. J.;
Kulshrestha, A.; Hoye, T. R. J. Org. Chem. 2014, 79, 752.
17
Grimblat, N.; Zanardi, M. M.; Sarotti, A. M. J. Org. Chem. 2015, 80, 12526.
18
(a) Nazarski, R. B.; Pasternak, B.; Lesniak, S. Tetrahedron. 2011, 67, 6901. (b) Shepherd, D. J.; Broadwith,
P. A.; Dyson, B. S.; Paton, R. S.; Burton, J. W. Chem. - Eur. J. 2013, 19, 12644.
19
Para trabajos recientes llevados a cabo por nuestro grupo, ver: (a) Grimblat, N.; Kaufman, T. S.; Sarotti,
A. M. Org. Lett. 2016, 18, 6420. (b) Sarotti, A. M. Org. Biomol. Chem. 2018, 16, 944. (c) Riveira, M. J.;
Sarotti, A. M. Org. Biomol. Chem. 2018, 16, 1442. (d) Karak, M.; Barbosa, L. C. A.; Acosta, J. A. M.; Sarotti,
A. M., Boukouvalas, J. Org. Biomol. Chem. 2016, 14, 4897. (e) Huang, P.; Li, C.; Sarotti, A. M.; Turkson, J.;
Cao, S. Tetrahedron Lett. 2017, 58, 1330. (f) Li, C.; Sarotti, A. M.; Turkson, J.; Cao, S. Tetrahedron Lett.
2017, 58, 2290. (g) Caia, Y.; Sarotti, A. M.; Kondratyuk, T. P.; Pezzuto, J. M.; Turkson, J.; Cao, S. Bioorg.
Med. Chem. Lett. 2017, 27, 4630. (h) Li, C.; Sarotti, A. M.; Yoshida, W.; Cao, S. Tetrahedron Lett. 2018, 59,
42. (i) Li, C.-S.; Sarotti, A. M.; Huang, P.; Tang, U.; Hurdle, J; Kondratyuk, T.; Pezzuto, J.; Turkson, J.; Cao, S.
Sci. Rep. – Nature. 2017, 7, 1.
20
Zanardi, M. M.; Suárez, A. G.; Sarotti, A. M. J. Org. Chem. 2017, 82, 1873 (Featured Article, ACS Editor´s
Choice, Ilustración Portada).
21
Domínguez, H. J.; Crespín, G. D.; Santiago-Benítez, A. J.; Gavín, J. A.; Norte, M.; Fernández, J. J.; Daranas,
A. H. Mar. Drugs. 2014, 12, 176.
22
Ermanis, K.; Parkes, K. E. B.; Agback, T.; Goodman, J. M. Org. Biomol. Chem. 2017, 15, 8998.
23
(a) Novaes, L. F. T.; Sarotti, A. M.; Pilli, R. A. J. Org. Chem. 2015, 80, 12027. (b) Della-Felice, F.; Sarotti,
A. M.; Pilli, R. A. J. Org. Chem. 2017, 82, 9191. (c) Della-Felice, F.; Pilli, R. A.; Sarotti, A. M. J. Braz. Chem.
Soc. 2018, 29, 1041.
24
Zanardi, M. M.; Marcarino, M. O.; Sarotti, A. M. Org. Lett. 2020, 22, 52.
25
Hubbard, T. A.; Brown, A. J.; Bell, I. A. W.; Cockroft, S. L. J. Am.Chem. Soc. 2016, 138, 15114.
26
Bagno, A.; Rastrelli, F.; Saielli, G. J. Org. Chem. 2007, 72, 7373.
27
Tomasi, J.; Mennucci, B.; Cammi, R. Chem. Rev. 2005, 105, 2999.
28
Toukach, F. V.; Ananikov, V. P. Chem. Soc. Rev. 2013, 42, 8376.
29
(a) Bame, J.; Hoeck, C.; Carrington, M. J.; Butts, C. P.; Jäger, C. M.; Croft, A. K. Phys. Chem. Chem. Phys.
2018, 20, 7523. (b) Butts, C. P.; Jones, C. R.; Harvey, J. N. Chem. Commun. 2011, 47, 1193. (c) Kutateladze,
A. G.; Mukhina, O. A. J. Org. Chem. 2015, 80, 5218. (d) Kutateladze, A. G.; Kuznetsov, D. M. J. Org. Chem.
2017, 82, 10795.
30
(a) Grimblat, N.; Gavín, J. A.; Hernández Daranas, A.; Sarotti, A. M. Org. Lett. 2019, 21, 4003. (b) Wu, J.;
Lorenzo, P.; Zhong, S.; Ali, M.; Butts, C. P.; Myers, E. L.; Aggarwal, V. K. Nature. 2017, 547, 436.
31
Adamo, C.; Barone, V. J. Chem. Phys. 1998, 108, 664.

28
Primer Informe de Avance de Tesis Doctoral Periodo 2019-2020

32
(a) Becke, A. D. Phys. Rev. A: At., Mol., Opt. Phys. 1988, 38, 3098. (b) Lee, C.; Yang, W.; Parr, R. G. Phys.
Rev. B: Condens. Matter Mater. Phys. 1988, 37, 785.
33
Zhao, Z.; Truhlar, D. G. Theor. Chem. Acc. 2008, 120, 215.
34
Chai, J. − D.; Head-Gordon, M. Phys. Chem. Chem. Phys. 2008, 10, 6615.
35
Marenich, A. V.; Cramer, C. J.; Truhlar, D. G. J. Phys. Chem. B. 2009, 113, 6378.
36
Del Vigo, E. A.; Marino, C.; Stortz, C. A. Carbohydr. Res. 2017, 448, 136.
37
Bhandari Neupane, J.; Neupane, R. P.; Luo, Y.; Yoshida, W. Y.; Sun, R.; Williams, P. G. Org. Lett. 2019, 21,
8449.

29

También podría gustarte