分子力学基本原理(Molecular Mechanics)#
构象搜索与分析 Conformation searching and analysis#
构象分析简史
1950年前后,德里克·巴顿(Derek Barton)在取代环已烷反应性的研究中指出其反应性受取代分子的轴向性质影响,即受取代环已烷构象影响
1960年,亨得利克莱森(Hendricleson)用理论方法计算了甲基环己烷(methycyclohexane)扭船式与椅式构象转化过程的能量为6.7 kJ/mol,表明扭船式是可以存在的。直到1975年研究者才从实验中证实了环已烷扭船式的存在,表明基于计算的构象分析可以有效辅助实验观测。
事实上,甲基环己烷还有更多的局部最小构象(local minima)
构象分析方法(conformational search):
定义:指在构象空间中寻找所有可能出现的比较稳定的构象,即在分子的势能面上寻找所有极小值位点
目的:为了确定分子的优势构象
特点:不同于能量最小化,能量最小化的一个特征是只能优化到最接近初始结构的极小值位点;构象搜索可以搜索全空间(理论上)的极小值位点
能量势垒(Energy Barrier):当一个构象转变成另一个时,通常会遇到能量势垒,其可能来自于分子内部或分子间。势垒越高,结构转换越慢越难。
常用构象搜索算法
* 系统搜索法(仅用于小分子体系)
* 片段连接法(常用于小分子体系)
* 随机搜索法(常用于小分子体系)
* 遗传算法(常用于小分子体系)
* 模拟退火法(大分子、小分子体系均适用)
* 分子动力学模拟方法(大分子、小分子体系均适用)
系统搜索法(格点搜索法):即在构象空间中以小的间隔变量进行逐点搜索,如果变量足够小,则可能搜索到全空间
步骤:
固定键长、键角
确定分子中可旋转键
设定步长
变化二面角,产生新构象并计算能量
案例:丙氨酸二肽势能面搜索
确定两个旋转角φ、ψ
固定键长键角
设定步长θi=300
计算体系能量(利用AMBER力场)
由图可见,两个区域特别重要,对应于α-螺旋(helix)和β-折叠(strand)结构
优越性:对于自由度较少的分子,系统搜索法得到的构象可以离散地覆盖整个势能面,即可以覆盖整个构象空间
缺点:计算效率低,只能应用于小分子。随着可自由旋转键的增加,构象数目呈指数增加。
\[Number\_of\_Conformation = \prod_{i=1}^N \frac{360}{\theta_i}\]
θ_i是对键所选的两面角步长,N为旋转键的数
如N=5,θ=30 ,构象数为125,即248,832,69 hr(设1s计算一个构象)
如N=7,θ=30 ,构象数为127 ,即35,831,808 ,415天
片断连接法
系统搜索方法不能用于包含很多二面角的体系,在这个方法基础上发展起来的“片段连接(build-up)”方法可以在一定程度上缓解这个限制
基本思路:每种分子片段有其优势构象,通过把几个三维的“结构片断”相互连接组成一个完整分子来实现构象分析的过程
方法优势:这种方法比系统搜索更加有效的原因在于,与分子中可旋转单键相比,其组成“结构片断”的数目会少一些。这种方法尤其对于一些环系片断可能更为有效。常用于小分子体系
步骤:
确定构造整个分子需要哪些“结构片断”
产生所有片断的构象模式(储存于片断数据库中)
把“结构片断”相互连接
片断连接方法依赖条件:
结构片断的构象要相对独立。它的构象不依赖于与之连接的其他“结构片断”构象的变化
储存在数据库中的“结构片断”的构象模式应该覆盖这些“结构片断”在不同分子中所有可能的构象模式
内在缺陷:对于复杂分子,分子中基团之间的构象往往相互影响,“结构片断”的典型构型未必能够很好替代其在分子中的构象模式
随机搜索法:
改变笛卡尔坐标:识别分子中二面角,在每个原子的坐标x、y、z上随机加上随机量
改变内坐标:随机改变分子中可旋转键二面角
两种方法效率基本相等
随机搜索法的优势与缺陷:
比使用分子动力学的方法效率提高一个数量级
随机性较大,在有限搜索时间内,很难判断是否找到分子最佳构象
一般用于小分子体系
遗传算法
是一种借鉴生物界自然选择和自然进化的概率选择搜寻算法,具有高度并行、随机、自适应等特点
基本思路:以构象搜寻为例,个体由一系列可旋转键角度组成(染色体),通过大量个体的复制、变异、交叉互换产生新种群,并测量新种群(个体)的适应值(构象能量)来保留优势群体继续迭代搜索,最终得到优势构象
方法优势:并行度高,可同时获得一组优势构象
其中:
编码并产生初始化种群(产生大量分子构象)
计算个体适应值(如通过分子力学计算各构象能量)
复制、互换、变异产生新群体(不同个体的角度互换或随机更新)
遗传算法的特点与不足:
随机性较大,如初始种群的大小、突变概率、交叉概率的选取均可能导致十分不同的结果,参数的选择亦处于经验水平
对于自由度较多体系,所需初始种群的数量亦需指数增加,因此对于较大体系可能显著降低收敛效率,且计算量较大
常用于小分子体系
模拟退火法
也称作蒙特卡罗退火法,统计降温法或随机弛豫法。模拟退火方法是蒙特卡罗方法(Metropolis算法)搜集构象空间,其不同于传统蒙特卡罗方法之处在于运用体系能量的同时还把温度也作为体系的一个变量
整个过程分为两个步骤:
升温熔化体系
逐渐降温
在任一个温度下,体系的初始构象1,相应能量为E(1),构象发生微小的随机变化产生新的构象2,相应的能量为E(2),能量变化为ΔE=E(2)–E(1)
当ΔE<0时,接受构象变化;
当ΔE>0时,则在(0,1)间选择一个随机数R(如0.35),将其与P(ΔE)=exp(-ΔE/k_BT)相比较(Metropolis准则)若P(ΔE)>R则接受变化,新的构象成为下一次随机变化的起始点;否则拒绝变化,旧的构象仍是下一次随机变化的起始点。不断循环往复,在每个温度下都进行这个过程,直至体系温度降到足够低,即体系“冻结”在某个固定的构象上。
模拟退火法特点:
模拟退火效率如何取决于一些参数的设置,例如初始温度、降温因子以及随机数种子等,这些参数设定了退火的进程,决定了退火的效率
模拟退火方法的优点在于它取舍构象时不仅接受能量下降的变化,同时也接受部分能量上升的变化,因而有可能跳出局部势阱,寻找到新的能量最低点。同时模拟退火方法不依靠于体系起始构象,这样就消除了人为因素带来的影响
适用于大分子构象搜索
分子动力学方法
基本思想:根据分子的势函数,得到作用在每个原子上的力,利用牛顿第二定律求解运动方程,得到原子在势能面上的运动轨迹,从而达到构象搜索的目的
基于分子动力学模拟的构象搜索方法
淬火模拟(Quenching Simulation):高温模拟
退火模拟(Annealing Simulation):低温模拟
淬火模拟可以找到更多分子构象(高温易于翻越势垒),而退火模拟可以搜索出能量更低的构象
适用于大分子构象搜索