原文
数量:15 (4)定量结构活性关系(构象)研究谷氨酰胺的类似物可能的抗癌活性
- *通信:
-
Elidrissi B分子化学和天然物质实验室,科学教师,大学的慕雷·伊斯梅尔,摩洛哥梅克内斯
电话:+ 212 - 607662438;电子邮件:elidrissi.info@gmail.com
收到日期:2017年8月08接受日期:2017年9月8日发表日期:2017年9月12日
引用:Elidrissi B, Ousaa Ajana MA、et al .定量构效关系(构象)研究谷氨酰胺的类似物可能的抗癌活性。Int J化学科学。2017;15 (4):192
文摘
执行定量组织性能的关系(部分)的一项研究预测抗癌活动肿瘤细胞36 5-N-substituted-2 -(取代benzenesulphonyl)谷氨酰胺化合物使用电子和网络拓扑描述符计算分别用ACD /化学草图和高斯03 w项目。所有36个化合物的结构进行了优化使用混合密度泛函理论(DFT) B3LYP /我感觉(d)的理论水平。在这两种方法,30化合物分配作为训练集,其余作为测试集。分析了这些化合物的主成分分析(PCA)方法,后代多元线性回归(高),和一个多元非线性回归(MNLR)分析人工神经网络(安)。获得模型的鲁棒性是评估leave-many-out交叉验证,通过测试集和外部验证。这项研究表明,略微安了更好的预测抗肿瘤活性相比,结果由高钙和MNLR给出的预测。
关键字
DFT;构象;肿瘤细胞;人工神经网络;交叉验证
介绍
癌症仍然是世界上死亡的原因之一,因此迫切需要发展的新颖和有效的治疗方法。尽管现代的许多领域取得重大突破医学在过去的100年里,成功的治疗癌症仍然是一个重大挑战的21圣世纪。很难知道小说和检测代理,有选择地杀死肿瘤细胞或抑制其增殖而不被有毒的(1]。的癌症被描述为氮陷阱。(2谷氨酰胺(GLN),非必需氨基酸,起着关键作用肿瘤细胞生长通过提供的酰胺氮原子从花色其他氨基酸、嘌呤、嘧啶基地、氨基糖和辅酶(3),通过一个家庭由16个氨基转移酶(4与多样化的机制)。因此,合成了不同结构的谷氨酰胺,据说可能抗癌活动GLN [5]。
在这项研究中,我们模拟了抗癌活性(抑制肿瘤(IT)) 36个新的5-N-substituted-2 -(取代benzenesulphonyl)与不同的替换(谷氨酰胺表1),使用一些统计工具,主成分分析(PCA),多元线性回归(高),多元非线性回归(MNLR)和人工神经网络(安)计算6,7]。的定量构效关系(构象)方法关注的座右铭,化合物的活动是由其分子结构决定的。(8]因此,基于精确的实验数据只在一组的一些化学物质,化学物质的生物活性在整个集团可以使用合适的预测模型,包括尚未实验合成的化合物(9- - - - - -13]。
这项工作的目标是开发定量构效关系模型和预测来确定我们的化学结构特点之间的重要研究抗肿瘤的分子细胞活动。因此,大量的量子化学计算方法和执行为研究分子结构和抗肿瘤活性14]。
在目前的工作,发现分子结构之间的定量关系和抗肿瘤活性的数据采取Srikanth et al。14看不到),我们用多元线性回归(MLR),多元非线性回归(MNLR)和人工神经网络(安)15]。我们计算了电子高斯03定量构效关系集生成的描述符。高钙是用来选择分子的结构特点与抗肿瘤活性和相关构造线性模型,最后一个模型用于选择描述符作为输入,安了非线性模型。模型都验证了一个内部验证方法包括特征鲁棒性交叉验证和外部验证来估计模型的预测能力。决赛,最终目标是建立定量构效关系模型可靠的抑制肿瘤(体重预测5-N-substituted-2) -取代benzenesulphonyl谷氨酰胺。
材料和方法
实验数据
36抗肿瘤活性的实验值新5-N-substituted-2——(代替benzenesulphonyl)谷氨酰胺是取自文献[15]。为肿瘤生长抑制、抗肿瘤活性的抑制百分比的基础上评估肿瘤(%)。生物活性(IT)数据校准其对数的值(日志)。化合物及其相应的生物活动日志(IT)所示值图1和表1。
分子描述符的计算
DFT(密度泛函理论)方法被用于这项研究。这些方法已成为近年来非常受欢迎的,因为他们可以达到相似的精度的其他方法用更少的时间和更少的成本计算的观点。在协议与DFT结果,能源polyelectronic系统的的基本状态通过总电子密度可以表示,事实上,使用电子密度而不是波函数计算能源构成了DFT的基本基础(16,17)用B3LYP功能(18)和我(d)基础集。B3LYP, DFT方法的一个版本,使用贝克的带三个参数的功能(B3)和包括一个混合的高频DFT交换条件与李的梯度修正相关功能,杨和帕尔(LYP)。所有的几何物种在调查中确定了通过优化所有几何变量没有任何对称约束。
分子性质的计算:最高占据分子轨道能源E人类(eV),最低未占据分子轨道能源ELUMO(eV),偶极矩μ(德拜)能源ET (eV),激活能源E一个(eV),绝对的电负性χ(eV)和总负电荷的分子过渡委员会(19- - - - - -22]。
χ是由以下方程:(1)
另一方面,ACD / ChemSketch和化学3 d程序(23是用来计算的拓扑描述符:分子量兆瓦(cm3),密度D (g / cm3),分配系数LogP,弯曲能源Eb(千卡每摩尔),电子能源Ee(千卡每摩尔),空间能源Es(千卡每摩尔),形状属性ChA,形状系数自燃,马利肯ChM指控。
统计分析
主成分分析(PCA):5-N-substituted-2的化合物——(代替benzenesulphonyl)谷氨酰胺(1 - 36)统计方法研究了基于主成分分析(PCA) (22使用软件XLSTAT 2015]。本质上这是一个描述性统计方法旨在在场,以图形形式,最大的信息中包含的数据表1。
复合 | R1 | R2 | R3 | R4 | R5 | %的抑制肿瘤重量(它) | 日志(它) |
---|---|---|---|---|---|---|---|
1 | H | H | H | H | i-Butyl | 52.73 | 1.722 |
2 | H | H | CH3 | H | i-Propyl | 50.00 | 1.699 |
3 | H | H | CH3 | H | i-Butyl | 25.00 | 1.398 |
4 | CH3 | H | H | 没有2 | H | 37.5 | 1.574 |
5 | CH3 | H | H | 没有2 | CH3 | 68.75 | 1.837 |
6 * | CH3 | H | H | 没有2 | C2H5 | 25.00 | 1.398 |
7 | CH3 | H | H | 没有2 | c3H7 | 50.00 | 1.699 |
8 | CH3 | H | H | 没有2 | c4H9 | 62.50 | 1.796 |
9 * | CH3 | H | H | 没有2 | i-Propyl | 62.50 | 1.796 |
10 | CH3 | H | H | 没有2 | i-Butyl | 12.00 | 1.079 |
11 | CH3 | H | H | 没有2 | C6H11 | 33.00 | 1.519 |
12 | CH3 | H | H | 没有2 | C6H5 | 33.00 | 1.519 |
13 | CH3 | H | H | 没有2 | C6H5CH2 | 60.17 | 1.779 |
14 | CH3 | H | H | 没有2 | c5H11 | 60.83 | 1.784 |
15 | CH3 | H | H | 没有2 | c6H13 | 67.37 | 1.828 |
16 * | H | 没有2 | CH3 | H | H | 49.53 | 1.695 |
17 | H | 没有2 | CH3 | H | CH3 | 40.86 | 1.611 |
18 | H | 没有2 | CH3 | H | C2H5 | 27.05 | 1.432 |
19 | H | 没有2 | CH3 | H | c3H7 | 26.95 | 1.431 |
20. | H | 没有2 | CH3 | H | c4H9 | 41.37 | 1.617 |
21 | H | 没有2 | CH3 | H | c5H11 | 24.88 | 1.396 |
22 | H | 没有2 | CH3 | H | c6H13 | 59.45 | 1.774 |
23 | H | 没有2 | CH3 | H | i-Propyl | 37.64 | 1.576 |
24 * | H | 没有2 | CH3 | H | i-Butyl | 45.95 | 1.662 |
25 | H | 没有2 | CH3 | H | C6H11 | 35.33 | 1.548 |
26 | H | 没有2 | CH3 | H | C6H5CH2 | 22.35 | 1.349 |
27 * | H | 没有2 | CH3 | H | C6H5 | 59.60 | 1.775 |
28 | H | H | C2H5 | H | CH3 | 90.45 | 1.956 |
29日 | H | H | C2H5 | H | C2H5 | 38.46 | 1.585 |
30. | H | H | C2H5 | H | c3H7 | 65.64 | 1.817 |
31日 | H | H | C2H5 | H | c4H9 | 55.64 | 1.745 |
32 | H | H | C2H5 | H | c5H11 | 56.36 | 1.751 |
33 | H | H | C2H5 | H | c6H13 | 65.37 | 1.815 |
34 | H | H | C2H5 | H | CH (CH3)2 | 41.53 | 1.618 |
35 * | H | H | C2H5 | H | C6H5CH5 | 37.50 | 1.574 |
36 | H | H | C2H5 | H | C6H5 | 70.76 | 1.850 |
*测试集
表1。(实验抗肿瘤活性5-N-substituted-2) -取代benzenesulphonyl谷氨酰胺值36分子。
主成分分析是一种统计技术用于总结所有的信息的编码结构的化合物。也非常有助于了解化合物的分布。
看不到多元线性回归(MLR):多元线性回归统计技术被用来研究一个因变量和几个自变量之间的关系。这是一个数学技术,最大限度地减少实际值和预测值之间的区别。高钙方程的统计数据的质量评价参数如R值(相关系数),F值(费舍尔统计)和RMSE值(根均方误差)。
多元线性回归模型(高)242015年)是使用软件生成XLSTAT预测抗肿瘤活性(IT)。也曾选择描述符作为输入参数的多元非线性回归(MNLR)和人工神经网络(安)。
人工神经网络(ann)
非线性模型被开发的提交选择的描述符从高到三层,完全连接,前馈安。输入神经元的数量等于线性模型的描述符。隐藏的神经元的数量被试错过程优化的培训过程。一个输出神经元被用来代表实验%抑制肿瘤体重日志(IT)。为了避免过度训练,十分之一的训练集的数据是随机选择作为一个独立的验证集监控培训过程中培训的网络性能监控预测的值时系统验证集。结果验证设置不再提高,训练是停止25]。
模型评估和验证
为了检查的可靠性和构象的稳定性模型阐述了高钙,MNLR和ANN方法,内部和外部进行了验证。善良的拟合是首先确定系数(R的特征2计算和实验值之间)的分子训练集,由方程给出的公式:
(2)
在哪里和是观察,分别计算和平均值的活动。
交叉验证是一个最受欢迎的方法,估算模型的鲁棒性。基于这种技术,修改数据集是由删除在每种情况下的一个或少数分子,这些程序分别命名为“分析”和“leave-some-out”[26- - - - - -28]。在这部作品中,内部的预测能力模型评估了leave-many-out交叉验证在数学形式:
(3)
模型的可靠性和健壮性进一步验证通过使用外部测试集组成的数据不能用于开发预测模型。外部测试集的确定与以下方程:
(4)
在哪里和是观测值,测试集的计算值和平均值的训练集的活动,分别。
构象模型是成功的,如果它满足以下标准:
进一步完善定量构效关系模型的预测能力发达,另一组指标:使用rm 2指标。他们决定之间的近距离观察和预测活动,介绍了由罗伊和Ojha [27,28]。他们计算基于观察和预测响应数据之间的相关性。目前两个不同指标计算培训(内部验证)和测试集(外部验证):和为一个可接受的构象模型应该> 0.5,应该是< 0.2。
Y-Randomization测试
模型也对机会相关的评估Y-randomization [29日- - - - - -31日]。属性值被随机分配在训练集由许多迭代。从每一个新的随机数据集,一个新的模型构象再次计算,表演将低Q2和R2值比原模型。最后,平均的Q值2和R2计算检查原来的吗模型强烈的性能比随机的(表2)。
日志(它) | 兆瓦 | D | LogP | Eb | 化学加工 | 西文 | Ee | 沙 | 人体自燃 | Et | E人类 | ELUMO | 米 | χ | 过渡委员会 | E一个 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1.722 | 342.41 | 1.253 | 0.733 | 13.343 | 0.131 | 118.836 | -31761年 | 21.043 | 1.00 | -39990.72 | -6.621 | -3.195 | 7.688 | -4.908 | -9.910 | 2.763 |
1.699 | 342.41 | 1.253 | 1.003 | 13.352 | 0.133 | 81.472 | -31303年 | 21.043 | 0.85 | -39990.88 | -6.637 | -3.305 | 8.023 | -4.971 | -9.805 | 2.205 |
1.398 | 356.44 | 1.231 | 1.221 | 13.547 | 0.132 | 89.597 | -55577年 | 22.041 | 0.85 | -41061.16 | -6.553 | -2.441 | 6.856 | -4.497 | -10.526 | 4.327 |
1.574 | 345.33 | 1.501 | -0.597 | 13.445 | 0.151 | 124.324 | -31824年 | 21.043 | 0.83 | -42347.69 | -6.594 | -3.292 | 7.613 | -4.943 | -9.125 | 4.038 |
1.837 | 359.35 | 1.428 | -0.361 | 13.446 | 0.148 | 237.583 | -33793年 | 22.041 | 1.00 | -43418.03 | -6.574 | -3.214 | 7.885 | -4.894 | -9.418 | 3.641 |
1.398 | 373.38 | 1.392 | -0.023 | 13.446 | 0.132 | 240.852 | -35745年 | 23.040 | 0.87 | -43418.03 | -6.574 | -3.214 | 7.885 | -4.894 | -9.418 | 3.632 |
1.699 | 387.41 | 1.361 | 0.463 | 13.446 | 0.125 | 243.938 | -37609年 | 24.038 | 1.00 | -45559.13 | -6.561 | -3.153 | 8.162 | -4.857 | -10.342 | 3.627 |
1.796 | 401.43 | 1.333 | 0.880 | 13.446 | 0.125 | 246.975 | -39468年 | 25.037 | 0.85 | -46629.64 | -6.557 | -3.137 | 8.215 | -4.847 | -10.790 | 3.620 |
1.796 | 387.41 | 1.359 | 0.295 | 13.727 | 0.135 | 237.493 | -38022年 | 24.038 | 0.85 | -45559.20 | -6.535 | -2.853 | 8.055 | -4.694 | -10.375 | 3.138 |
1.079 | 401.43 | 1.332 | 0.513 | 13.717 | 0.134 | 243.411 | -40586年 | 25.037 | 0.85 | -46629.58 | -6.522 | -2.685 | 8.206 | -4.603 | -10.989 | 4.237 |
1.519 | 427.47 | 1.390 | 1.187 | 13.924 | 0.128 | 242.563 | -43662年 | 27.034 | 0.85 | -48738.06 | -6.528 | -2.720 | 7.399 | -4.624 | -11.186 | 4.086 |
1.519 | 421.42 | 1.452 | 1.302 | 13.445 | 0.199 | 249.208 | -41243年 | 27.034 | 0.87 | -48639.08 | -6.425 | -3.630 | 7.482 | -5.027 | -10.095 | 2.779 |
1.779 | 435.45 | 1.394 | 1.372 | 13.446 | 0.198 | 241.799 | -44337年 | 28.033 | 1.00 | -49709.56 | -6.521 | -2.985 | 7.825 | -4.753 | -9.735 | 2.235 |
1.784 | 415.46 | 1.307 | 1.298 | 13.687 | 0.127 | 244.960 | -41310年 | 26.035 | 1.00 | -47700.16 | -6.522 | -2.873 | 8.439 | -4.697 | -11.076 | 4.063 |
1.828 | 429.49 | 1.285 | 1.715 | 13.884 | 0.118 | 242.747 | -43102年 | 27.034 | 0.88 | -48770.67 | -6.521 | -2.872 | 8.430 | -4.697 | -11.687 | 4.056 |
1.695 | 345.33 | 1.501 | -0.597 | 13.445 | 0.148 | 108.939 | -31556年 | 21.043 | 0.83 | -42347.62 | -6.871 | -2.875 | 8.074 | -4.873 | -9.111 | 4.025 |
1.611 | 359.35 | 1.428 | -0.361 | 13.446 | 0.119 | 112.573 | -33511年 | 22.041 | 1.00 | -43418.07 | -6.842 | -2.905 | 7.832 | -4.873 | -9.390 | 3.584 |
1.432 | 373.38 | 1.392 | -0.023 | 13.446 | 0.147 | 115.783 | -35441年 | 23.040 | 0.85 | -44488.66 | -6.789 | -2.860 | 7.610 | -4.824 | -9.869 | 3.588 |
1.431 | 387.41 | 1.361 | 0.463 | 13.446 | 0.124 | 118.840 | -37291年 | 24.038 | 1.00 | -45559.18 | -6.755 | -2.830 | 7.622 | -4.792 | -10.323 | 3.587 |
1.617 | 401.43 | 1.333 | 0.880 | 13.446 | 0.122 | 121.877 | -39133年 | 25.037 | 0.87 | -46629.69 | -6.737 | -2.815 | 7.851 | -4.776 | -10.770 | 3.583 |
1.396 | 415.46 | 1.307 | 1.298 | 13.446 | 0.125 | 124.904 | -40938年 | 26.035 | 1.00 | -47700.21 | -6.726 | -2.806 | 7.404 | -4.766 | -11.219 | 3.581 |
1.774 | 429.49 | 1.285 | 1.715 | 13.446 | 0.123 | 127.929 | -42741年 | 27.034 | 0.88 | -48770.72 | -6.718 | -2.800 | 7.592 | -4.759 | -11.493 | 3.580 |
1.576 | 387.41 | 1.359 | 0.295 | 13.727 | 0.170 | 125.653 | 32749年 | 24.038 | 0.85 | -45559.13 | -6.662 | -2.597 | 9.093 | -4.630 | -10.361 | 5.547 |
1.662 | 401.43 | 1.332 | 0.513 | 13.924 | 0.133 | 119.540 | 34963年 | 25.037 | 0.85 | -46629.51 | -6.622 | -2.510 | 8.816 | -4.566 | -10.973 | 4.855 |
1.548 | 427.47 | 1.390 | 1.187 | 13.924 | 0.132 | 137.258 | 38586年 | 27.034 | 0.87 | -48737.89 | -6.568 | -2.518 | 9.352 | -4.543 | -11.196 | 5.527 |
1.349 | 435.45 | 1.394 | 1.372 | 13.446 | 0.198 | 116.706 | 37256年 | 28.033 | 1.00 | -49709.30 | -6.727 | -2.954 | 7.714 | -4.840 | -10.027 | 3.355 |
1.775 | 421.42 | 1.452 | 1.302 | 13.445 | 0.200 | 120.216 | 35363年 | 27.034 | 0.87 | -48639.18 | -6.780 | -2.942 | 7.562 | -4.861 | -10.073 | 3.668 |
1.956 | 328.38 | 1.281 | 0.763 | 13.276 | 0.114 | 92.524 | 24667年 | 20.045 | 0.85 | -38920.18 | -6.775 | -2.892 | 6.000 | -4.833 | -9.405 | 3.405 |
1.585 | 342.41 | 1.255 | 1.102 | 13.276 | 0.148 | 95.753 | 26366年 | 21.043 | 1.00 | -39990.78 | -6.726 | -2.848 | 6.040 | -4.787 | -9.886 | 3.413 |
1.817 | 356.44 | 1.231 | 1.588 | 13.276 | 0.123 | 98.816 | 27990年 | 22.041 | 0.87 | -41061.30 | -6.692 | -2.818 | 5.839 | -4.755 | -10.339 | 3.412 |
1.745 | 370.46 | 1.211 | 2.005 | 13.276 | 0.127 | 101.852 | 29614年 | 23.040 | 1.00 | -42131.81 | -6.674 | -2.804 | 5.943 | -4.739 | -10.624 | 3.408 |
1.751 | 384.49 | 1.192 | 2.422 | 13.276 | 0.124 | 104.880 | 31205年 | 24.038 | 0.88 | -43202.32 | -6.662 | -2.795 | 5.928 | -4.729 | -11.235 | 3.407 |
1.815 | 398.52 | 1.176 | 2.840 | 13.276 | 0.121 | 107.905 | 32800年 | 25.037 | 1.00 | -44272.83 | -6.655 | -2.789 | 6.160 | -4.722 | -11.684 | 3.406 |
1.618 | 356.44 | 1.230 | 1.420 | 13.557 | 0.144 | 92.273 | 28274年 | 22.041 | 1.00 | -41061.36 | -7.172 | -2.857 | 6.204 | -5.014 | -10.371 | 3.384 |
1.574 | 404.48 | 1.275 | 2.496 | 13.401 | 0.199 | 96.369 | 33194年 | 26.035 | 0.88 | -45211.74 | -6.586 | -2.854 | 6.211 | -4.720 | -10.412 | 3.284 |
1.850 | 390.45 | 1.324 | 2.427 | 13.276 | 0.200 | 100.248 | 31175年 | 25.037 | 1.00 | -44141.30 | -6.716 | -2.869 | 5.375 | -4.793 | -10.089 | 3.649 |
表2。值计算的参数通过DFT / B3LYP ?我*优化研究的化合物。
结果与讨论
本研究进行了一系列的36个化合物5-N-substituted-2 -谷氨酰胺(benzenesulphonyl代替),为了确定结构之间的定量关系信息和这些谷氨酰胺化合物的抗肿瘤活性(IT)。
16集的36个化合物描述符编码5-N-substituted-2 -谷氨酰胺(benzenesulphonyl代替),电子、精力充沛和网络拓扑参数提交给PCA分析(32]。前三个主轴足以描述提供的信息数据矩阵。事实上,方差的百分比是30.36%,20.95%和15.95%的轴F1, F2和F3,分别。总信息估计的百分比为67.26%。主成分分析(PCA) [33,34)进行了识别不同变量之间的联系。大胆的值是不同的从0 p = 0.05的显著性水平。以下总结了皮尔森相关系数表3。获取矩阵提供负面信息或变量之间的正相关关系。
日志(它) | 兆瓦 | D | LogP | 海尔哥哥 | 化学加工 | 西文 | Ee | 沙 | 人体自燃 | 等 | E人类 | ELUMO | 米 | χ | 过渡委员会 | E一个 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
日志(它) | 1 | ||||||||||||||||
兆瓦 | -0.143 | 1 | |||||||||||||||
D | -0.214 | 0.160 | 1 | ||||||||||||||
LogP | 0.244 | 0.402 | -0.683 | 1 | |||||||||||||
海尔哥哥 | -0.252 | 0.463 | 0.261 | -0.206 | 1 | ||||||||||||
Char。 | -0.087 | 0.300 | 0.386 | 0.166 | -0.124 | 1 | |||||||||||
西文 | -0.039 | 0.442 | 0.356 | -0.210 | 0.435 | -0.009 | 1 | ||||||||||
Ee | 0.210 | -0.044 | -0.313 | 0.453 | -0.166 | 0.282 | -0.558 | 1 | |||||||||
沙 | -0.128 | 0.995 | 0.150 | 0.450 | 0.416 | 0.374 | 0.408 | 0.002 | 1 | ||||||||
人体自燃 | 0.112 | 0.037 | -0.229 | 0.248 | -0.334 | 0.065 | -0.038 | 0.106 | 0.055 | 1 | |||||||
等 | 0.189 | -0.965 | -0.381 | -0.162 | -0.528 | -0.302 | -0.519 | 0.167 | -0.949 | 0.019 | 1 | ||||||
E人类 | -0.049 | 0.371 | 0.102 | 0.057 | 0.300 | 0.050 | 0.643 | -0.353 | 0.363 | -0.219 | -0.366 | 1 | |||||
ELUMO | -0.151 | 0.165 | -0.334 | 0.225 | 0.409 | -0.243 | -0.335 | 0.330 | 0.144 | -0.095 | -0.096 | -0.194 | 1 | ||||
米 | -0.237 | 0.340 | 0.537 | -0.560 | 0.686 | -0.091 | 0.474 | -0.412 | 0.281 | -0.268 | -0.503 | 0.338 | -0.014 | 1 | |||
χ | -0.170 | 0.357 | -0.264 | 0.245 | 0.552 | -0.205 | 0.028 | 0.124 | 0.333 | -0.209 | -0.290 | 0.355 | 0.848 | 0.169 | 1 | ||
过渡委员会 | 0.013 | -0.614 | 0.516 | -0.618 | -0.408 | 0.336 | -0.134 | -0.071 | -0.582 | -0.003 | 0.477 | -0.229 | -0.498 | -0.059 | -0.598 | 1 | |
E一个 | -0.240 | 0.158 | 0.183 | -0.209 | 0.640 | -0.169 | -0.010 | 0.210 | 0.115 | -0.317 | -0.213 | 0.049 | 0.619 | 0.426 | 0.616 | -0.296 | 1 |
很强的相关性之间观察到兆瓦和沙(r = 0.995),高之间的负相关是MW和Et (r = -0.965),并观察沙和外星人之间高度相关(r = -0945)
表3。相关矩阵(皮尔森(n))之间的不同获得的描述符。
根据飞机F1-F2和分析预测F1-F3(分别为51.31%和46.31%的总方差)的研究分子(图2)表明,分子分散在两个区域:区域1包含的化合物有一个值能源等-49709.561 (eV)和-45559.132 (eV)之间,地区2包含化合物总量的价值能源等-45211.746 (eV)和-38920.188 (eV)之间。
看不到多元线性回归(MLR)
建立定量的关系抑制之间的肿瘤体重日志(IT)和选择的描述符,我们的阵列数据进行多元线性回归。只保留变量的系数是显著的。
建模的抑制肿瘤细胞日志(IT)所有培训的价值化合物(5-N-substituted 2 -(取代benzenesulphonyl)谷氨酰胺)导致相对应的最佳值的线性组合以下描述符:日志分配系数P,马利肯指控ChM,空间能源电负性,偶极矩µ,绝对χ,总TNC负电荷的分子,激活能源E一个。
最重要的构象模型了,见以下方程:
日志(IT) = 2, 34 + 0, 45×logP-7, 03年×ChM + 1, 57×10-03年Es + 8, 08年×10-02年66××µ-0χ+ 0,46×过渡委员会+ 0,15×E一个(5)
我们30化合物,实验和计算对数之间的关系(IT)在此基础上模型很重要(图3)的统计值:
N = 30 R2= 0.626= 0.606= 0.184 F = 5.255 RMSE = 0.134 P < 0.0001
在上面的回归方程中,N是许多化合物,相关系数R, F是费雪的测试,RMSE均方根误差和P是显著性水平。一般来说,较高的相关系数和降低标准误差,模型越可靠。高F值和P远小于0.05表明eqn的重要性。(5),它反映了方差比率的解释模型和方差的误差模型。基于eqn。(5),日志的正相关系数P,μ,过渡委员会和E一个与更大的值表明,复合这些描述符将有更大的日志(IT)值(增加抑制肿瘤细胞),ChM负相关,χ表明复合这些描述符与更大的值会有一个较小的日志(IT)值(减少抑制肿瘤细胞)。
预测和观察活动的相关性,说明剩余价值图3。
的图3显示了一个非常普通的日志(IT)值分配取决于实验值。
作为这一结论的一部分,我们可以说的抑制肿瘤细胞日志(IT)值从高是好相关的观测值。
在这个工作中,方差膨胀因子(VIF)计算测试中如果存在多重共线性描述符被定义为:
(6)
,r是多元回归自变量之间的相关系数和其他人。如果VIF = 1,每个变量之间不存在自相关,当VIF范围从1.0到5.0,相关方程是可以接受的;如果VIF > 10.0,回归方程是不稳定的,再检查是必要的。我们可以看到表4的VIF值描述符都不到5和两个描述符不超过10,表明不存在多重共线性在选定的描述符和由此产生的模型具有良好的稳定性。
描述符 | VIF | 老 | 界值 |
---|---|---|---|
日志P | 8.780 | 0.386 | 5.027 |
化学加工 | 2.499 | 0.206 | -4.694 |
西文 | 1.789 | 0.174 | 3.004 |
米 | 3.177 | 0.232 | 1.859 |
χ | 2.496 | 0.206 | -2.159 |
过渡委员会 | 8.558 | 0.382 | 4.498 |
Ea | 3.051 | 0.228 | 2.551 |
表4。VIF SR和t测试值定量构效关系模型的描述符。
为了区分每个描述符的重要性在谷氨酰胺的抗肿瘤,标准回归系数(SR)和t测试值的七个描述符也列入表4。所示表4老的绝对值和t测试日志P值0.386和5.027,分别比其他描述符,这表明定量构效关系模型,在此日志P在抗肿瘤的影响细胞比其他的更强。
描述符的分析和解释
基于eqn。(5),我们将试图解释机制的抑制肿瘤活动的5-N-substituted 2 -(取代benzenesulphonyl)谷氨酰胺,在以下:
分配系数(日志P)作为最重要的描述符出现的定量构效关系模型,推导出它的最重要的描述符抗癌细胞。发达模型表明,更高的亲油性好比例肿瘤抑制。亲油性对谷氨酰胺化合物是非常重要的渗透,运输和生物蓄积肿瘤细胞。的扩散谷氨酰胺化合物的生物膜是由脂质膜和不移动的水溶剂层的内部和外部的表面膜。谷氨酰胺化合物与高logp更有可能提供更好的抗癌活性。
总负电荷过渡委员会遵循日志P,也就是一个很好的这个模型的重要描述符。过渡委员会的大小可能描述原子电荷,相关化合物的活性中心。过渡委员会表明,减少活性部位的原子电荷产生更强的约束力,因此可能增强抗癌活性。所以,谷氨酰胺化合物较低的过渡委员会有更强的电子基组苯响了,稍微活动做出贡献。
偶极矩µ特征分子的平均电荷分离系统,并能代表化合物的电子信息。此外,µ可以部分反映分子极性,它可能是对抗癌价值就是明证有利的贡献积极的回归系数。µ价值越高,越容易这些谷氨酰胺参与某些取向或极地与目标类型的交互细胞,导致更大的抗癌活性。激活能源E一个由系统和温度影响吗能源这之间的排斥反应中心能源影响反应的电荷分布中心,抑制肿瘤积极活动不同的激活能源E一个的谷氨酰胺代替。空间能源Es依赖谷氨酰胺取代基组的立体效应,讨论了取代基的电荷分布的这种效应的分子轨道方法被尝试区分影响的π电子感应和中介的谷氨酰胺取代基的影响,我们可以说R5的立体散装位置和芳香兰德可能不是有用的活动或可能有害的活动,和一些组织如R5取代基的长度也略微导致活动,解释较小的团体在R5位置或芳香响了会给更好的配体适应活性部位。
在eqn提出的描述符。(5)高钙,因此,作为输入参数的非线性回归(MNLR)和倍数人工神经网络(安)。
多元非线性回归(MNLR)
我们也使用非线性回归技术模型提高定量地预测活动。它考虑几个参数。这是最常见的多维数据研究工具。显然我们已经应用到数据矩阵构成的高提出的描述符对应30谷氨酰胺化合物用于训练集。
由此产生的方程是:
日志(IT) = -89, 94 + 0, 53×日志P + 3, 89×ChM + 3, 63 e 03×Es + 0, 97×μ-39,69×χ+ 1,34×TNC-0, 32×Ea + 9, 43×103×(LogP)2-36、99×(ChM)24、50×106×(Es)26日,35×102×(μ)24,06年×(χ)2+ 3,85×102×(TNC)2+ 8、11×102×(Ea)2(7)
N = 30, R2= 0.792 > 0.6,RMSE = 0.121
预测和观察活动的相关性,说明剩余价值图4。
人工神经网络(ANN)
安已经成为一个重要的定量构效关系研究和广泛使用的非线性建模技术,它可以用于生成预测模型的定量结构活性的关系(构象)之间的一组分子描述符从高钙和观测值的获得抗肿瘤活动日志(它)。
相关性系数和标准估计误差,获得与安,显示选中的描述符由高相关,模型提出了预测抗癌活动有关。安之间的相关性计算和实验活动和残留值是非常重要的图5和的R和R2值。
的值预测活动使用ANN计算和观测值给出表5。
方法 | 离开很多交叉验证 | 测试集 | ||||
---|---|---|---|---|---|---|
N | R | R2 | N | R | R2 | |
高钙 | 30. | 0.799 | 0.636 | 6 | 0.816 | 0.662 |
MNLR | 30. | 0.777 | 0.604 | 6 | 0.830 | 0.690 |
安 | 30. | 0.871 | 0.760 | 6 | 0.900 | 0.821 |
表5所示。获得的模型之间的性能比较高,RNLM和安。
模型验证
为了检查可靠性和构象的稳定性模型阐述了高钙,MNLR和ANN方法,我们使用了内部和外部验证。三个模型的leave-many-out交叉验证,显示良好的模型的鲁棒性。此外,预测实现的测试集是在良好的协议与实验值。真正的构象的预测能力模型是测试他们的能力来预测准确谷氨酰胺化合物的抗癌活性从外部测试集:6-9-16-24-27-35(化合物没有用于哪一个模型开发)。
的值的比较日志(IT-test)日志(IT-obs)表明,一个好的预测已经获得了6个化合物。主要性能参数的三个模型所示表5。
应用领域
广告是一个重要的工具,可靠的定量构效关系模型的应用,而插值空间的特征定义广告具有重要的意义。我们有报道,web应用程序可以很容易地用于识别Xoutliers的训练集化合物和检测的测试化合物驻留在应用化学领域使用描述符池的训练集和测试集。所选的四个分子描述符模型是用于杠杆的计算值:即行向量描述符的化合物,X的矩阵模型扣除从训练集的描述符和T矩阵转置的记者。
关键杠杆h *是固定在(3 P + 1) / N、P和N分别描述符的数量和训练集化合物的数量。如果h > h *,预测的化合物可以被认为是不可靠的,反之亦然。见的威廉姆斯图图6除了化合物6 9和24外(标准化剩余少或超过标准差单位(±3 ?),大多数的分子在训练集和测试集(91.66%)属于化学领域的适用性,然后由发达构象预测抑制活动模型是可靠的。
Y-Randomization
在该测试中,随机RML, RNLM和ANN模型是由随机洗牌因变量在保持独立的变量。定量构效关系模型的新料低R2和Q2值几个试验,证实了定量构效关系模型是健壮和发达的结果RML, RNLM和ANN方法并不是由于一个机会训练集的相关性。
比较高的质量,MNLR和ANN模型表明,ANN是最好的模型,表明这些描述符的影响研究的生物活性化合物(表6)。
迭代 | 高钙 | MNLR | 安 | |||||
---|---|---|---|---|---|---|---|---|
问2 | R2 | 问2 | R2 | 问2 | R2 | |||
1 | 0.421 | 0.540 | 0.435 | 0.476 | 0.435 | 0.440 | ||
2 | 0.347 | 0.407 | 0.389 | 0.390 | 0.279 | 0.530 | ||
3 | 0.291 | 0.301 | 0.279 | 0.321 | 0.299 | 0.371 | ||
4 | 0.161 | 0.251 | 0.198 | 0.254 | 0.223 | 0.451 | ||
5 | 0.369 | 0.464 | 0.317 | 0.592 | 0.217 | 0.364 |
表6所示。Y-Randomization验证结果CoMFA和CoMSIA模型(Q2和R2值几个Y-randomization测试后)。
以上讨论的结果表明,高钙,MNLR和ANN模型可以有效地用于预测5-N-substituted-2的日志(IT)——(代替benzenesulphonyl)谷氨酰胺化合物与不同的替换,他们能够建立一个令人满意的关系之间的分子描述符和抗肿瘤活性的化合物进行了研究。
值的相关系数的六个化合物(测试集),旨在系数(训练集)和其他统计参数的这些方法(高钙,MNLR和安),很明显,我们的模型的预测能力也同样健壮和稳定,它可以有效地用于估计其他一些谷氨酰胺化合物的抗肿瘤活性的实验数据是可用的。
的预测抗肿瘤活性值5-N-substituted-2 -(取代benzenesulphonyl)谷氨酰胺化合物的训练集,通过不同的方法中列出表7连同他们的观察活动。
不。 | 日志(它) | ||||||
---|---|---|---|---|---|---|---|
观察到的 | RML | MNLR | 安 | ||||
预测 | 残留 | 预测 | 残留 | 预测 | 残留 | ||
1 | 1.722 | 1.713 | 0.009 | 1.709 | 0.013 | 1.682 | 0.040 |
2 | 1.699 | 1.793 | -0.094 | 1.725 | -0.026 | 1.775 | -0.076 |
3 | 1.398 | 1.499 | -0.101 | 1.277 | 0.121 | 1.443 | -0.045 |
4 | 1.574 | 1.546 | 0.028 | 1.638 | -0.064 | 1.489 | 0.085 |
5 | 1.837 | 1.650 | 0.187 | 1.718 | 0.119 | 1.632 | 0.205 |
6 * | 1.398 | 1.916 | -0.518 | 1.999 | -0.601 | 1.402 | -0.004 |
7 | 1.699 | 1.770 | -0.071 | 1.753 | -0.054 | 1.704 | -0.005 |
8 | 1.796 | 1.751 | 0.045 | 1.737 | 0.059 | 1.686 | 0.110 |
9 * | 1.796 | 1.403 | 0.393 | 1.319 | 0.477 | 1.758 | 0.038 |
10 | 1.079 | 1.360 | -0.281 | 1.250 | -0.171 | 1.317 | -0.238 |
11 | 1.519 | 1.539 | -0.020 | 1.565 | -0.046 | 1.443 | 0.076 |
12 | 1.519 | 1.673 | -0.154 | 1.529 | -0.010 | 1.568 | -0.049 |
13 | 1.779 | 1.626 | 0.153 | 1.727 | 0.052 | 1.745 | 0.034 |
14 | 1.784 | 1.783 | 0.001 | 1.782 | 0.002 | 1.745 | 0.039 |
15 | 1.828 | 1.746 | 0.082 | 1.772 | 0.056 | 1.750 | 0.078 |
16 * | 1.695 | 1.542 | 0.153 | 1.625 | 0.070 | 1.630 | 0.065 |
17 | 1.611 | 1.646 | -0.035 | 1.638 | -0.027 | 1.583 | 0.028 |
18 | 1.432 | 1.334 | 0.098 | 1.356 | 0.076 | 1.297 | 0.135 |
19 | 1.431 | 1.491 | -0.060 | 1.487 | -0.056 | 1.412 | 0.019 |
20. | 1.617 | 1.506 | 0.111 | 1.481 | 0.136 | 1.456 | 0.161 |
21 | 1.396 | 1.431 | -0.035 | 1.472 | -0.076 | 1.452 | -0.056 |
22 | 1.774 | 1.521 | 0.253 | 1.590 | 0.184 | 1.579 | 0.195 |
23 | 1.576 | 1.399 | 0.177 | 1.517 | 0.059 | 1.420 | 0.156 |
24 * | 1.662 | 1.301 | 0.361 | 1.313 | 0.349 | 1.595 | 0.067 |
25 | 1.548 | 1.672 | -0.124 | 1.611 | -0.063 | 1.663 | -0.115 |
26 | 1.349 | 1.522 | -0.173 | 1.527 | -0.178 | 1.533 | -0.184 |
27 * | 1.775 | 1.509 | 0.266 | 1.530 | 0.245 | 1.642 | 0.133 |
28 | 1.956 | 1.949 | 0.007 | 1.974 | -0.018 | 1.829 | 0.127 |
29日 | 1.585 | 1.618 | -0.033 | 1.660 | -0.075 | 1.549 | 0.036 |
30. | 1.817 | 1.774 | 0.043 | 1.765 | 0.052 | 1.758 | 0.059 |
31日 | 1.745 | 1.812 | -0.067 | 1.843 | -0.098 | 1.847 | -0.102 |
32 | 1.751 | 1.736 | 0.015 | 1.784 | -0.033 | 1.807 | -0.056 |
33 | 1.815 | 1.757 | 0.058 | 1.880 | -0.065 | 1.837 | -0.022 |
34 | 1.618 | 1.726 | -0.108 | 1.595 | 0.023 | 1.682 | -0.064 |
35 * | 1.574 | 1.604 | -0.030 | 1.633 | -0.059 | 1.501 | 0.073 |
36 | 1.850 | 1.759 | 0.091 | 1.745 | 0.105 | 1.736 | 0.114 |
*测试集
表7所示。观察,预测日志(IT)和残留根据不同的方法。
结论
在目前的工作中,我们有%的抑制作用进行了比较分析肿瘤体重日志(IT)谷氨酰胺化合物的定量构效关系的方法,由三个高钙,MNLR和安。这两种方法都显示良好的预测能力。比较高的品质,MNLR和ANN模型表明,ANN具有良好的预测能力和强鲁棒性比高收益率回归模型改进的预测能力,我们建立了几个描述符和%抑制之间的关系肿瘤体重日志(IT)。获得模型的预测能力和鲁棒性评估通过交叉验证,通过测试集和外部验证。因此,模型可以有效地用于估计选择描述符的抗肿瘤活性和影响生物活性,这足够丰富的化工、电子和拓扑信息编码的结构特性。
目前的研究表明,分子描述符,即分配系数日志P,马利肯指控ChM,空间能源电负性,偶极矩µ,绝对χ,总TNC负电荷的分子,激活能源E一个最好的,是有用的预测%的抑制肿瘤细胞5-N-substituted-2 -(取代benzenesulphonyl)谷氨酰胺化合物,实验数据不可用。
的构象模型统计上显著的,健壮的,可用于预测活动更准确地说,它可能有助于更好的理解这类化合物的抗癌活性和有用的指导,评估抗肿瘤吗细胞作为新谷氨酰胺化合物的生物活性。
承认
我们感激“协会Marocaine des Chimistes Theoriciens”(AMCT)有关项目的相关帮助。
引用
- Kamal, Balakishan G,室利罗摩克里希纳G . et al .合成和生物评价相关的cinnamido pyrrolo [2 1 - c][1,4]苯二氮卓类抗有丝分裂的药物。欧元J医疗化学2010;45:3870 - 84。
- 科斯塔C, Huneau摩根富林明,多美d谷酰胺Caco-2细胞分化期间运输的特点。生物化学Biophys Acta /生物膜。2000;95:1509。
- 史密斯Zalkin H,杰。利用谷氨酰胺酶作为酰胺捐献者。副词Enzymol遗传代数领域杂志。1998;72:87。
- Srikanth K, Debnath b合成、生物定量构效关系研究评价和抗肿瘤活性的1 5 N, N′-disubstituted-2——glutamamides (benzenesulphonyl代替)。T Jha Bioorg地中海化学2002;10:1841-54。
- Goodarzi M, Freitas MP,詹森r .蚁群优化的定量构效关系模型中的特征选择方法anti-HIV-1活动3 - (3 5-dimethylbenzyl)使用高钙尿嘧啶衍生品,请和SVM回归。Chemom智能实验室系统。2009;98:123。
- 沈问,焦江泽民JH,残雪,et al。修改后的粒子群优化算法中的变量选择高钙和PLS建模:拮抗血管紧张素ⅱ拮抗剂构象的研究。欧元J制药科学。2004;22:145。
- 布卢姆BJW Speece再保险。定量结构活性的关系化学毒性环境细菌。Ecotoxicol环境安全。1991;22:198。
- 负担FR,温克勒哒。定量结构活性的关系模型急性毒性的取代苯四膜虫pyriformis使用Bayesian-regularized神经网络。化学Res Toxicol。2000; 13:436。
- 埃斯特拉达大肠的拓扑sub-structural分子设计(TOSS-MODE)在定量构效关系和药物设计研究部分。11 SAR构象环境研究》2000;55。
- 伊凡D, L Crisan Funar-Timofei年代,et al .定量结构活性的关系研究anti-HIV-1活动1 - (2-hydroxyethoxy) methyl-6 - (phenylthio)胸腺嘧啶衍生品使用多元线性回归和偏最小二乘方法。J塞族化学Soc。2013; 78:495。
- 法特米MH、Malekzadeh带领h .预测日志(IGC50) 1苯衍生品纤毛虫四膜虫pyriformis从他们的分子描述符。牛化学Soc日本。2010;83:233。
- 克罗宁MTD, Gregory BW舒尔茨太瓦。定量构效分析的硝基苯中毒四膜虫pyriformis。化学Res Toxicol。1998; 11:902。
- Sarkar U, Parthasarathi R,萨勃拉曼尼亚V,等。多氯氧芴的毒性分析通过全球和当地的亲电性。J摩尔Struct THEOCHEM。2006;758:119-25。
- Srikanth K, Kumar CA, Ghosh B等。合成、筛选和定量构效关系(构象)研究谷氨酰胺的类似物可能的抗癌活性。地中海Bioorg化学2002;10:2119-31。
- 弗里希乔丹。高斯03,M J修订B.01高斯公司匹兹堡。2003年。
- 李C,杨W,帕尔RG。发展Colle-Salvetti相关能成有功能的电子密度的公式。phy启1988;37:785-9。
- Elidrissi B, Ousaa Ghamali M, et al .定量构效关系预测结果结合DFT和生物活性的1 - (2-ethoxyethyl) 1 h-pyrazolo [4、3 d]嘧啶V磷酸二酯酶抑制剂。J Com冰毒Molec设计。2014;4 (4):140 - 9。
- Elidrissi B, Ousaa Ghamali M, et al .硝基苯的急性毒性四膜虫pyriformis定量构效关系研究:结合DFT和。铁道部J化学。2015;3 (4):848 - 60。
- Chtita年代,Larif M,尹浩然,Ghamali。两个不同的研究癌症细胞系活动(mdamb - 231和SK-N-SH)咪唑并[1,a]吡嗪衍生物结合DFT和构象的结果。IJIRSET。2013;2 (11):6586 - 601。
- Ousaa A、B Elidrissi Ghamali M, et al .卤代酚类的急性毒性:结合DFT和构象的研究。JCMMD。2014;4(3):可达。
- Elidrissi B, Ousaa Ghamali M, et al。生物活性的吡嗪酰胺衍生品作为herbicidal代理:结合DFT和构象的研究。JCMMD。2015;5 (2):83 - 91。
- Hmamouchi R, Larif M, Adad, et al。结构活动和预测生物活性的化合物(2-methyl-6-phenylethynylpyridine)衍生品的关系依赖于电子和拓扑描述符。JCMMD。2014;4 (3):61 - 71。
- 王D元Y,段年代,et al。部分研究碳环硝基芳香化合物的熔点化合物通过多元线性回归和人工神经网络。化学强度非饱和Sys。2015; 143:7-15。
- 埃夫隆b .估计预测错误率的规则:改进交叉验证。Stat Assoc J。1983; 78:316-31。
- Efroymson马,拉斯顿公司商品。多元回归分析在数字计算机的数学方法。威利纽约。1960年版。
- Osten DW。选择最优回归模型通过交叉验证。J Chemom。1998; 2:39-48。
- 罗伊·K,密特拉我,凹地年代,et al。比较研究在一些指标为溶剂的分子结构外部验证模型。J化学正模型。2012;52:396 - 408。
- Ojha PK,密特拉我,Das R, et al。进一步探索rm2部分模型的指标进行验证。Chemom智能实验室系统。2011;107:194 - 205。
- 洛克C,洛克G, Meringer m . Y-Randomization及其变体部分构象。J化学有限公司和Mod。2007; 47:2345-57。
- 李PY,陈CYJ。镉对肠道细菌群落的影响Metaphire posthuma。风险。板牙。2009;165:156 - 61。
- 马金J, schmied P,威斯g .吸收动力学的有机化学运输在鳟鱼鳃将辛醇和水相关的分离系数。Toxicol:制药。1985;77:1 - 10。
- 妞妞摩根富林明,于g .分子结构特性管理biocatalytic氧化血红蛋白的多环芳烃。环境Toxicol Phar。2004; 18:39-45。
- 张HJ,张司法院,朱镕基,在体外淋巴细胞的定量构效关系机制的调查细胞凋亡取代芳香毒物引起的。鱼贝类Immun。2008; 25:710-7。
- 罗伊·K·卡尔,Ambure p在一个简单的方法来确定域定量构效关系模型的适用性。化学英特尔劳动系统。2015;145:22-9。