44 7460 854 031

所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

原文

数量:15 (4)

定量结构活性关系(构象)研究谷氨酰胺的类似物可能的抗癌活性

*通信:
Elidrissi B分子化学和天然物质实验室,科学教师,大学的慕雷·伊斯梅尔,摩洛哥梅克内斯
电话:+ 212 - 607662438;电子邮件:elidrissi.info@gmail.com

收到日期:2017年8月08接受日期:2017年9月8日发表日期:2017年9月12日

引用:Elidrissi B, Ousaa Ajana MA、et al .定量构效关系(构象)研究谷氨酰胺的类似物可能的抗癌活性。Int J化学科学。2017;15 (4):192

文摘

执行定量组织性能的关系(部分)的一项研究预测抗癌活动肿瘤细胞36 5-N-substituted-2 -(取代benzenesulphonyl)谷氨酰胺化合物使用电子和网络拓扑描述符计算分别用ACD /化学草图和高斯03 w项目。所有36个化合物的结构进行了优化使用混合密度泛函理论(DFT) B3LYP /我感觉(d)的理论水平。在这两种方法,30化合物分配作为训练集,其余作为测试集。分析了这些化合物的主成分分析(PCA)方法,后代多元线性回归(高),和一个多元非线性回归(MNLR)分析人工神经网络(安)。获得模型的鲁棒性是评估leave-many-out交叉验证,通过测试集和外部验证。这项研究表明,略微安了更好的预测抗肿瘤活性相比,结果由高钙和MNLR给出的预测。

关键字

DFT;构象;肿瘤细胞;人工神经网络;交叉验证

介绍

癌症仍然是世界上死亡的原因之一,因此迫切需要发展的新颖和有效的治疗方法。尽管现代的许多领域取得重大突破医学在过去的100年里,成功的治疗癌症仍然是一个重大挑战的21世纪。很难知道小说和检测代理,有选择地杀死肿瘤细胞或抑制其增殖而不被有毒的(1]。的癌症被描述为氮陷阱。(2谷氨酰胺(GLN),非必需氨基酸,起着关键作用肿瘤细胞生长通过提供的酰胺氮原子从花色其他氨基酸、嘌呤、嘧啶基地、氨基糖和辅酶(3),通过一个家庭由16个氨基转移酶(4与多样化的机制)。因此,合成了不同结构的谷氨酰胺,据说可能抗癌活动GLN [5]。

在这项研究中,我们模拟了抗癌活性(抑制肿瘤(IT)) 36个新的5-N-substituted-2 -(取代benzenesulphonyl)与不同的替换(谷氨酰胺表1),使用一些统计工具,主成分分析(PCA),多元线性回归(高),多元非线性回归(MNLR)和人工神经网络(安)计算6,7]。的定量构效关系(构象)方法关注的座右铭,化合物的活动是由其分子结构决定的。(8]因此,基于精确的实验数据只在一组的一些化学物质,化学物质的生物活性在整个集团可以使用合适的预测模型,包括尚未实验合成的化合物(9- - - - - -13]。

这项工作的目标是开发定量构效关系模型和预测来确定我们的化学结构特点之间的重要研究抗肿瘤的分子细胞活动。因此,大量的量子化学计算方法和执行为研究分子结构和抗肿瘤活性14]。

在目前的工作,发现分子结构之间的定量关系和抗肿瘤活性的数据采取Srikanth et al。14看不到),我们用多元线性回归(MLR),多元非线性回归(MNLR)和人工神经网络(安)15]。我们计算了电子高斯03定量构效关系集生成的描述符。高钙是用来选择分子的结构特点与抗肿瘤活性和相关构造线性模型,最后一个模型用于选择描述符作为输入,安了非线性模型。模型都验证了一个内部验证方法包括特征鲁棒性交叉验证和外部验证来估计模型的预测能力。决赛,最终目标是建立定量构效关系模型可靠的抑制肿瘤(体重预测5-N-substituted-2) -取代benzenesulphonyl谷氨酰胺。

材料和方法

实验数据

36抗肿瘤活性的实验值新5-N-substituted-2——(代替benzenesulphonyl)谷氨酰胺是取自文献[15]。为肿瘤生长抑制、抗肿瘤活性的抑制百分比的基础上评估肿瘤(%)。生物活性(IT)数据校准其对数的值(日志)。化合物及其相应的生物活动日志(IT)所示值图1表1

Chemical-Sciences-glutamines

图1:化学结构5-N-substituted-2 -谷氨酰胺(benzenesulphonyl代替)。

分子描述符的计算

DFT(密度泛函理论)方法被用于这项研究。这些方法已成为近年来非常受欢迎的,因为他们可以达到相似的精度的其他方法用更少的时间和更少的成本计算的观点。在协议与DFT结果,能源polyelectronic系统的的基本状态通过总电子密度可以表示,事实上,使用电子密度而不是波函数计算能源构成了DFT的基本基础(16,17)用B3LYP功能(18)和我(d)基础集。B3LYP, DFT方法的一个版本,使用贝克的带三个参数的功能(B3)和包括一个混合的高频DFT交换条件与李的梯度修正相关功能,杨和帕尔(LYP)。所有的几何物种在调查中确定了通过优化所有几何变量没有任何对称约束。

分子性质的计算:最高占据分子轨道能源E人类(eV),最低未占据分子轨道能源ELUMO(eV),偶极矩μ(德拜)能源ET (eV),激活能源E一个(eV),绝对的电负性χ(eV)和总负电荷的分子过渡委员会(19- - - - - -22]。

χ是由以下方程:方程(1)

另一方面,ACD / ChemSketch和化学3 d程序(23是用来计算的拓扑描述符:分子量兆瓦(cm3),密度D (g / cm3),分配系数LogP,弯曲能源Eb(千卡每摩尔),电子能源Ee(千卡每摩尔),空间能源Es(千卡每摩尔),形状属性ChA,形状系数自燃,马利肯ChM指控。

统计分析

主成分分析(PCA):5-N-substituted-2的化合物——(代替benzenesulphonyl)谷氨酰胺(1 - 36)统计方法研究了基于主成分分析(PCA) (22使用软件XLSTAT 2015]。本质上这是一个描述性统计方法旨在在场,以图形形式,最大的信息中包含的数据表1

复合 R1 R2 R3 R4 R5 %的抑制肿瘤重量(它) 日志(它)
1 H H H H i-Butyl 52.73 1.722
2 H H CH3 H i-Propyl 50.00 1.699
3 H H CH3 H i-Butyl 25.00 1.398
4 CH3 H H 没有2 H 37.5 1.574
5 CH3 H H 没有2 CH3 68.75 1.837
6 * CH3 H H 没有2 C2H5 25.00 1.398
7 CH3 H H 没有2 c3H7 50.00 1.699
8 CH3 H H 没有2 c4H9 62.50 1.796
9 * CH3 H H 没有2 i-Propyl 62.50 1.796
10 CH3 H H 没有2 i-Butyl 12.00 1.079
11 CH3 H H 没有2 C6H11 33.00 1.519
12 CH3 H H 没有2 C6H5 33.00 1.519
13 CH3 H H 没有2 C6H5CH2 60.17 1.779
14 CH3 H H 没有2 c5H11 60.83 1.784
15 CH3 H H 没有2 c6H13 67.37 1.828
16 * H 没有2 CH3 H H 49.53 1.695
17 H 没有2 CH3 H CH3 40.86 1.611
18 H 没有2 CH3 H C2H5 27.05 1.432
19 H 没有2 CH3 H c3H7 26.95 1.431
20. H 没有2 CH3 H c4H9 41.37 1.617
21 H 没有2 CH3 H c5H11 24.88 1.396
22 H 没有2 CH3 H c6H13 59.45 1.774
23 H 没有2 CH3 H i-Propyl 37.64 1.576
24 * H 没有2 CH3 H i-Butyl 45.95 1.662
25 H 没有2 CH3 H C6H11 35.33 1.548
26 H 没有2 CH3 H C6H5CH2 22.35 1.349
27 * H 没有2 CH3 H C6H5 59.60 1.775
28 H H C2H5 H CH3 90.45 1.956
29日 H H C2H5 H C2H5 38.46 1.585
30. H H C2H5 H c3H7 65.64 1.817
31日 H H C2H5 H c4H9 55.64 1.745
32 H H C2H5 H c5H11 56.36 1.751
33 H H C2H5 H c6H13 65.37 1.815
34 H H C2H5 H CH (CH3)2 41.53 1.618
35 * H H C2H5 H C6H5CH5 37.50 1.574
36 H H C2H5 H C6H5 70.76 1.850

表1。(实验抗肿瘤活性5-N-substituted-2) -取代benzenesulphonyl谷氨酰胺值36分子。

主成分分析是一种统计技术用于总结所有的信息的编码结构的化合物。也非常有助于了解化合物的分布。

看不到多元线性回归(MLR):多元线性回归统计技术被用来研究一个因变量和几个自变量之间的关系。这是一个数学技术,最大限度地减少实际值和预测值之间的区别。高钙方程的统计数据的质量评价参数如R值(相关系数),F值(费舍尔统计)和RMSE值(根均方误差)。

多元线性回归模型(高)242015年)是使用软件生成XLSTAT预测抗肿瘤活性(IT)。也曾选择描述符作为输入参数的多元非线性回归(MNLR)和人工神经网络(安)。

人工神经网络(ann)

非线性模型被开发的提交选择的描述符从高到三层,完全连接,前馈安。输入神经元的数量等于线性模型的描述符。隐藏的神经元的数量被试错过程优化的培训过程。一个输出神经元被用来代表实验%抑制肿瘤体重日志(IT)。为了避免过度训练,十分之一的训练集的数据是随机选择作为一个独立的验证集监控培训过程中培训的网络性能监控预测的值时系统验证集。结果验证设置不再提高,训练是停止25]。

模型评估和验证

为了检查的可靠性和构象的稳定性模型阐述了高钙,MNLR和ANN方法,内部和外部进行了验证。善良的拟合是首先确定系数(R的特征2计算和实验值之间)的分子训练集,由方程给出的公式:

方程(2)

在哪里方程方程是观察,分别计算和平均值的活动。

交叉验证是一个最受欢迎的方法,估算模型的鲁棒性。基于这种技术,修改数据集是由删除在每种情况下的一个或少数分子,这些程序分别命名为“分析”和“leave-some-out”[26- - - - - -28]。在这部作品中,内部的预测能力模型评估了leave-many-out交叉验证方程在数学形式:

方程(3)

模型的可靠性和健壮性进一步验证通过使用外部测试集组成的数据不能用于开发预测模型。外部方程测试集的确定与以下方程:

方程(4)

在哪里方程方程是观测值,测试集的计算值和平均值的训练集的活动,分别。

构象模型是成功的,如果它满足以下标准:方程

进一步完善定量构效关系模型的预测能力发达,另一组指标:使用rm 2指标。他们决定之间的近距离观察和预测活动,介绍了由罗伊和Ojha [27,28]。他们计算基于观察和预测响应数据之间的相关性。目前两个不同指标计算培训(内部验证)和测试集(外部验证):方程方程为一个可接受的构象模型方程应该> 0.5,方程应该是< 0.2。

Y-Randomization测试

模型也对机会相关的评估Y-randomization [29日- - - - - -31日]。属性值被随机分配在训练集由许多迭代。从每一个新的随机数据集,一个新的模型构象再次计算,表演将低Q2和R2值比原模型。最后,平均的Q值2和R2计算检查原来的吗模型强烈的性能比随机的(表2)。

日志(它) 兆瓦 D LogP Eb 化学加工 西文 Ee 人体自燃 Et E人类 ELUMO χ 过渡委员会 E一个
1.722 342.41 1.253 0.733 13.343 0.131 118.836 -31761年 21.043 1.00 -39990.72 -6.621 -3.195 7.688 -4.908 -9.910 2.763
1.699 342.41 1.253 1.003 13.352 0.133 81.472 -31303年 21.043 0.85 -39990.88 -6.637 -3.305 8.023 -4.971 -9.805 2.205
1.398 356.44 1.231 1.221 13.547 0.132 89.597 -55577年 22.041 0.85 -41061.16 -6.553 -2.441 6.856 -4.497 -10.526 4.327
1.574 345.33 1.501 -0.597 13.445 0.151 124.324 -31824年 21.043 0.83 -42347.69 -6.594 -3.292 7.613 -4.943 -9.125 4.038
1.837 359.35 1.428 -0.361 13.446 0.148 237.583 -33793年 22.041 1.00 -43418.03 -6.574 -3.214 7.885 -4.894 -9.418 3.641
1.398 373.38 1.392 -0.023 13.446 0.132 240.852 -35745年 23.040 0.87 -43418.03 -6.574 -3.214 7.885 -4.894 -9.418 3.632
1.699 387.41 1.361 0.463 13.446 0.125 243.938 -37609年 24.038 1.00 -45559.13 -6.561 -3.153 8.162 -4.857 -10.342 3.627
1.796 401.43 1.333 0.880 13.446 0.125 246.975 -39468年 25.037 0.85 -46629.64 -6.557 -3.137 8.215 -4.847 -10.790 3.620
1.796 387.41 1.359 0.295 13.727 0.135 237.493 -38022年 24.038 0.85 -45559.20 -6.535 -2.853 8.055 -4.694 -10.375 3.138
1.079 401.43 1.332 0.513 13.717 0.134 243.411 -40586年 25.037 0.85 -46629.58 -6.522 -2.685 8.206 -4.603 -10.989 4.237
1.519 427.47 1.390 1.187 13.924 0.128 242.563 -43662年 27.034 0.85 -48738.06 -6.528 -2.720 7.399 -4.624 -11.186 4.086
1.519 421.42 1.452 1.302 13.445 0.199 249.208 -41243年 27.034 0.87 -48639.08 -6.425 -3.630 7.482 -5.027 -10.095 2.779
1.779 435.45 1.394 1.372 13.446 0.198 241.799 -44337年 28.033 1.00 -49709.56 -6.521 -2.985 7.825 -4.753 -9.735 2.235
1.784 415.46 1.307 1.298 13.687 0.127 244.960 -41310年 26.035 1.00 -47700.16 -6.522 -2.873 8.439 -4.697 -11.076 4.063
1.828 429.49 1.285 1.715 13.884 0.118 242.747 -43102年 27.034 0.88 -48770.67 -6.521 -2.872 8.430 -4.697 -11.687 4.056
1.695 345.33 1.501 -0.597 13.445 0.148 108.939 -31556年 21.043 0.83 -42347.62 -6.871 -2.875 8.074 -4.873 -9.111 4.025
1.611 359.35 1.428 -0.361 13.446 0.119 112.573 -33511年 22.041 1.00 -43418.07 -6.842 -2.905 7.832 -4.873 -9.390 3.584
1.432 373.38 1.392 -0.023 13.446 0.147 115.783 -35441年 23.040 0.85 -44488.66 -6.789 -2.860 7.610 -4.824 -9.869 3.588
1.431 387.41 1.361 0.463 13.446 0.124 118.840 -37291年 24.038 1.00 -45559.18 -6.755 -2.830 7.622 -4.792 -10.323 3.587
1.617 401.43 1.333 0.880 13.446 0.122 121.877 -39133年 25.037 0.87 -46629.69 -6.737 -2.815 7.851 -4.776 -10.770 3.583
1.396 415.46 1.307 1.298 13.446 0.125 124.904 -40938年 26.035 1.00 -47700.21 -6.726 -2.806 7.404 -4.766 -11.219 3.581
1.774 429.49 1.285 1.715 13.446 0.123 127.929 -42741年 27.034 0.88 -48770.72 -6.718 -2.800 7.592 -4.759 -11.493 3.580
1.576 387.41 1.359 0.295 13.727 0.170 125.653 32749年 24.038 0.85 -45559.13 -6.662 -2.597 9.093 -4.630 -10.361 5.547
1.662 401.43 1.332 0.513 13.924 0.133 119.540 34963年 25.037 0.85 -46629.51 -6.622 -2.510 8.816 -4.566 -10.973 4.855
1.548 427.47 1.390 1.187 13.924 0.132 137.258 38586年 27.034 0.87 -48737.89 -6.568 -2.518 9.352 -4.543 -11.196 5.527
1.349 435.45 1.394 1.372 13.446 0.198 116.706 37256年 28.033 1.00 -49709.30 -6.727 -2.954 7.714 -4.840 -10.027 3.355
1.775 421.42 1.452 1.302 13.445 0.200 120.216 35363年 27.034 0.87 -48639.18 -6.780 -2.942 7.562 -4.861 -10.073 3.668
1.956 328.38 1.281 0.763 13.276 0.114 92.524 24667年 20.045 0.85 -38920.18 -6.775 -2.892 6.000 -4.833 -9.405 3.405
1.585 342.41 1.255 1.102 13.276 0.148 95.753 26366年 21.043 1.00 -39990.78 -6.726 -2.848 6.040 -4.787 -9.886 3.413
1.817 356.44 1.231 1.588 13.276 0.123 98.816 27990年 22.041 0.87 -41061.30 -6.692 -2.818 5.839 -4.755 -10.339 3.412
1.745 370.46 1.211 2.005 13.276 0.127 101.852 29614年 23.040 1.00 -42131.81 -6.674 -2.804 5.943 -4.739 -10.624 3.408
1.751 384.49 1.192 2.422 13.276 0.124 104.880 31205年 24.038 0.88 -43202.32 -6.662 -2.795 5.928 -4.729 -11.235 3.407
1.815 398.52 1.176 2.840 13.276 0.121 107.905 32800年 25.037 1.00 -44272.83 -6.655 -2.789 6.160 -4.722 -11.684 3.406
1.618 356.44 1.230 1.420 13.557 0.144 92.273 28274年 22.041 1.00 -41061.36 -7.172 -2.857 6.204 -5.014 -10.371 3.384
1.574 404.48 1.275 2.496 13.401 0.199 96.369 33194年 26.035 0.88 -45211.74 -6.586 -2.854 6.211 -4.720 -10.412 3.284
1.850 390.45 1.324 2.427 13.276 0.200 100.248 31175年 25.037 1.00 -44141.30 -6.716 -2.869 5.375 -4.793 -10.089 3.649

表2。值计算的参数通过DFT / B3LYP ?我*优化研究的化合物。

结果与讨论

本研究进行了一系列的36个化合物5-N-substituted-2 -谷氨酰胺(benzenesulphonyl代替),为了确定结构之间的定量关系信息和这些谷氨酰胺化合物的抗肿瘤活性(IT)。

16集的36个化合物描述符编码5-N-substituted-2 -谷氨酰胺(benzenesulphonyl代替),电子、精力充沛和网络拓扑参数提交给PCA分析(32]。前三个主轴足以描述提供的信息数据矩阵。事实上,方差的百分比是30.36%,20.95%和15.95%的轴F1, F2和F3,分别。总信息估计的百分比为67.26%。主成分分析(PCA) [33,34)进行了识别不同变量之间的联系。大胆的值是不同的从0 p = 0.05的显著性水平。以下总结了皮尔森相关系数表3。获取矩阵提供负面信息或变量之间的正相关关系。

日志(它) 兆瓦 D LogP 海尔哥哥 化学加工 西文 Ee 人体自燃 E人类 ELUMO χ 过渡委员会 E一个
日志(它) 1
兆瓦 -0.143 1
D -0.214 0.160 1
LogP 0.244 0.402 -0.683 1
海尔哥哥 -0.252 0.463 0.261 -0.206 1
Char。 -0.087 0.300 0.386 0.166 -0.124 1
西文 -0.039 0.442 0.356 -0.210 0.435 -0.009 1
Ee 0.210 -0.044 -0.313 0.453 -0.166 0.282 -0.558 1
-0.128 0.995 0.150 0.450 0.416 0.374 0.408 0.002 1
人体自燃 0.112 0.037 -0.229 0.248 -0.334 0.065 -0.038 0.106 0.055 1
0.189 -0.965 -0.381 -0.162 -0.528 -0.302 -0.519 0.167 -0.949 0.019 1
E人类 -0.049 0.371 0.102 0.057 0.300 0.050 0.643 -0.353 0.363 -0.219 -0.366 1
ELUMO -0.151 0.165 -0.334 0.225 0.409 -0.243 -0.335 0.330 0.144 -0.095 -0.096 -0.194 1
-0.237 0.340 0.537 -0.560 0.686 -0.091 0.474 -0.412 0.281 -0.268 -0.503 0.338 -0.014 1
χ -0.170 0.357 -0.264 0.245 0.552 -0.205 0.028 0.124 0.333 -0.209 -0.290 0.355 0.848 0.169 1
过渡委员会 0.013 -0.614 0.516 -0.618 -0.408 0.336 -0.134 -0.071 -0.582 -0.003 0.477 -0.229 -0.498 -0.059 -0.598 1
E一个 -0.240 0.158 0.183 -0.209 0.640 -0.169 -0.010 0.210 0.115 -0.317 -0.213 0.049 0.619 0.426 0.616 -0.296 1

表3。相关矩阵(皮尔森(n))之间的不同获得的描述符。

根据飞机F1-F2和分析预测F1-F3(分别为51.31%和46.31%的总方差)的研究分子(图2)表明,分子分散在两个区域:区域1包含的化合物有一个值能源等-49709.561 (eV)和-45559.132 (eV)之间,地区2包含化合物总量的价值能源等-45211.746 (eV)和-38920.188 (eV)之间。

Chemical-Sciences-dispersal

图2:笛卡儿图显示两个地区之间的分离和不同分子的扩散组。

看不到多元线性回归(MLR)

建立定量的关系抑制之间的肿瘤体重日志(IT)和选择的描述符,我们的阵列数据进行多元线性回归。只保留变量的系数是显著的。

建模的抑制肿瘤细胞日志(IT)所有培训的价值化合物(5-N-substituted 2 -(取代benzenesulphonyl)谷氨酰胺)导致相对应的最佳值的线性组合以下描述符:日志分配系数P,马利肯指控ChM,空间能源电负性,偶极矩µ,绝对χ,总TNC负电荷的分子,激活能源E一个

最重要的构象模型了,见以下方程:

日志(IT) = 2, 34 + 0, 45×logP-7, 03年×ChM + 1, 57×10-03年Es + 8, 08年×10-02年66××µ-0χ+ 0,46×过渡委员会+ 0,15×E一个(5)

我们30化合物,实验和计算对数之间的关系(IT)在此基础上模型很重要(图3)的统计值:

Chemical-Sciences-observed-activity

图3:计算和观察活动的图形表示形式,并使用高残留值计算。

N = 30 R2= 0.626方程= 0.606方程= 0.184 F = 5.255 RMSE = 0.134 P < 0.0001

在上面的回归方程中,N是许多化合物,相关系数R, F是费雪的测试,RMSE均方根误差和P是显著性水平。一般来说,较高的相关系数和降低标准误差,模型越可靠。高F值和P远小于0.05表明eqn的重要性。(5),它反映了方差比率的解释模型和方差的误差模型。基于eqn。(5),日志的正相关系数P,μ,过渡委员会和E一个与更大的值表明,复合这些描述符将有更大的日志(IT)值(增加抑制肿瘤细胞),ChM负相关,χ表明复合这些描述符与更大的值会有一个较小的日志(IT)值(减少抑制肿瘤细胞)。

预测和观察活动的相关性,说明剩余价值图3

图3显示了一个非常普通的日志(IT)值分配取决于实验值。

作为这一结论的一部分,我们可以说的抑制肿瘤细胞日志(IT)值从高是好相关的观测值。

在这个工作中,方差膨胀因子(VIF)计算测试中如果存在多重共线性描述符被定义为:

方程(6)

,r是多元回归自变量之间的相关系数和其他人。如果VIF = 1,每个变量之间不存在自相关,当VIF范围从1.0到5.0,相关方程是可以接受的;如果VIF > 10.0,回归方程是不稳定的,再检查是必要的。我们可以看到表4的VIF值描述符都不到5和两个描述符不超过10,表明不存在多重共线性在选定的描述符和由此产生的模型具有良好的稳定性。

描述符 VIF 界值
日志P 8.780 0.386 5.027
化学加工 2.499 0.206 -4.694
西文 1.789 0.174 3.004
3.177 0.232 1.859
χ 2.496 0.206 -2.159
过渡委员会 8.558 0.382 4.498
Ea 3.051 0.228 2.551

表4。VIF SR和t测试值定量构效关系模型的描述符。

为了区分每个描述符的重要性在谷氨酰胺的抗肿瘤,标准回归系数(SR)和t测试值的七个描述符也列入表4。所示表4老的绝对值和t测试日志P值0.386和5.027,分别比其他描述符,这表明定量构效关系模型,在此日志P在抗肿瘤的影响细胞比其他的更强。

描述符的分析和解释

基于eqn。(5),我们将试图解释机制的抑制肿瘤活动的5-N-substituted 2 -(取代benzenesulphonyl)谷氨酰胺,在以下:

分配系数(日志P)作为最重要的描述符出现的定量构效关系模型,推导出它的最重要的描述符抗癌细胞。发达模型表明,更高的亲油性好比例肿瘤抑制。亲油性对谷氨酰胺化合物是非常重要的渗透,运输和生物蓄积肿瘤细胞。的扩散谷氨酰胺化合物的生物膜是由脂质膜和不移动的水溶剂层的内部和外部的表面膜。谷氨酰胺化合物与高logp更有可能提供更好的抗癌活性。

总负电荷过渡委员会遵循日志P,也就是一个很好的这个模型的重要描述符。过渡委员会的大小可能描述原子电荷,相关化合物的活性中心。过渡委员会表明,减少活性部位的原子电荷产生更强的约束力,因此可能增强抗癌活性。所以,谷氨酰胺化合物较低的过渡委员会有更强的电子基组苯响了,稍微活动做出贡献。

偶极矩µ特征分子的平均电荷分离系统,并能代表化合物的电子信息。此外,µ可以部分反映分子极性,它可能是对抗癌价值就是明证有利的贡献积极的回归系数。µ价值越高,越容易这些谷氨酰胺参与某些取向或极地与目标类型的交互细胞,导致更大的抗癌活性。激活能源E一个由系统和温度影响吗能源这之间的排斥反应中心能源影响反应的电荷分布中心,抑制肿瘤积极活动不同的激活能源E一个的谷氨酰胺代替。空间能源Es依赖谷氨酰胺取代基组的立体效应,讨论了取代基的电荷分布的这种效应的分子轨道方法被尝试区分影响的π电子感应和中介的谷氨酰胺取代基的影响,我们可以说R5的立体散装位置和芳香兰德可能不是有用的活动或可能有害的活动,和一些组织如R5取代基的长度也略微导致活动,解释较小的团体在R5位置或芳香响了会给更好的配体适应活性部位。

在eqn提出的描述符。(5)高钙,因此,作为输入参数的非线性回归(MNLR)和倍数人工神经网络(安)。

多元非线性回归(MNLR)

我们也使用非线性回归技术模型提高定量地预测活动。它考虑几个参数。这是最常见的多维数据研究工具。显然我们已经应用到数据矩阵构成的高提出的描述符对应30谷氨酰胺化合物用于训练集。

由此产生的方程是:

日志(IT) = -89, 94 + 0, 53×日志P + 3, 89×ChM + 3, 63 e 03×Es + 0, 97×μ-39,69×χ+ 1,34×TNC-0, 32×Ea + 9, 43×103×(LogP)2-36、99×(ChM)24、50×106×(Es)26日,35×102×(μ)24,06年×(χ)2+ 3,85×102×(TNC)2+ 8、11×102×(Ea)2(7)

N = 30, R2= 0.792 > 0.6,方程RMSE = 0.121

预测和观察活动的相关性,说明剩余价值图4

Chemical-Sciences-residues-values

图4:计算和观察活动的图形表示形式,并使用MNLR残留值计算。

人工神经网络(ANN)

安已经成为一个重要的定量构效关系研究和广泛使用的非线性建模技术,它可以用于生成预测模型的定量结构活性的关系(构象)之间的一组分子描述符从高钙和观测值的获得抗肿瘤活动日志(它)。

相关性系数和标准估计误差,获得与安,显示选中的描述符由高相关,模型提出了预测抗癌活动有关。安之间的相关性计算和实验活动和残留值是非常重要的图5和的R和R2值。

Chemical-Sciences-calculated-values

图5:计算和观察活动的图形表示形式并使用安残留值计算。

的值预测活动使用ANN计算和观测值给出表5

方法 离开很多交叉验证 测试集
N R R2 N R R2
高钙 30. 0.799 0.636 6 0.816 0.662
MNLR 30. 0.777 0.604 6 0.830 0.690
30. 0.871 0.760 6 0.900 0.821

表5所示。获得的模型之间的性能比较高,RNLM和安。

模型验证

为了检查可靠性和构象的稳定性模型阐述了高钙,MNLR和ANN方法,我们使用了内部和外部验证。三个模型的leave-many-out交叉验证,显示良好的模型的鲁棒性。此外,预测实现的测试集是在良好的协议与实验值。真正的构象的预测能力模型是测试他们的能力来预测准确谷氨酰胺化合物的抗癌活性从外部测试集:6-9-16-24-27-35(化合物没有用于哪一个模型开发)。

的值的比较日志(IT-test)日志(IT-obs)表明,一个好的预测已经获得了6个化合物。主要性能参数的三个模型所示表5

应用领域

广告是一个重要的工具,可靠的定量构效关系模型的应用,而插值空间的特征定义广告具有重要的意义。我们有报道,web应用程序可以很容易地用于识别Xoutliers的训练集化合物和检测的测试化合物驻留在应用化学领域使用描述符池的训练集和测试集。所选的四个分子描述符模型是用于杠杆的计算值:方程即行向量描述符的化合物,X的矩阵模型扣除从训练集的描述符和T矩阵转置的记者。

关键杠杆h *是固定在(3 P + 1) / N、P和N分别描述符的数量和训练集化合物的数量。如果h > h *,预测的化合物可以被认为是不可靠的,反之亦然。见的威廉姆斯图图6除了化合物6 9和24外(标准化剩余少或超过标准差单位(±3 ?),大多数的分子在训练集和测试集(91.66%)属于化学领域的适用性,然后由发达构象预测抑制活动模型是可靠的。

Chemical-Sciences-williams-plot

图6:威廉姆斯的情节提出了高钙模型。

Y-Randomization

在该测试中,随机RML, RNLM和ANN模型是由随机洗牌因变量在保持独立的变量。定量构效关系模型的新料R2和Q2值几个试验,证实了定量构效关系模型是健壮和发达的结果RML, RNLM和ANN方法并不是由于一个机会训练集的相关性。

比较高的质量,MNLR和ANN模型表明,ANN是最好的模型,表明这些描述符的影响研究的生物活性化合物(表6)。

迭代 高钙 MNLR
2 R2 2 R2 2 R2
1 0.421 0.540 0.435 0.476 0.435 0.440
2 0.347 0.407 0.389 0.390 0.279 0.530
3 0.291 0.301 0.279 0.321 0.299 0.371
4 0.161 0.251 0.198 0.254 0.223 0.451
5 0.369 0.464 0.317 0.592 0.217 0.364

表6所示。Y-Randomization验证结果CoMFA和CoMSIA模型(Q2和R2值几个Y-randomization测试后)。

以上讨论的结果表明,高钙,MNLR和ANN模型可以有效地用于预测5-N-substituted-2的日志(IT)——(代替benzenesulphonyl)谷氨酰胺化合物与不同的替换,他们能够建立一个令人满意的关系之间的分子描述符和抗肿瘤活性的化合物进行了研究。

值的相关系数的六个化合物(测试集),旨在系数(训练集)和其他统计参数的这些方法(高钙,MNLR和安),很明显,我们的模型的预测能力也同样健壮和稳定,它可以有效地用于估计其他一些谷氨酰胺化合物的抗肿瘤活性的实验数据是可用的。

的预测抗肿瘤活性值5-N-substituted-2 -(取代benzenesulphonyl)谷氨酰胺化合物的训练集,通过不同的方法中列出表7连同他们的观察活动。

不。 日志(它)
观察到的 RML MNLR
预测 残留 预测 残留 预测 残留
1 1.722 1.713 0.009 1.709 0.013 1.682 0.040
2 1.699 1.793 -0.094 1.725 -0.026 1.775 -0.076
3 1.398 1.499 -0.101 1.277 0.121 1.443 -0.045
4 1.574 1.546 0.028 1.638 -0.064 1.489 0.085
5 1.837 1.650 0.187 1.718 0.119 1.632 0.205
6 * 1.398 1.916 -0.518 1.999 -0.601 1.402 -0.004
7 1.699 1.770 -0.071 1.753 -0.054 1.704 -0.005
8 1.796 1.751 0.045 1.737 0.059 1.686 0.110
9 * 1.796 1.403 0.393 1.319 0.477 1.758 0.038
10 1.079 1.360 -0.281 1.250 -0.171 1.317 -0.238
11 1.519 1.539 -0.020 1.565 -0.046 1.443 0.076
12 1.519 1.673 -0.154 1.529 -0.010 1.568 -0.049
13 1.779 1.626 0.153 1.727 0.052 1.745 0.034
14 1.784 1.783 0.001 1.782 0.002 1.745 0.039
15 1.828 1.746 0.082 1.772 0.056 1.750 0.078
16 * 1.695 1.542 0.153 1.625 0.070 1.630 0.065
17 1.611 1.646 -0.035 1.638 -0.027 1.583 0.028
18 1.432 1.334 0.098 1.356 0.076 1.297 0.135
19 1.431 1.491 -0.060 1.487 -0.056 1.412 0.019
20. 1.617 1.506 0.111 1.481 0.136 1.456 0.161
21 1.396 1.431 -0.035 1.472 -0.076 1.452 -0.056
22 1.774 1.521 0.253 1.590 0.184 1.579 0.195
23 1.576 1.399 0.177 1.517 0.059 1.420 0.156
24 * 1.662 1.301 0.361 1.313 0.349 1.595 0.067
25 1.548 1.672 -0.124 1.611 -0.063 1.663 -0.115
26 1.349 1.522 -0.173 1.527 -0.178 1.533 -0.184
27 * 1.775 1.509 0.266 1.530 0.245 1.642 0.133
28 1.956 1.949 0.007 1.974 -0.018 1.829 0.127
29日 1.585 1.618 -0.033 1.660 -0.075 1.549 0.036
30. 1.817 1.774 0.043 1.765 0.052 1.758 0.059
31日 1.745 1.812 -0.067 1.843 -0.098 1.847 -0.102
32 1.751 1.736 0.015 1.784 -0.033 1.807 -0.056
33 1.815 1.757 0.058 1.880 -0.065 1.837 -0.022
34 1.618 1.726 -0.108 1.595 0.023 1.682 -0.064
35 * 1.574 1.604 -0.030 1.633 -0.059 1.501 0.073
36 1.850 1.759 0.091 1.745 0.105 1.736 0.114

表7所示。观察,预测日志(IT)和残留根据不同的方法。

结论

在目前的工作中,我们有%的抑制作用进行了比较分析肿瘤体重日志(IT)谷氨酰胺化合物的定量构效关系的方法,由三个高钙,MNLR和安。这两种方法都显示良好的预测能力。比较高的品质,MNLR和ANN模型表明,ANN具有良好的预测能力和强鲁棒性比高收益率回归模型改进的预测能力,我们建立了几个描述符和%抑制之间的关系肿瘤体重日志(IT)。获得模型的预测能力和鲁棒性评估通过交叉验证,通过测试集和外部验证。因此,模型可以有效地用于估计选择描述符的抗肿瘤活性和影响生物活性,这足够丰富的化工、电子和拓扑信息编码的结构特性。

目前的研究表明,分子描述符,即分配系数日志P,马利肯指控ChM,空间能源电负性,偶极矩µ,绝对χ,总TNC负电荷的分子,激活能源E一个最好的,是有用的预测%的抑制肿瘤细胞5-N-substituted-2 -(取代benzenesulphonyl)谷氨酰胺化合物,实验数据不可用。

的构象模型统计上显著的,健壮的,可用于预测活动更准确地说,它可能有助于更好的理解这类化合物的抗癌活性和有用的指导,评估抗肿瘤吗细胞作为新谷氨酰胺化合物的生物活性。

承认

我们感激“协会Marocaine des Chimistes Theoriciens”(AMCT)有关项目的相关帮助。

引用

谷歌学者引用报告
引用次数:9066

国际化学科学杂志收到9066引用根据谷歌学者报告

编入索引中

  • 谷歌学术搜索
  • 打开J门
  • 中国国家知识基础设施(CNKI)
  • 宇宙如果
  • 日内瓦的医学教育和研究的基础
  • ICMJE

查看更多