据初步估算,所有可能存在的化学分子结构(chemical space)在1060左右,这是一个天文数字,但这里面有多少分子可以成药(drug space),可能用沧海一粟来形容都不过分。由于要在生命体系中发挥特定活性而受到结构上的限制,能成药的化学分子数目在所有可能结构的化学分子中所占的比例小之又小。截至目前,已被认证能够用来治疗各种疾病的分子数目没超过1万个。因此,可以这样认为,具有成药性的所有化学分子的结构空间是高度收敛的。也可以这样认为,具有成药性的化学分子是具有高度相似性的。
五规则是对已成药或有可能成药分子分析得出的经验性结论,即:化合物的分子量不大于500;化合物结构中的氢键供体的数量不大于5个;化合物中氢键受体的数量不大于10个;化合物的脂水分配系数的对数值不大于5;化合物中可旋转键的数量不大于10个。已成药的小分子药物中,绝大多数的小分子是满足上述规则的(但也存在重磅炸弹级别的药物不满足五规则的情况,如辉瑞的重磅药之王——立普妥)。从五规则为起始,后续药物化学家又更加丰富了五规则的内容。如下图为对771个FDA已批准的口服药物的性质(Mr:分子量;ALOGP:正辛醇-水分配系数;HBDs:氢键供体数目;HBAs:氢键受体数目;PSA:分子极性表面积;ROTBs:可旋转键数目;AROMs:芳环数目;ALERTS:具有一定反应活性的官能团数目;)进行分析统计的结果,由图可见,其分布都是高度集中在某一个特定范围之中。因此,能成药的小分子以上结构性质必须相似。
图1. 图片来源于Nature Chemistry,2012, 4(2):90-98.
有研究表明,除了类似于五规则这类结构性质上的特征,小分子药物在具象结构上,如分子骨架(drug scaffold)、环结构(ring system)和分子碎片(small fragment)上也是具有高度相似性的。从文献(J Chem Inf Model,2010,50,1,55-67.)中报道来看,按一定规则对已上市药物以及在研中的药物小分子进行分解,并对其出现频率进行分析,得到如下图所示的结果。如下图所示,对于分子骨架结构,在50%的小分子药物中包含了出现频率最高的前60个分子骨架结构。换句话说,即出现频率最高的前60个分子骨架结构出现在50%的小分子药物当中。对于环结构,出现频率最高的前50个环结构,出现在35%的药物分子当中。对于分子碎片结构,出现频率最高的前10个分子碎片结构,出现在80%的药物分子当中。
图2. 图片来源于Journal of Chemical Information & Modeling, 2010, 50(1):55-67.
从以上结果可以看出,药物分子结构小单元是具有高度的雷同率的。这也提示我们,在进行新药化合物库设计或结构改造时,也许正确的打开方式是:只选对的,不选新的怪的。
既然具有成药性的化学小分子结构单元高度收敛于排名靠前的不足百种的结构之中,那么当我们进行化合物库的设计或者新药结构改造时,选择这些排名靠前的结构单元,毋庸置疑我们设计出来的新分子的成药性要比凭空臆想来得更加现实。如下图为文献中分析得出的出现频率最高的前50个分子骨架、环结构和分子碎片结构的具体情况。
图 3. 图片来源于Journal of Chemical Information & Modeling, 2010, 50(1):55-67.
对于分子设计和小分子成药性研究,目前依然处于摸索阶段,药物化学家们有的只是一些不成文的经验和直觉。将分子设计的经验和直觉提炼和转化为具体可遵循的原则,也是目前小分子成药性研究的热门之一。本次文章笔者介绍了在药物分子中高频率出现的结构单元,并且从结果可以看出,绝大多数的药物分子包含了排名靠前的结构单元。有了这一结果,对于化合物库的设计和结构改造,有了更为直观的指导。
读到这里,来了个有趣的问题,为什么药物分子的结构会如此高度相似呢?除了要满足生理条件下ADMET的要求之外,还有其它原因存在吗?目前,绝大部分药物分子的作用靶标依然是蛋白质。蛋白质的组成单元是有限的二十种氨基酸,既然靶标的结构单元本身就很有限,那么与之相互作用的药物分子的结构单元是有限的也就更容易被理解。另外,比较有趣的是,二十种氨基酸的侧链结构在上述排名靠前的药物分子结构单元里都能被找到,这有何深意,有待笔者和有缘的读者作更进一步的思考。除此之外,笔者比较感兴趣的问题是,蛋白靶标的结构单元与药物分子的结构单元之间是否有一定程度的匹配性?从氢键作用、范德华作用、静电作用等特征来说,结构单元之间应该会有一定程度的匹配度,而目前笔者检索文献,还没有发现这类报道。如果从已报到的药物分子与靶标复合物晶体结构出发,统计分析出结构单元之间的匹配程度,相信能对成药性的理解和新药分子设计带来更多的便利。
参考文献:
1. Oprea T I.Property distribution of drug-related chemical databases.[J]. Journal ofcomputer-aided molecular design, 2000, 14(3):251-264.
2. Bickerton G R,Paolini G V, Besnard J, et al. Quantifying the chemical beauty of drugs.[J].Nature Chemistry, 2012, 4(2):90-98.
3. Bemis G W,Murcko M A. The properties of known drugs. 1. Molecular frameworks.[J]. Journalof Medicinal Chemistry, 1996, 39(15):2887-2893.
4. And G W B,Murcko M A. Properties of Known Drugs. 2. Side Chains[J]. Journal of MedicinalChemistry, 1999, 42(25):5095-5099.
5. Wang J, Hou T.Drug and drug candidate building block analysis.[J]. Journal of ChemicalInformation & Modeling, 2010, 50(1):55-67.
作者信息
作者:Tyler
联系客服