科研进展

中大团队提出元学习算法用于小样本药物发现

稿件来源:智能工程学院 编辑:谈希、王冬梅 审核:孙耀斌 阅读量:

中大新闻网讯(通讯员吕秋杰)药物发现是一项高投入、长周期、高风险的系统工程。当分子生物学研究确定了与疾病相关的有效靶点时,后续的药物发现路径就变得相对清晰。药物发现中关键任务就是寻找一个具有良好药理活性、低毒性和适当药代动力学特性的候选分子。深度神经网络在加速和改进药物发现方面取得了令人瞩目的进展,但是这些技术依赖于大量的标签数据才能形成对分子特性的准确预测。然而,在候选分子优化的初始阶段,新分子或类似分子并没有太多真实的理化性质和生物活性记录。这表明将深度神经网络应用于小样本药物发现仍然是一项科学难题。

中山大学智能工程学院智能医疗研究中心主任陈语谦教授团队提出了一种具有图注意力网络(GAT)的元学习架构(Meta-GAT)去预测低数据药物发现中的分子特性。图注意力网络通过三重注意力机制在原子层面捕获原子团的局部影响,从而使GAT学习原子团对化合物性质的影响。在分子层面,GAT将整个分子视为连接分子中每个原子的超虚拟节点,隐含地捕捉不同原子团之间的相互作用。双向循环神经网络(GRU)侧重于将有限的分子信息抽象或转化为更高层次的特征向量或元知识,提高了GAT感知分子中化学环境和连通性的能力,从而有效降低样本复杂度。此外,进一步开发了一种基于双层优化的元学习策略,将元知识从其他属性预测任务迁移到低数据场景下的目标任务,使模型能够快速适应样本少的分子属性预测。实验表明,Meta-GAT 在多个公共基准数据集上实现了对少数样本分子新特性的准确预测。这些优势表明 Meta-GAT 很可能成为低数据药物发现的可行选择。


图1. 在小样本药物发现场景下用于分子特性预测的元学习框架。蓝色框和橙色框分别代表训练阶段和测试阶段的数据流。


图2. 基于元学习的图注意力网络架构示意图。


该研究为小样本药物发现提供比较可靠的推动力,有助于从根本上解决药物发现中样本少的问题。所提出的元学习算法通过多个预测任务训练一个初始化良好的参数,并在此基础上进行一步或多步的梯度调整,以达到快速适应新的只有少量数据的任务的目的。论文提出元学习算法用以解决在小样本数据场景中,对小分子药物进行提高准确度的预测所需的数据量,这种新的学习范式未来可以应用于小样本学习的药物发现领域。

研究成果于2023年3月在国际著名期刊IEEE Transactions on Neural Networks and Learning Systems上发表(IF= 14.2552),题目为“Meta Learning With Graph Attention Networks for Low-Data Drug Discovery”。 中山大学智能工程学院陈语谦教授为该文通讯作者,智能工程学院博士生吕秋杰为第一作者。该项研究受到国家自然科学基金项目的支持。

论文链接:https://doi.org/10.1109/TNNLS.2023.3250324