当前位置: 主页 > 技术方案

首届上海计算生物学大赛选拔民间高手,获奖者不仅有奖金还将纳入市级科技专项

发布时间:2024-09-14 00:01   浏览次数:次   作者:星空体育

首届上海国际计算生物学创新大赛·药物筛选AI算法"凌越"挑战赛今天(9月9日)在2024浦江创新论坛上揭晓成绩单:5支队伍获得一二三等奖,他们将被纳入上海市科技创新行动计划"计算生物学"专项得到后续支持。

这场持续大半年的比赛是计算生物学领域的"华山论剑":330个报名团队中86支队伍晋级初评,70%来自上海以外,企业及个人占比30%。大赛以"真问题"为导向,模拟了药物开发的真实步骤,筛选出的活性分子有望助力抑郁症、阿尔茨海默病、癫痫、疼痛等神经系统疾病的新药发现。

以赛选项、以赛选人是财政科技立项的改革举措,通过举办上海国际计算生物学创新大赛,多个高水平AI药物发现团队脱颖而出。

真实问题考验团队综合实力

去年12月,在市科委指导下,上海市生物医药科技产业促进中心主办的"凌越"挑战赛启动,邀请全球5人以下团队和个人报名参赛。大赛以NMDA(N-甲基-D-天冬氨酸)离子通道为靶标,参赛团队设计各自的模型算法,利用华为云提供的算力发现小分子调节剂。

中科院院士陈凯先(右)与获胜者交流。

"这次大赛的题目挺‘烧脑’,涉及到药物研发中苗头化合物发现阶段的多个真实问题,非常考验团队的综合创新实力。"上海科技大学研究员白芳说,她带领三支队伍参赛,均闯入复赛,最后两支队伍闯入决赛前五。

对神经系统疾病而言,离子通道是仅次于G蛋白偶联受体的第二大成药靶点。作为一类兴奋性离子型谷氨酸通道,NMDA参与大脑突触信号传递,具有调控学习记忆和神经系统发育等功能。大赛以NMDA通道家族中尚未被充分研究的亚型为研究目标,这意味着参赛者既不知道针对这个靶点的特异性分子,也不知道其结构,但从另一个角度看,"解题"方法也变得多种多样。

参赛队伍各有"独门绝技"

从比赛结果看,闯入决赛的队伍几乎都有自己的"独门绝技"。上海科技大学GeminiMol团队获得一等奖,团队名字就是其自主研发的深度学习算法GeminiMol,顾名思义是将药物分子的内在联系比喻为双子座(Gemini)。在药物科学领域,结构相似的分子往往展现出相似的生物活性和药效特性,GeminiMol正是巧妙利用了这一自然规律,通过大规模分子间的对比学习,力求最大限度建立药物分子结构与药效性质之间的精准关联模型,从而显著提升基于配体的药物发现效率。

在同等计算资源条件下,GeminiMol在计算速度上至少提高两个数量级,可显著加速活性化合物的发现。"我们只花了半小时就筛选了1800万个化合物分子,如果用传统物理方法大概需要130小时。"GeminiMol团队成员王世航说。

天士力数智中药创新中心和南开大学组建的参赛团队获得三等奖,他们采用的是多级虚拟筛选法,该方法源自团队对天然产物等分子的筛选实践。天津天士力数智中药发展有限公司人工智能平台负责人魏宇表示,团队"解题"用了四步:第一步利用AI算法从千万级数据库中筛选出潜在活性分子,第二步利用阿尔法折叠和分子动力学模拟为目标靶点建立动态结构,第三步用协同预测模型提高分子筛选的富集率,第四步即通过湿实验验证,最终找到了活性不错的分子。

以赛选人也是以赛育人

在AI制药领域,"以赛选人"越来越成为主流模式。上海市生物医药科技发展中心主任李积宗介绍,本届大赛报名人数超出预期,进入初赛的86支团队共筛选出约1000个分子。除了两支团队提交了自行合成的分子,大多数分子来自赛事主办方和协办方"皓元医药"提供的化合物数据库。

"竞赛过程中,我们碰到了一个始料未及的挑战,即如何利用有限的计算资源,同时处理并计算高达1800万个分子数据,这一难题考验了我们的应变能力。"王世航告诉记者,面对硬件资源的限制,团队迅速调整策略,采用了巧妙的数据分割方法,将庞大的数据集划分为多个小块,并通过任务分批提交的方式,充分利用现有资源进行高效计算。最终,通过整合各批次计算结果并进行综合评价,成功完成了庞大的计算任务。

作为GeminiMol方法的主要开发者,王林博士深刻体会到计算生物学作为一门高度交叉的学科,其魅力在于能够汇聚不同领域的智慧。因此,构建一支跨学科团队至关重要。在他们的团队中,就集合了擅长药物化学、药理学、AI算法等不同技术的队友。这种多元团队组合,让他们得以充分发挥各自专业优势,相互学习,取长补短,在高手如林的比赛中最终胜出。