Cell:利用人工智能解决生物学面临的最大挑战之一
发布时间:2025-06-28 19:08 浏览量:2
生物通小通生物通
2025年06月27日 12:47广东
在6月26日发表于《细胞》(Cell)杂志的一篇评论文章中,Arc的研究人员介绍了这家独立非营利组织的首届“虚拟细胞挑战赛”。这是一项公开竞赛,旨在为最能预测细胞如何应对基因干扰的机器学习模型提供10万美元的大奖。Arc推出这项竞赛旨在促进人工智能与生物学交叉领域的进步,特别是通过加速高质量数据集的创建,并引发关于评估人工智能模型模拟细胞行为的严格标准的讨论。
在首届挑战赛中,Arc 生成了一个新的单细胞转录组学数据集,其中包含 300,000 个 H1 人类胚胎干细胞 (H1 hESC),其中包含 300 个遗传扰动。该数据集将在整个比赛期间分段部署,以进行微调、验证和测试。参赛者受邀使用 Arc 虚拟细胞图谱以及其他公共数据集中包含的超过 5 亿个细胞的基因表达数据来训练模型。该挑战赛将专门评估模型在单个基因沉默时预测基因活动变化的能力。参赛者将在比赛的中期阶段对这些影响进行预测,并在最终评估之前在实时排行榜上分享他们的中期表现,最终将公布获胜者。
Arc 首席技术官 Dave Burke表示:“团队的成功取决于其模型推广至新细胞环境的能力。这是一项艰巨的任务,因此我们将首届比赛设计为一项小样本学习挑战,并发布了一组 H1 hESC 训练子集。 模型推广至新细胞环境的能力最终是解锁用于药物研发的虚拟细胞的关键,我们希望本次挑战赛最终能够加速实现这一目标的进程。”
在开发竞赛评估框架的过程中,Arc 还致力于为该领域的虚拟细胞模型性能提供一致的基准。虽然单细胞技术和机器学习的快速发展为模拟细胞行为创造了新的机会,但由于评估方法不一致和数据集质量参差不齐,研究人员难以比较不同的方法。
Arc 执行董事、联合创始人兼核心研究员 Silvana Konermann 表示:“能够捕捉动态细胞反应的虚拟细胞代表着生物学研究的未来,但我们需要严谨的方法来测试和比较这些模型的性能。这项竞赛将鼓励科学家构建最有前景的人工智能模型,同时让我们能够与研究界一起对我们的评估框架进行压力测试,从而建立整个领域都可以借鉴的基准。”
挑战赛注册将于6月26日在 virtualcellchallenge.org开放,参赛队伍注册时将获得训练数据。最终排名将完全取决于模型在最终测试集上的表现,最终测试集将于10月下旬(最终提交截止日期前一周)发布。获奖者名单将于12月公布。
个人贡献者以及来自学术机构、生物技术公司和独立研究机构的团队 均可 参与。我们特别鼓励具有计算建模或单细胞生物学经验的参赛者参赛。获得前三名模型的三支团队将分别获得价值 100,000 美元、50,000 美元和 25,000 美元的奖金,奖金包含现金奖励和 NVIDIA DGX Cloud 积分。虚拟细胞挑战赛由 NVIDIA、10x Genomics 和 Ultima Genomics 慷慨赞助。
NVIDIA 数字生物学总监 Anthony Costa表示:“虚拟细胞挑战赛将帮助虚拟细胞开发者团结起来,构建新的生命科学发现模型。我们支持这项竞赛,旨在赋能科研界构建强大的基础模型,预测基因扰动如何影响细胞行为。 ”
Arc Core 研究员Hani Goodarzi 表示:“这项工作旨在推动社区参与,并通过提供高质量的基准数据集、公共排行榜以及可重复、透明的比较机制来加速进展。 突破性的想法无处不在——当研究人员相互激励,构建更好的模型时,整个领域都会进步。”
Arc 计划每年重复举办“虚拟细胞挑战赛”,使用包含不同细胞类型的新单细胞转录组学数据集,并通过更严格的挑战要求参赛者的模型预测更复杂的生物变化的影响,从而继续推动该领域的进步。
Arc 联合创始人兼核心研究员 Patrick Hsu 表示: “ CASP 竞赛 在过去 25 年里彻底改变了蛋白质结构预测,最终促成了 AlphaFold这样的突破。我们相信,Arc 可以使用相同的方法加速实现全面虚拟细胞的进程,这可能会从根本上改变我们研究生物学和确定靶点的方式,从而更好地治疗复杂疾病。”
参考文献
Virtual Cell Challenge: Toward a Turing test for the virtual cell