搜 索
首个百亿级人类基因组基础模型在杭州发布
2025-10-24 14:38:30   来源:中新网浙江

  中新网浙江新闻10月24日电(奚金燕)10月23日,在第二十届国际基因组学大会(ICG-20)上,杭州华大生命科学研究院与之江实验室联合发布了全球首个百亿参数人类基因组通用基础模型——Genos。这一针对人类基因组深度优化的基因组基础模型,可支持高达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。

发布现场。主办方 供图

  发布现场。主办方 供图

  据悉,基因组学领域内的现有模型大多基于一到两个参考基因组进行训练,难以捕捉人类丰富的遗传多样性。而Genos则系统整合了人类泛基因组参考联盟(HPRC)、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次汇聚了全球范围内636个“端粒到端粒”(T2T)级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,旨在从源头减少数据偏见,更全面地代表人类遗传多样性。

  发布会上,华大生命科学研究院宣布,Genos模型将全面、彻底地开源开放,且同时提供12亿和100亿参数两个版本,满足不同应用场景的需求。

  该模型的核心研发团队,来自华大生命科学研究院与之江实验室联合发起的“大模型种子班”。这个汇聚了生物信息专家与计算科学骨干的精英团队,依托“以问题导向实训、以任务驱动创新”的模式,推动生命科学研究从“数据挖掘”迈向“智能涌现”。

  Genos模型的诞生,离不开杭州良好的产业生态。近年来,杭州市以入选国家新一代人工智能创新发展试验区、国家人工智能创新应用先导区为契机,持续推进“人工智能+”行动计划,努力打造人工智能创新发展和融合应用高地。

  当前,全球技术创新步入密集活跃期,大模型是全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎。被誉为“开源大模型之城”的杭州着力构建从算法模型创新突破到行业转化应用的创新体系,加快人工智能大模型产业集群发展,涌现出阿里云“通义千问”、深度求索DeepSeek V3、R1等开源大模型,落地新华三“百业灵犀”、大华“星汉大模型”、浙大“启真”等垂直领域模型,该市通过国家网信办登记备案的大模型达31个。

  据悉,接下来杭州将强化模型体系创新,加快模型基础架构、复杂思维模式、对齐调优等方面的核心技术攻关,强化训练基础通用大模型,发展行业垂直模型。举办开源模型创新应用大赛,撮合头部企业和中小企业开展大小模型协同创新,营造本地模型创新应用生态。(完)

[编辑:孙妮亚]