搜 索
火山引擎发布豆包深度思考模型 助力Agent应用发展
2025-04-21 21:01:54   来源:中新网浙江

  中新网浙江新闻4月21日电(蓝伊旎)日前,火山引擎面向企业市场发布豆包1.5・深度思考模型,同步升级文生图模型3.0、视觉理解模型,并推出 OS Agent(智能体)解决方案及AI云原生推理套件,帮助企业更快、更省地构建和部署Agent应用。

火山引擎总裁谭待。李震 摄

  火山引擎总裁谭待。李震 摄

  据火山引擎披露,截至2025年3月底,豆包大模型日均 tokens(标记)调用量已达到12.7万亿,较2024年5月发布时增长超百倍。

  “这不仅印证了豆包大模型的发展速度,也代表了行业的发展速度,大模型正在飞速走进工作与生活。”火山引擎总裁谭待解释说,从2024年至今,大模型有几个重大突破,一是最基础的聊天和信息处理能力提升且成本下降,二是深度思考功能的推出,“每一次模型的巨大突破都会带来一次量能的巨大增长。”

  从需求端来看,企业对于AI的需求已经从简单的聊天、信息处理、感知,发展到能够解决复杂的任务。而解决复杂任务对模型的搜索、思考等能力有更多的要求,这需要大模型不断迭代。

  “要真正为各行各业带来变革,Agent是必经之路,如果做不好 Agent相关工作,就难以实现 AI的社会和经济价值。”谭待说。

  2025年被业界视为“Agent智能体元年”,Agent智能体应用发展也将带动大模型进一步普及。

  谭待认为,深度思考模型是构建Agent的基础,模型要有能力做好思考、计划和反思,并且一定要支持多模态,就像人类具备视觉和听觉一样,Agent才能更好地处理复杂任务。在多模态深度思考模型的基础上,Agent需要良好的架构和工具,去操作数字世界和物理世界。同时,模型的推理成本和延迟要持续降低,才能推动应用普惠。

  近期,多款通用大模型相继发布,成本更低、速度更快、多模态等成为行业趋势。大模型之间的竞争将会走向何处?

  谭待说,AI比拼的上半场才刚刚开始。智能时代的 AI可以突破传统的软件和硬件限制,它正从生产要素转变为生产力,“好的AI模型能够解锁更多的能力,实现更多的功能;好的效果又能吸引更多的用户和企业使用,解锁更多的场景,这是一个正向循环。”

  如在此次升级的豆包模型中上线了“边想边搜”功能。谭待说,这个功能历经反复多轮迭代才最终实现,迭代核心在于应用的深化,模型的评估也会变得更系统、更复杂、更贴合实际。“多模态也是一样,在现实生活中处理问题需要多种感官协同,模型也应该朝着这个方向发展,具备视觉感知、操作界面等能力。”

  “幻觉问题”一直是困扰大模型的一大难题。如何减少或避免幻觉出现?

  谭待说,模型本身的能力越强,出现幻觉的可能性相对越低,可以引入知识库来辅助模型,让它在生成内容时有更可靠的参考依据;再者,增加验证的阶段,持续提升模型在这方面的能力。“目前我们的 DateAgent还处于测试阶段,从部分客户的反馈来看,在减少幻觉方面已经取得了不错的效果。我相信等后续正式全面对外推出后,大家能更明显地感受到在这方面的优化成果。”(完)

[编辑:孙妮亚]