中新网浙江新闻7月29日电(奚金燕 邵晴川)近日,由中国计算机学会(CCF)、CCF CTO CLUB联合数新智能共同主办的“多模态数据融合技术创新与落地实战”活动在杭州举行。

活动现场。主办方 供图
据悉,本次活动汇聚学界权威、产业精英与技术专家,围绕多模态大模型、AI Agent、非结构化数据处理、多模数据库等前沿议题展开深度研讨,为推动多模态数据融合技术的创新突破与产业落地搭建了高效交流平台。
作为人工智能领域的核心方向,多模态数据融合技术正加速渗透到制造、医疗、零售等千行百业,成为驱动数字化转型的关键力量。本次活动聚焦多模态大模型的研究进展、AI Agent与多模数据库的协同应用、生成式AI时代的非结构化数据处理等关键议题,旨在打通产学研壁垒,加速技术成果向产业价值转化。
CCF杭州分部副主席朱霖潮代表学会为活动致辞。他阐述了 CCF在推动多模态数据融合技术交流与发展方面的使命担当,强调了学会作为计算机领域知识传播与技术创新重要平台的价值。
数新智能创始人兼 CEO陈廷梁分享了数新智能在数据领域的实战经验。他阐述了企业在产业一线探索的历程与感悟,展示了数新智能在推动多模态数据融合技术落地方面的务实态度与专业能力。
本次活动聚焦多模态技术的前沿进展与实战经验,多位业内专家带来干货满满的主题分享,从技术架构、数据处理、模型研发等维度全方位解析多模态数据融合的技术密码。
哈尔滨工业大学教授苗东菁聚焦“AI Agent与多模数据库”的协同创新,指出AI Agent的高效运行离不开多模数据库的支撑,二者的深度融合将为跨模态理解与实时决策提供核心动力,同时通过订单履约等实战案例,阐释了智能体在复杂业务流程中的决策优化作用,为技术架构创新提供了新视角。
CCF杭州分部副主席、浙江大学研究员朱霖潮全面梳理了多模态大模型的发展脉络,深入浅出地讲解了其在技术层面的突破与革新。从GPT-4V到Sora、Veo等视频生成模型,他从多个维度解析了多模态理解、生成与执行的技术突破,并展望了大模型在智能体化、跨模态协同等领域的未来方向,为行业趋势研判提供参考。
亚马逊云科技高级解决方案架构师黄海波聚焦“生成式AI时代的非结构化数据处理”,他强调,生成式AI为非结构化数据的高效利用带来了革命性突破,通过多模态处理、上下文理解等能力,可显著提升合同审阅、客服对话分析、医疗记录解读等场景的效率与准确率,为企业级应用提供了切实可行的解决方案。
华为云云服务高级顾问叶正晖则分享了华为在多模态大模型领域的实践经验,介绍了盘古多模态大模型的层次化能力体系。该模型通过基础性能、专项能力与专家能力的三层架构,实现了从通用场景到行业定制的全场景适配,并在视觉认知、文档理解、任务规划等领域展现出突出优势,为行业应用提供了“实战手册”。
数新智能 CTO原攀峰紧密围绕数新智能的核心产品 CyberData、CyberEngine,阐述了“DataCyber多模态数据湖平台”在多模态数据管理方面的设计理念、技术架构以及实际应用案例。他指出,该平台凭借其强大的数据采集、存储、管理和分析能力,能够有效应对多模态数据在格式多样、规模庞大、解析复杂等方面的挑战,为企业提供了一站式的多模态数据管理解决方案。
圆桌对话环节,多位嘉宾围绕“多模态数据融合的关键应用场景”展开深度探讨。嘉宾们一致认为,当前多模态技术正从实验室走向产业实践,在制造、医疗、零售、金融等领域的应用潜力巨大,但同时也面临数据安全、模态协同、算力成本等挑战,需通过技术创新与生态合作共同破解。
本次“多模态数据融合技术创新与落地实战”活动不仅汇聚了多模态数据融合领域的前沿智慧,更搭建了产学研协同创新的关键桥梁。未来,随着技术的持续演进与产业需求的深化,多模态数据融合将在智能交互、自动化决策、精准服务等领域释放更大价值。(完)