蚂蚁数科金融大模型技术领先 评测效果超主流开源模型观点
6月19日,在中国国际金融展上,蚂蚁数科宣布将联合金融行业伙伴推出超百个金融场景智能体解决方案,全面覆盖AI原生手机银行、风控、理财、营销等核心金融应用场景。此前,蚂蚁数科曾对外发布全栈金融级智能体平台Agentar,助力金融机构高效搭建专业智能体应用。
“当前,大模型在金融业应用已进入深水区,正在逐渐从客服、办公等场景进入风控、财富管理等核心业务场景,从单点技术应用到深度重塑全业务流程。”蚂蚁数科首席技术官王维在主题演讲中表示。
王维介绍,蚂蚁数科历经金融级场景验证的全栈智能体平台Agentar,覆盖算力调度、数据治理到模型训推及应用落地全流程,并通过金融行业大模型、金融知识库、金融专业工具集、安全合规围栏以及智能体应用评测,加速大模型在金融行业的深度落地应用。
据了解,蚂蚁数科金融行业大模型在多项权威金融评测集上,得分均显著超过目前市场上的开源金融大模型,为金融智能体深度应用提供“可靠、可控、可优化”的智能中枢。“基于蚂蚁数科金融大模型,以及相关配套工具,可以结合金融场景落地适配的2次开发,在策划、表达等关键环节,都能有效提升性能10+%以上。”王维说。
值得一提的是,Agentar平台还沉淀超亿级高质量金融专业数据,通过十万级的金融长思维链标注数据,显著提升模型在复杂决策场景中的逻辑性与可靠性,并已上线金融MCP服务广场,整合超百个核心金融MCP服务,提供“可插拔式”行业Know-how组件库,减少模型微调成本,加速场景落地。
“在金融业智能化的变革浪潮中,大模型要真正成为驱动业务增长的关键引擎,不仅关乎技术突破,更在于对金融场景的深度理解与实践。”王维强调。
据悉,蚂蚁数科正联合金融业伙伴进行创新,探索超100个金融智能体深度应用场景解决方案,覆盖银行、证券、保险、通用等四大领域,包括零售业务助手、AI原生手机银行、智能营销和风控等多个已经在金融实际场景中深度应用的智能体解决方案。
例如,风控智能体能够自主推理,根据业务数据与风控专业知识,生成风控模型,建模效果达到行业专家水平以上,建模效果提升10%。营销智能体可实现银行零售业务从经营规划到营销执行落地的智能化升级,提升营销效果、运营效率,较传统营销效果可提升20%。财富管理智能体能够自动执行任务,给出个性化、实时专业的财富管理建议,将理财顾问的分析效率提升100%。
王维表示:“大模型与金融业的深度融合是一场长跑,我们将持续投入核心技术研发与场景深耕,打造值得信赖的产品与解决方案,推动大模型在金融场景的价值落地。”