新京报贝壳财经讯(记者罗亦丹)为了考察大模型在实际金融场景中部署的能力,7月28日,在世界人工智能大会论坛上,蚂蚁数科联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构推出Finova大模型金融应用评测基准,深度考察智能体能力、复杂推理以及安全合规能力。目前,Finova已经全面开源,推动行业共同提升大模型在金融领域的应用水平。
蚂蚁数科还在会上正式发布金融推理大模型Agentar-Fin-R1,为金融AI应用打造“可靠、可控、可优化”的智能中枢。Agentar-Fin-R1基于Qwen3研发,在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越Deepseek-R1等同尺寸开源通用大模型以及金融大模型。
Agentar-Fin-R1包括32B和8B参数两个版本。蚂蚁数科还推出基于百灵大模型的MOE架构模型,获得更优推理速度。此外,还有非推理版本的14B和72B参数大模型,以满足金融机构在多样化场景下的部署需求。
蚂蚁数科CEO赵闻飙表示,“通用大模型距离产业实际应用存在‘知识鸿沟’。构建专业的金融大模型是推进金融与AI深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。”
编辑 陈莉 校对 刘军