新京报贝壳财经讯(记者罗亦丹)北京时间11月4日,备受关注的首个AI大模型实时投资比赛“Alpha Arena”落下帷幕,该竞赛由三方机构Nof1于10月18日发起,集合来自中国的DeepSeek v3.1、Qwen3-Max,以及来自美国的GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4,共六个顶尖大模型,每个模型拥有一万美元初始资金,在真实市场上无人工干预地自主决策、交易,根据盈亏情况决出冠军。


比赛前半段,DeepSeek v3.1一直处于领先位置,这也让这场比赛广受国际关注。能够与之“一战”的是马斯克旗下的Grok 4,其通过激进的投资策略,一度把与DeepSeek v3.1的差距缩短到1美元的位置。


不过,10月21日至22日成为了“转折点”,这两日里,Grok 4和Claude Sonnet 4.5的收益大幅下滑,由盈转亏,10月22日当日,六个大模型的收益率更是一度全部告负。


但此时,DeepSeek v3.1和此前表现不佳的Qwen3-Max自动改写了投资策略,在其他4个大模型持续亏损的情况下脱颖而出,净值曲线波动上涨,Qwen3-Max更是趁机一度超过DeepSeek v3.1。


此后,比赛成为了Qwen3-Max与DeepSeek v3.1两家中国大模型“争锋”的舞台,参赛模型大致分为三大阵营:两家中国模型屡次互换第一,始终位列第一梯队;Claude Sonnet 4.5和Grok 4在相近策略驱动下,维持在第二阵营,略有盈利,整体仍亏损;GPT-5、Gemini 2.5 Pro两大模型则长期亏损垫底。


最终,截至11月4日比赛落幕时,这场历时17天、初始资金一万美元的投资大赛,Qwen3-Max以1.22万美元,超过20%的收益率夺得冠军,DeepSeek v3.1落袋1.05万美元。这两个中国模型也成为唯二盈利的模型,而四大美国顶尖模型全部亏损,GPT-5亏损超60%垫底。


编辑 陈莉 校对 刘军