新京报贝壳财经讯(记者陈维城)6月30日,美团正式发布新一代基础大模型LongCat-2.0。依靠国产算力完成训练、推理全流程的万亿参数大模型。


据悉,LongCat-2.0采用MoE架构,总参数规模1.6万亿,每个Token激活参数约480亿,原生支持1M超长上下文,可一次处理百万字级输入。模型深度适配 Claude Code、OpenClaw、Hermes 等主流 Harness。


今年4月底,美团曾发布LongCat-2.0-Preview版本,并以匿名的方式,接入全球最大的大模型 API 路由平台OpenRouter。OpenRouter数据显示,截至6月底,LongCat-2.0-Preview的总调用量已跻身全球前三。

2023年起,美团就与国产算力厂商共同推进“模芯协同”研发,从早期的小规模验证到超大规模稳定训练,逐步攻克了万卡级容错恢复、NPU确定性计算、算力利用率提升等核心难题,验证了大规模国产训练的可行性。

LongCat-2.0的训练、推理成本消耗,低于全球其他万亿参数级别的大模型。LongCat官方宣布,将于近期在多平台同步开源Infra 框架、推理引擎、模型参数等核心技术。


编辑 杨娟娟

校对 王心