新京报贝壳财经讯(记者罗亦丹)9月30日,国内大模型头部厂商智谱正式发布并开源新一代大模型GLM-4.6,在Agentic Coding等关键能力上实现大幅提升。这是继DeepSeek-V3.2-Exp、Claude Sonnet 4.5之后,模型厂商在国庆节前的又一重磅动作。

在公开基准与真实编程任务中,GLM-4.6的代码能力已对齐Claude Sonnet 4,同时在长上下文、推理、信息搜索、写作与智能体应用等方面实现全面提升,超过DeepSeek-V3.2-Exp。该模型已经开源,进一步抬升了国产大模型的整体地位。

智谱官方宣布,GLM-4.6已在寒武纪领先的国产芯片上实现FP8+Int4混合量化部署,这是首次在国产芯片投产的FP8+Int4模型芯片一体解决方案,在保持精度不变的前提下,大幅降低了推理成本,为国产芯片在大模型本地化运行上开创了可行路径。

同时,基于vLLM推理框架部署,摩尔线程新一代GPU可基于原生FP8精度稳定运行GLM-4.6,充分印证了MUSA架构和全功能GPU在生态兼容与快速支持方面的强大优势。

寒武纪、摩尔线程适配智谱GLM-4.6,意味着国产GPU已具备与前沿大模型协同迭代的能力,加速构建自主可控的AI技术生态。

GLM-4.6和寒武纪、摩尔线程国产芯片的组合,即将通过智谱MaaS平台正式面向大众和企业提供服务,产生更为广泛的社会和产业价值。未来,国产原创GLM大模型与国产芯片将联合推动在模型训练和推理环节的性能与效率优化。

编辑 杨娟娟

校对 付春愔