新京报贝壳财经讯(记者张晓慧)4月24日,DeepSeek发布了DeepSeek-V4-Pro 1.6T旗舰模型(1.86万亿参数)及DeepSeek-V4-Flash 284B高效模型(2840亿)。
当天,由智源研究院牵头研发的众智FlagOS对两个模型进行全量适配,已完成DeepSeek-V4-Flash在8款以上AI芯片上的全量适配与推理部署,包括海光、沐曦、华为昇腾、摩尔线程(FP8)、昆仑芯、平头哥真武、天数、英伟达(FP8)等芯片。
据了解,围绕DeepSeek-V4-Flash多芯适配,此次FlagOS系统软件技术栈突破了三大关键技术:FlagGems全算子替代(实现多芯片统一适配)、为o-group采用独立张量并行策略解锁更多低显存场景,以及“FP4+FP8混合精度”的原生权重到FP8/BF16的精度路径转换。
智源研究院介绍,这三项关键技术,使得DeepSeek-V4能够在当前各种厂商的主流AI芯片上稳定运行,而非仅限于支持FP4和大显存的少数高端AI加速卡。
新京报贝壳财经记者了解到,FlagOS正在推进DeepSeek-V4-Pro模型在多个芯片的迁移适配,后续即将开源。
校对 卢茜






