新京报贝壳财经讯(记者罗亦丹)记者2月11日获悉,国产算力运营商无问芯穹上线DeepSeek推理服务,并宣布获七家国产芯片支持,正打通DeepSeek-R1、V3在壁仞、海光、摩尔线程、沐曦、昇腾、燧原、天数智芯等七个硬件平台的多芯片适配优化,现开发者已可以通过Infini-AI异构云平台获取DeepSeek系列模型与多元异构国产算力服务。
据了解,国产的大部分模型是通过国际主流芯片(如英伟达)训练得到,尚未与国内的AI系统、芯片形成闭环生态。而在美国,模型、系统、芯片已经形成闭环生态。以英伟达为例,其GPU的主流地位与CUDA生态有直接关系,CUDA的护城河是软件堆栈,可以让研究人员和软件开发者更好地在GPU上编程和构建各种各样的应用,牵引下一代芯片的迭代方向。但是随着Transformer统一模型结构,大模型应用落地场景所需的算子数量大幅度收缩,CUDA护城河正在变薄。
无问芯穹联合创始人、CEO夏立雪表示,“DeepSeek作为开源模型,其之于AI 2.0时代,正如Android之于移动互联网革命,将重构整个产业生态,引发链式反应,加快上层应用发展和下层系统‘统一’增速,由此广泛调动起跨越软硬件和上下游的生态,一起加大投入‘模型-芯片-系统’协同优化和垂直打通,从而继续‘打薄CUDA生态’。某种程度上来说,CUDA已经是历史了”。
他举例称,这类协同优化工作包括根据新一代模型架构来定义未来芯片的底层电路实现,以及根据国产AI系统的互联通信方式来设计高效的混合专家模型结构等。
夏立雪表示,通过打通DeepSeek-R1、V3在国产硬件平台的多芯片适配优化,无问芯穹希望进一步团结从模型到芯片的上下游产业伙伴,在打造“国产模型+国产算力+国产系统+国产应用”全国产化AI产业链的进程中起到牵引带动作用,集中优势资源,支持模型性能长足进步,推动中国AI自主可控长远发展,为人工智能行业发展筑牢算力基础。
编辑 白昊天
校对 穆祥桐