新京报贝壳财经讯(记者陈维城)3月24日,国务院新闻办公室举行新闻发布会介绍第九届数字中国建设峰会有关情况。国家发展改革委党组成员、国家数据局局长刘烈宏表示,到今年3月,我国日均Token的调用量,也就是词元的调用量,已经超过了140万亿。充分表明中国的人工智能发展进入了快速增长阶段。
刘烈宏表示,国家数据局高度重视数据要素赋能人工智能创新发展的工作,我们提出人工智能发展到哪里,我们就把高质量数据集建设到哪里。“人工智能+”行动到哪里,行业高质量数据集的建设和推广就要到哪里。针对高质量数据集建设“小和散”的问题,会同26个部门组织遴选了72家高质量数据集建设链主单位、140个先行先试工作单位和104个典型案例,构建了链主带动、多方参与、联合攻关、共建共享、合作共赢的高质量数据集建设生态,持续推动高质量数据集的建设。
刘烈宏介绍,为推动数据标注产业发展,国家数据局布局了成都、沈阳、合肥、长沙、海口、保定、大同7个承担数据标注先行先试建设任务的城市,出台了《关于促进数据标注产业高质量发展的实施意见》,遴选出47个数据标注优秀案例,指导举办了7次数据标注的供需对接会。下一步,将面向科技创新强、发展基础好、产业特色优的地区,聚焦“知识密集型”和“技术驱动型”这两个方向,梯次布局一批技术先进、特色鲜明、高效赋能的数据标注产业创新试验区。
刘烈宏提到,还要持续培育“为高质量数据付费”的市场共识,推动行业高质量数据集在数据交易所挂牌、上架、交易。支持数据流通服务平台、数据商等机构提供流通交易的服务,鼓励各类数据流通服务机构探索多样化的高质量数据集流通利用模式,推动高质量数据集供需有序对接,支持行业高质量数据集流动起来。
刘烈宏介绍,截止到2025年年底,全国已建成的高质量数据集超过了10万个,总体量超过了890PB,这相当于中国国家图书馆数字资源总量的310倍。到今年3月,我国日均Token的调用量,也就是词元的调用量,已经超过了140万亿,相比2024年初的1000亿增长了1000多倍,相比2025年底的100万亿,三个月时间又增长了40%多。日均Token调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段,应用场景在不断深化,从能对话到能决策执行的智能体,中国人工智能产业的竞争力也显著增强,现在大家热议的Token出海,就是产业竞争力增强的一个标志。当然从数据的维度来看,也标志着数据集的供给在大量增加,数据要素的价值在不断释放,数据要素赋能人工智能创新发展进入了良性互动的阶段。
刘烈宏表示,下一步,将持续推进数据赋能人工智能创新发展,协同各方深入实施新一轮的高质量数据集建设行动计划,包括强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六大专项行动,以场景需求为牵引,加快推进先行先试的工作,打造技术可行、实用便捷、质量保障的AI-Ready(AI就绪度)高质量数据集,实现高质量数据集供给的量质提升。
编辑 杨娟娟
校对 王心






