伴随着人工智能的快速发展,各种大模型技术也持续飞跃,尤其是自国产大模型DeepSeek的推出,低成本、高效能的AI产品以席卷之势融入我们生活和工作的方方面面。然而,在这个过程中,就业替代、信息虚假传播等伦理与社会问题也逐渐浮现并引发关注和思考。


如何看待大模型目前发展的阶段?各行各业纷纷与DeepSeek等大模型深度融合,这是机遇还是挑战?大模型发展背后,如何平衡其成本、效率和创新的问题?新京报围绕相关话题采访了经济学家、横琴数链数字金融研究院学术与技术委员会主席朱嘉明。


经济学家、横琴数链数字金融研究院学术与技术委员会主席朱嘉明。


新京报贝壳财经自DeepSeek火爆之后,各种大模型蜂拥而来,怎么看待当前大模型推出的速度和质量?


朱嘉明:整体来看,大模型正在呈现数量和质量两个方面的演进。第一,在大模型的数量方面,加速增长,根据人工智能研究机构Epoch AI的统计数据,在ChatGPT推出的2022年,训练算力超过1023次浮点运算的模型有22个,在2024年,这样的模型已经有99个。第二,在大模型的质量方面,从2025年开始,大模型研发已经完成了从粗放到集约的历史转型,即从主要通过不断增大参数量和数据规模来提升模型性能,转变为强调算法架构创新、数据预处理与微调策略,以及硬件与能效的协同提升,乃至关注大模型的实际落地收益与相应的组织结构调整。


需要澄清的是,大模型领域虽然不存在权力的直接干扰,但并非无政府主义状态,而是有严格且多元的标准体系与规范网络共同构建的有序生态。只有满足这些技术、伦理、平台和法律的要求,大模型才能获得广泛认可与应用。全世界全面满足技术标准、社区准则和法律法规要求的大模型极为有限。大多数的人工智能生成式模型,其实是在开源大模型基础上,针对应用目标的垂直领域进行参数优化的产物。


2025年的大模型研发还有一个更为重要的特征:大模型正在展现前所未有的多模态的推理能力。大模型从语言中心向“内在多模态”架构转变,强调跨模态主动推理和交互式反馈,以提升模型在复杂场景下的适应能力。新一代模型能够同时处理文本、图像、音频、视频等多种格式,将各模态输入映射到统一的嵌入空间,实现跨模态理解与推理。例如,OpenAI的o3模型支持对场景图像进行空间变换(如缩放、旋转)、图文问答及工具调用,显著增强了视觉+文本推理的深度和广度。


大模型的发展方向变得越来越明朗。未来两到三年里,随着脑科学不断揭示大脑运作的奥秘,量子技术也在加速成熟,两者都有望与现有的AI大模型产生深度融合和交叉创新。这种新一轮的“碰撞”不仅会提高模型的计算效率和推理能力,还可能催生出更接近人类思维模式的智能体系,标志着“大模型2.0时代”的来临。与此同时,以大模型为核心的AI技术正在迅速走向市场。研发与部署成本持续降低,使得企业和个人都能更轻松地使用这些先进系统。无论是在智能家居、医疗诊断还是教育辅助中,这些模型正以前所未有的速度融入日常生活,悄然改变人们的工作与娱乐方式。


新京报贝壳财经如何理解该标准?


朱嘉明:大模型研发是存在标准的。大模型的发展离不开一套由业界、学术界和标准组织共同制定并不断更新的评估与认证标准。这些标准在形成过程中依赖多方参与与共识,并随着模型能力的提升不断推进,体现了“标准-挑战-突破-再标准”的动态循环。首先,领先团队或企业发布具有显著创新的大模型,确立行业新基准;之后,其他团队围绕该基准发起攻关,改进模型架构、训练方法或多模态融合技术;然后,关键技术或应用场景取得新的性能跃迁,推动模型达到更高水平;最后,突破成果成为新的行业标杆,开启下一轮竞争与共创循环。


这一循环模式使得大模型生态不但在性能上不断升级,也在标准体系、数据集构建与测试方法等方面同步演进,形成良性、共赢的技术创新环境。


新京报贝壳财经目前国内的大模型处于什么阶段?


朱嘉明:国内大模型已进入普及化和大众化阶段,使用人数持续快速增长,应用正从通用场景向金融、工业、政务、司法、民生等行业纵深渗透。但严格来说,这只是起步,真正的产业深度结合仍需更多落地探索,预计在下半年以后随着政策供给和资金投入的进一步加码,产业化部署和规模化应用将显著提速。


国内大模型呈现互补功能格局,没有单一模型能在所有指标上全能表现。不同类型的人工智能模型协同并进的体系正在形成,以满足不同场景的多元需求。


在物理形态领域,中国已实现关键技术突破并大规模部署工业机器人。2023年中国安装了逾27万台工业机器人,是日本的6倍、美国的7倍,占全球安装量的51%。


新京报贝壳财经大模型1.0和2.0的根本区别是什么?


朱嘉明:大模型的1.0时代主要基于深度学习中的Transformer架构,不断在规模和微调技术上迭代;而2.0时代则有望突破Transformer本身的限制,通过引入类脑计算和量子计算等全新范式实现性能和效率的跨越。


自从OpenAI的GPT系列模型问世,以Transformer为核心的大模型进入1.0时代。该阶段主要依靠不断扩大参数规模、丰富训练数据,以及引入人类反馈强化学习、稀疏注意力和混合专家等技术提升生成质量与效率。DeepSeek凭借多步预测和计算稀疏化手段,将推理性能追平Llama 3.1,而最新“o3”版本通过激进剪枝与并行化策略,进一步降低了延迟与成本。


然而,随着算力投入回报递减,大模型研发人员已将目光投向2.0时代。下一代模型将突破Transformer固有的二次方复杂度限制,采用线性化或稀疏化注意力,实现更长上下文的高效管理;并有望在类脑神经形态芯片上通过异步、事件驱动的架构显著提升能效。同时,量子-经典混合计算模式正逐步成熟,通过可参数化量子电路完成部分推理,在文本分类和语言建模任务中展现出与传统模型相当却更低能耗的潜力。


新京报贝壳财经DeepSeek在成本控制上展现出巨大优势,怎么看待大模型推出背后成本和效率、创新的关系?


朱嘉明:DeepSeek在控制AI模型成本方面展现出显著优势,但对其创新成本的简单比较忽略了代际演进和不同发展阶段的成本结构差异。第一代创新往往伴随着高昂的资源投入,而后续迭代则能借助先行经验和技术优化实现“后进优势”。在“0到1”阶段,大量基础设施建设和未知风险必然推高成本;进入“1到10”阶段后,通过流程标准化和效率优化则有可能降低单位成本。尽管成本是衡量AI竞争力的重要指标之一,但并非唯一标准。为了持续保持领先,DeepSeek在下一步模型研发中仍需投入更高性能的芯片和基础设施,这意味着其成本将呈上升趋势。综合来看,DeepSeek的成本控制策略在当下确立了竞争优势,但其长期成本曲线依然受创新代际、更高性能需求以及基础设施投入的推动而上扬。成本虽是重要指标,但需与性能、可持续性和技术迭代等多重因素并重评估。


新京报贝壳财经AI 和大模型的发展如何重塑全球产业结构和经济格局?


朱嘉明: AI作为一种全新工具,不仅催生出全新的产业形态,还将传统行业置于必须适应其运作逻辑和基础设施的境地,从而实现对传统行业的重塑,而不是简单地在既有框架下进行升级或改造。


需要注意到,智能体经济与人机协同网络正在兴起。第一,AI 智能体正在脱离“应答者”身份,成为可以主动调度、决策与协作的经济参与者,构建出以“智能体总线”为入口的分布式运行环境。第二,垂直领域智能体凭借对行业语言和需求的深度理解,率先掌握了资源配置与入口控制权。第三,不同智能体之间的价值交换与协作,正在孕育一种全新的“组织结构”,即人-机智能体共生的经济网络。


新京报贝壳财经AI 和大模型广泛应用的同时,也带来了算法偏见、就业替代、信息虚假传播等伦理与社会问题,怎么看待这些问题的出现?


朱嘉明:AI在实现大规模数据处理和决策优化方面展现出显著优势,但也伴随算法偏见和虚假信息传播等风险。这些问题虽真实存在,却并非AI应用的主流,而通过技术改进与制度治理可望在可预见的时间内得到有效缓解。各国正加速推进法规框架,以规范AI基础设施建设与运行;与此同时,随着业界经验积累和公众认知提升,对AI的误解与夸大也将逐步消退。


AI本质上是一套处理海量、多源、高速数据的方法论,能够弥补传统手段在规模与复杂度上的不足。但是,公众与决策者对AI的理解尚不均衡,部分“想象中的”风险被过度放大。


总体来看,AI正处于技术落地与社会认知的“双重夹击”中,随着标准化制度的建立与技术自身演进,算法偏见和虚假信息等问题将逐步得到控制,AI处理大数据的核心优势将更为凸显。


新京报贝壳财经记者 胡萌 编辑 陈莉 校对 卢茜