开栏语
当人工智能的浪潮席卷全球,北京正以科技创新之姿,成为AI大模型领域的战略高地。从智源研究院的“悟道”大模型问世,到“天使投资人”模式孵化原创成果,再到月之暗面、智谱等人工智能独角兽崛起,这座城市不仅汇聚了前沿技术,更以开放生态孕育突破性成果。
如今,北京正积极打造“全球开源之都”,一大批研发机构、企业积极拥抱开源,而开源也已深入到汽车、机器人等众多行业。发展AI将是一场科技长征,在北京市科委、中关村管委会的支持下,新京报AI研究院推出“AI浪潮录”系列专栏,深度访谈此次AI浪潮的亲历者与见证人,讲述AI竞争新格局与背后的故事。
英诺天使基金合伙人王晟。受访者供图
创业者与科学家之外,投资人的深度参与,是一个行业实现真正繁荣发展不可或缺的关键要素。尤其在人工智能领域,天使投资人宛如初创公司的“启明星”,为那些怀揣梦想的AI初创企业迈出至关重要的“第一步”,提供了无可替代的支持与助力。
2023年以来,AI大模型浪潮席卷全球。英诺基金作为一家较早关注AI的投资机构,在此之前就嗅到了生成式模型的潜力和商机。2022年6月,英诺基金投资了以清华NLP(自然语言处理)实验室团队为主体的大语言模型公司深言科技,彼时ChatGPT尚未出世。
在中关村梦想实验室,英诺天使基金合伙人王晟回忆过往,脑海里是AI行业越过山丘,也有当下的大浪淘沙。他的投资经历中,曾目睹十余年前以CV(计算机视觉)和自动驾驶为主的第一波AI浪潮,如今眼见AI Agent(智能体)和具身智能崛起。王晟很少“海量”看项目,更偏向于主动挖掘创业者,在他看来,这一轮AI大模型浪潮的创业者具备鲜明的特点,“大多是科学家和‘技术大牛’,圈子比较收敛。一名优秀天使投资人需要做到的就是,当他们想要创业时会找到你。”
王晟透露,目前投资的过半项目都在“水下”,“只有我们知道或只局限在小圈子里,并由我们锁定投资,我们几乎不会投资完全市场化、公开化的路演项目。”
他眼中,投资人更青睐有经验的初创公司创始人,学术和科研能力应该是标配。而随着ChatGPT和DeepSeek之后人们对大模型产生“超级共识”,AI初创公司不要试图占领巨头的地盘,因为它们需要有较为宽松的窗口期。
押宝·投资人青睐有经验的创始人
新京报AI研究院:在过去几年AI大模型技术发展浪潮中,你作为投资人有哪些经历?
王晟:我们是最早关注这一波AI大模型浪潮的投资人,某种角度上来讲,我们预判了这几年的AI走向。2021年年底至2022年年初时,我们的投资方向非常明确,就是要投生成式模型。这是我们这些年逐渐理解和消化 AI范式的进化所产生的认知。因此,2022年6月,我们投资了大语言模型公司深言科技,深言科技的背后是清华大学NLP团队,最初是一家典型对标OpenAI的公司。
英诺基金在2013年春天成立,当时正好赶上上一波以CV和自动驾驶为主导的AI浪潮,并投资了一些非常优秀的公司,这加深了我们对AI的认知。同时,我们也观察到,上一波AI浪潮是有边界的,并非‘什么都能做’。2018年、2019年时,以“AI四小龙”为代表的产业走过了欲望的巅峰,走向了绝望的谷底。
也是在那时,我们注意到了新一波AI在NLP上取得的突破——BERT出现了。这是谷歌在2018年提出的一种预训练语言模型。在此之前,使用AI处理语言是一个“老难题”,因为CV范式无法简单平移到 NLP,而BERT则大幅度提升了NLP的能力,透过BERT能够发现,以Transformer为基础架构的模型提供了多元化能力,不光可以用于自然语言对话,还能用在其他智能任务上。
我们发现“这个东西挺好用”,由此开始跟学界、产业界了解这一技术创新,但尚未达到让我们作出决策的阈值。2020年,随着OpenAI发布GPT3,以及Diffusion文生图模型等成果发布,我们发现这一轮AI并非单维,而是多维,显示出了很大的爆发潜力, AI的新时代可能已经到来。2021年底时,我们“极度关注”这一方向,因为它可能预示着一波AI新范式。在那时,国内除了百度和阿里巴巴外,几乎没有几家公司关注这一方向,市场上真正做对标OpenAI大模型的其实只有智源研究院。
而智源的科学家中,主要做大模型的团队包括唐杰、孙茂松、文继荣等。其中,孙茂松老师所在的NLP团队所做的大模型范式基于GPT,恰好对标OpenAI。于是,我们在2021年年底找到了孙茂松老师,以及当时博士还未毕业的团队成员岂凡超。
2022年春天,岂凡超准备着手创业,我们立刻决定在他6月毕业之后就进行投资。也在此期间,岂凡超与许多家投资机构进行了沟通,但很少有人知道GPT、Transformer、LLM(大语言模型)。
这一情况直到ChatGPT发布后才发生了逆转,ChatGPT让产业界迅速产生了巨大共识,很多投资机构立即下场,深言科技也得到了广泛关注。之后大模型技术开始火爆,我们迎来了AI大模型浪潮。
新京报AI研究院:国内一度开启“百模大战”,投资界如何在众多AI公司中进行选择?
王晟:投资人更青睐有经验的初创公司创始人。深言科技有技术实力,但公司团队主要是以岂凡超为首的三位博士生,在融资上的竞争力不如曾经有百亿公司创业经历的王小川、万亿公司创业经历的王慧文。根据这一逻辑,也可以解释为何杨植麟的月之暗面广受青睐,因为他不仅有技术、有谷歌等国外公司的工作经历,同时也有创业经历,因此在投资者眼中很有竞争力。
“百模大战”有一个前提,就是Llama的开源。在此之前,深言科技的团队经历了三四年的研发,训练过三代大模型,但随着Llama开源,许多大模型公司得以缩短这一段差距,创造一个新模型也不再是难事。
投资·海量看项目不如预判
新京报AI研究院:天使投资人如何进行投资,你如何找到AI领域的创业者?
王晟:目前,我们投资的过半项目都是“水下”的,即只有我们知道或只局限在小圈子里,并由我们锁定投资,我们几乎不会投资完全市场化、公开化的路演项目。
海量地看项目是一种效率极差的行为,一年即便看1000甚至2000个项目,也避不开噪声的影响,最后项目转化率可能只有1% 、2%,这是因为输入不对。当输入质量变高,所投资项目的最终产出也会变成10%、 20%。
一个好的天使投资人,要做到AI和具身智能初创公司在考虑进行第一轮融资时主动来找你,因此在相关领域是否具有影响力,口碑和声誉很重要。作为投资人,我们要关注到技术的发展方向,你的预判甚至可能早于科学界的证明。当我们想往一个方向投资时,会非常清楚在该领域中哪些学校做得好,哪些科学家做得好。
新京报AI研究院:目前在AI大模型领域创业,需要具备什么样的素质?
王晟:首先基本保障是他的学术能力、科研能力。不论AI大模型还是具身智能,对技术能力的要求都很高。这跟投应用产品不一样,存在高技术壁垒。这些人都是学界或者行业中的翘楚,大家认可其学术水平。其次,每所高校都有自己的技术基因,一些高校初创公司产品的核心技术并非一代人的努力,而是这个学校、这个专业、这个实验室几代人的努力。几十年的积累,最终这种能力赋予了转化出来的那名创业者,这背后可能是几十个老师、几百个师兄师姐共同创造的价值。
此外,他是否有动机进行创业,不同学校的文化基因不同。中国高校里创业最踊跃的是清华和浙大,虽然哈工大在AI和机器人领域技术实力也非常强,但由于学校文化的影响,创业者相对而言并不多。一家学校是否有创业风气,往往要看这所学校过去是否出现过成功的创业者,他们以身入道赢得了尊重,很多师弟师妹就开始效仿,从而形成了一种文化。
新京报AI研究院:基于投资人的视角,当前大模型浪潮中AI公司创业者们有何特点?
王晟:当前AI大模型还没有完全进入应用时代,创业者圈子比较收敛。当应用火热之时,创业者是从人堆之中“涌现”出来的,例如王兴、张一鸣,技术背景相对并不强。
这一轮AI大模型创业风潮,创业者大多是科学家或者“技术大牛”,圈子是收敛的,相对较窄,甚至某种意义上可以认为他们是一个科学共同体,找到这些科学家也比较容易。
AI大模型创业的前提是在学术研发上有深度。当然,随着国内技术进步、科研人员发布论文增多,很多东西已经变得没有那么“高深莫测”,门槛逐渐降低。但企业的工程实践仍然需要很多资金、算力、数据,真正花过钱、踩过坑的创业者并不多。
目前一个新趋势是,产业在推动当前这一波AI技术范式上的作用逐渐增强。从论文的数量、质量、高被引的次数上看,产业胜过了学界,这在过去从来没有出现过,其中主要原因之一是学校的钱不够,没有办法支持高技术壁垒,花钱炼大模型。
生变·“用钱换能力”已走不通
新京报AI研究院:当前投资AI的基金有哪些类型?
王晟:这个市场上主要有两类基金:一类基金坚持长期主义,关注公司能做多大力度的创新,多大程度提升生产力。另一类基金关注公司到底有多少收入,卖出去多少产品。两类基金风格迥异,前者能接受企业长期亏损,但企业一旦成功就会获取大额收益。目前,最优秀的互联网公司都由长期主义基金投资,和后者没有任何关系。虽然由于国内资本市场等现实原因,许多基金属于后者,周期较短,但天使基金的风格必然更偏向长期主义,因为我们投资的时候,对方并没有产品,可能只有一个人、只有一个想法。
因此,我们会天然看对方是否有宏大的叙事,能否解决最终的问题,比如达到AGI(通用人工智能)。但我们也要面对现实,即在这种偏好的情况下,投资回报率产生风险怎么办?对此解决方案有二:作为早期基金投资最早、估值最低的一轮,在企业快速发展的过程中,有很多退出机会,不局限于它最后能够上市;我们不会只投某一领域的单点项目,而是体系化布局,例如机器人领域,我们既投资了机器人公司,也投资了供应链公司,还投了场景化公司,围绕整个产业链上下游进行布局。我们既关注剑指AGI的公司,也关注能有效落地的公司,以此让投资组合更均衡。
新京报AI研究院:今年以来,DeepSeek和Manus的出现给你们的投资策略带来了什么影响?
王晟:虽然我们很关注,但DeepSeek对我们的投资策略毫无影响,它验证和增强了我们对既定投资策略的信心。今年,我们的投资重点是Agent(智能体),没有推理就没有Agent,DeepSeek恰好证明了推理模型的前景。
而对于Manus,我认为其本质是集成了众多的prompt(提示词)。目前,一部分创业者和投资人的共识是prompt很难产生基座模型之外的能力,prompt本身没有壁垒,其壁垒有可能是抓住了很强的用户需求。相比之下,拥有更强技术能力,能够把垂类行业中的推理决策训练到模型里面的团队会更受青睐。
当大模型拥有泛化能力的时候,留给初创公司的机会就不多,因为只要拥有足够的知识,一家AI巨头将可以涉足一切领域。但当我们进入垂类产业时,推理模型所依赖的是该产业中的各种决策经验,这些经验并不容易取得,无法泛化,这就给初创公司留出了发展空间。
新京报AI研究院:DeepSeek的成功对其他AI行业公司有何启示?
王晟:DeepSeek的成功本质是大语言模型的scaling law(规模效应)到头,当天花板高、斜率很高的时候,中国公司可能难以追赶。举一个简单的例子,如果说过去投入10亿美元就能将模型能力提升一倍,现在投10亿美元可能模型能力连5%都提升不了,这就给了DeepSeek机会,让它可以用大量相对较差的GPU训练出一个能力接近OpenAI的顶级模型。
这就意味着,未来大模型训练对GPU的需求量会逐渐降低,开始从“暴力美学”转向更细致的工程化,过去“用钱换能力”的路走不通了。未来,或许只有多模态大模型仍然需要巨量算力。
我认为,AI初创公司不要试图占领巨头的地盘,因为它们需要有较为宽松的窗口期。我们目前不再下注大语言模型公司,一个很重要的原因是ChatGPT发布之后,所有人瞬间形成了巨大的共识,没有人怀疑大模型,这就导致巨头也一定不会放弃大模型的发展方向。在这种情况下,初创公司融资得到的资金处境就相对尴尬,因为它们在资金实力上无法和大公司相比。
在这种情况下,需要提醒大家的是:DeepSeek其实是一个以创业公司的组织架构重新构建的大厂,所以它既有创业公司的活力,又有巨头的优势,才可以心无旁骛地追求AGI,而不用关心数据。相比之下,月之暗面等初创公司虽然也追求AGI,但也不得不通过投放提高数据,因为没有用户就没有下一阶段的融资。
我对AI初创企业发展的看法就是,不要在一个超级共识形成起来之后,试图去做没有窗口期的事情。
新京报贝壳财经记者 罗亦丹 编辑 王进雨 校对 柳宝庆