对话投资人陈昱:大模型底座能力没突破之前,应用难有质变

8月,大模型创业公司再传融资消息,月之暗面与零一万物先后传出完成新一轮融资,其中月之暗面完成了超3亿美元的最新一轮融资,最新估值达到33亿美元。尽管资本再次表现出对AI独角兽公司的青睐,但在投资人眼里大模型的发展之路仍在“摸着石头过河”。


“大家都知道AI大模型好,但怎么在内部落地部署,才能最大限度发挥大模型的效用?”“不论大模型选择B端市场还是C端市场,目前都没有清晰可行的商业模式。”从事前沿科技、智能驾驶等领域投资十年的云启资本合伙人陈昱日前在澎湃科技(www.thepapaper.cn)采访时直言。

云启资本合伙人陈昱

在加入云启前,陈昱曾任Google(谷歌)工程师、国内上市公司CTO(首席技术官),陈昱早在2021年已入局大模型,当年他参与投资了大模型创业企业MiniMax,成为后者天使投资人,MiniMax也是眼下大模型明星创业企业之一。陈昱认为, “未来每个企业都会有自己的大模型应用,但目前没有很好的商业盈利模式。” 

澎湃科技:最近我们在做一些大模型创业公司的调研,发现创业公司如何实现持续的发展存在非常多的不确定,一方面投入特别大,另一方面融资也不容易,你作为投资人怎么看这些问题?

陈昱:确实,今年大模型公司看起来都融到了钱,明星创业企业的估值达到了二三十亿美元,但科技公司所处的创投环境其实非常残酷,资本不可能无限制地支持不赚钱的公司,创业公司最终必须形成自己的商业模式,能产生规模化的收入。但现实情况是,大模型创业公司要想实现规模收入已经非常困难,更谈不上盈利。不论选择B端(面向企业)市场还是C端(面向消费者)市场,大模型公司都面临着相似的困境,还没有清晰且成立的商业模式。

B端市场其实是帮企业客户部署私有模型。当前,B端市场的利润空间正在急速萎缩,去年能卖到千万级别的大模型项目今年可能只能卖到100万元了。市场上有太多的开源大模型可以套壳,竞争非常激烈。B端业务涉及售前服务、合同签署、项目实施(如模型监督微调)以及售后维保等,这些都得耗费人力,原本卖到千万,大模型企业可能有毛利空间,但现在连毛利都没有了。

大模型企业训练基座模型消耗的算力成本通常是上亿级的,而当下大模型企业也没有办法通过B端业务的收入来分摊训练成本。

澎湃科技:就目前而言,对于甲方客户来说,现在部署私有大模型是不是也是一件性价比并不高的事?

陈昱:许多企业不愿错过AI浪潮,但在AI与自身业务结合上还没有找到明确的路径。甲方也一样,面临的最大的问题是知道要运用大模型,但不知道大模型如何在企业内部落地、部署,如何才能最大限度发挥大模型的效用,事实上这需要花大量时间和大模型公司沟通。

企业做大模型私有化部署时,数据或许会成为真正的障碍。什么样的数据适合微调、怎样做数据清洗,有用的数据怎么做好标注,这些都得花人力、物力。训练数据的选择和模型对齐会极大影响模型的使用效果,所以不存在一个大模型能适用所有的场景。

澎湃科技:B端市场不好做,那C端如何呢?

陈昱:大模型面向C端大众市场的产品应用大概可以分为两大类:一是情感陪伴类对话机器人,譬如MiniMax旗下的星野和大家熟知的C.ai;第二类就是生产力工具。这些产品其实各家大模型都在做,问题是只要大企业一天不收费,其他企业也很难收费,因为它本质上并没有用户粘性。对于现金流良好的大企业来说,最好的策略就是把竞争对手熬死,所以对于国内创业公司来说,要想通过面向C端的生产力工具来收费也会很困难。最终肯定会出现融钱融不到而被淘汰的企业。

澎湃科技:现在很多大模型公司纷纷发展海外业务,你怎么看这类现象?

陈昱:大模型到了一定估值以后,都得回答一个问题,即怎么实现规模化产生收入。海外市场更大,海外客户的付费意愿也相对国内会高一些。所以我目前重点关注的企业也都是有出海业务的企业。大模型出海,其盈利方式和在国内市场并没有太大变化,但会面临着与国外大模型产品的竞争,极具挑战。

澎湃科技:从去年到今年,大家对于大模型的关注点从技术到应用,但应用也没有迸发,原因是什么?

陈昱:从去年到今年,大模型的推理成本已大大降低,但之所以没出现很好的应用场景,还是受限于大模型本身的能力,如推理能力和幻觉问题。

现在大家整体的感觉就是,大模型很多地方都可以用,但又好像什么地方都用不了,这是因为大模型没有调教之前还涉及幻觉等问题。这也是我们投资难做的原因,虽然大家都在看AI应用方向,但问题在于大模型的底座能力进展缓慢。大模型能力没有突破之前,下层应用很难有实质性的改变。

所以当下大家不要有过高的期望,但对未来可以乐观,技术的迭代是非常快的。去年的大模型的水平如果说是初中三年级的水平的话,现在可能已经是高二的水平了。它也和人一样不断地学习、会进步。

今年大模型领域最大的变化是成本,成本下降了至少两个数量级。成本的下降一方面是市场倒逼的结果,另一方面也是得益于技术的提升,底层算法的创新确实一直存在,带来了成本的降低。

大家对科技的发展一定要有耐心,大模型公司的经验也就这一两年时间,现在大家的状态是相当于摸着石头过河。不过技术的发展趋势最终是科技民主化,让大家使用门槛变得更低,所以再等一等,我觉得未来每个企业都会有自己的大模型应用。今天企业部署它的私有模型可能要花千万级,但再过十年,它就不需要再花如此高昂的成本。我认为未来企业的私有化大模型部署可能会更加工具化、产品化。

随着技术成熟,会越来越标准化,成本越来越低,所有科技的发展都遵循了这么的一个发展路径,成本很高只是当下一个短期的一个阶段性现象。去年11月份我给我们LP(出资人)分享的时候还说,未来三年大模型的成本会降两个数量级,结果没想到半年后就已经实现了。其实这个世界变化得比我们所有人想象的都快。