编辑 | 林芯
“长期的 token 定价应该只有今天的十分之一。”
“从能力上来说,模型的发展严重过剩了。”
“FDE 在当下其实是‘产品还没有完全成熟’的一种代名词。”
这是硅谷网络安全巨头 CEO Nikesh Arora 做客 20VC 表达的一系列观点!
如今的大模型领域,各大模型厂商不断开卷,模型越来越智能。
但在 Nikesh 看来,人们今天用 AI 做的 90% 的事情,根本不需要用到什么 Fable 5 或者是 Mythos 5 这种最先进的模型。
我认为从能力上来说,模型的发展严重过剩了,特别是面对消费者和大多数企业的需求时。比如,两年前的模型已经足够应付我们理解的大多数查询了。
除了卷模型能力,大模型厂商真正的护城河是:记忆与上下文。
一旦开始针对每一个独立用户建立起这样的上下文,就会产生用户粘性,而这就会变成公司的护城河。
前沿模型公司也深知这个问题,所以他们正积极地把“记忆”和“上下文”融入到自己的模型中。但这也会给用户带来问题:可能要为此付两次费。
还有 Token 价格,Nikesh 认为长期的 token 定价应该只有今天的十分之一。
如果 Token 注定会变便宜,为什么现在还没看到前沿模型的降价呢?
Nikesh直言,因为现在这些前沿模型公司发现自己正在进行“价值最大化”,他们正在以一万亿美元的估值进行融资。他们手中唯一的杠杆,就是从经济角度出发,对自己产品组合中增长最快的东西收取更高的费用。
大模型公司在不赚钱的聊天机器人里该怎么盈利呢?是要像OpenAI一样建立一个广告引擎吗?
Nikesh 曾在 Google 担任过首席商务官,在他看来,整个广告蛋糕的总体积不会增加。在线上世界,已经分走了 60% 到 70% 的广告蛋糕。除非大盘会发生爆炸式增长,否则那些广告收入,必须从现有的广告总额里去抢。不过,也存在一种可能性,那就是 AI 最终会夺取更多的“交易收入”。
备注:交易收入,这是商业模式里的一个核心概念。它不是指传统的“卖软件/订阅费”,而是指从发生的每一笔真实交易中抽取百分比或佣金。
第二,为什么现在的 AI 行业需要FDE?(前线部署工程师)
关于这个问题,Factory CEO 认为,“如果你需要靠 FDE 才能把产品卖出去,说明你的产品做得很烂。”
而 Nikesh 认为面对现在产品还没有成熟就要销售出去的状况,在短期内是需要 FDE 的。
FDE 在当下其实是‘产品还没有完全成熟’的一种代名词。实际上将 AI 真正用于企业也不过 12 个月,在这么短的时间内,产品还没有定型,也没有经过企业需求的检验。因此,FDE 意味着:我派几个人去你的办公室坐着,根据你的需求来调整我的产品。
在另一方面,真正的 FDE 是能够把客户那边的代码带回来、反馈到你们核心产品中的人。他们会说:“听着,我在客户现场写了这个功能,因为他们有这个需求,而我们应该把这个融入到我们的标准产品中,因为所有人都会需要它。”
第三,SaaS 应用将让位于 AI 应用。
Nikesh 的理由很简单:SaaS 应用没有观点,而 AI 应用将拥有观点。而我们要从“没有观点”的软件走向“拥有观点并表达观点”的软件。
第四,AI基础设施依旧是印钞机,但未来可能会出现一段消化期。
对算力的需求让基础设施公司不断扩张,但我们面临着物理学的极限。(现实世界的建设速度和物理资源却跟不上)
当我们认为对算力的需求就在那里时,执行的能力却受到了物理学极限的限制,而基础设施玩家们针对这一需求已经建立了过剩的产能。
第五,当主持人问到:如果在 AI 时代重新创立一家网络安全公司,将会有什么调整?
Nikesh 类比现在的自动驾驶汽车,提出了一个观点:如果你是一家正在构建 AI 融入能力的企业,你必须采取特斯拉的方式,但你绝不能采取传统汽车制造商的方式,他们只是试图塞进一点点 AI,进行某种“AI 洗白”,然后说我最终会实现目标的。
第六,整个世界将变成一个由分化模型割据的世界。
Nikesh 认为,物理AI不会像通用前沿模型那么简单,因为物理AI没有消费级的通用场景,所以你会看到这些模型向深度垂直发展,整个世界将变成一个由分化模型割据的世界。
当然,除了上面的内容,还有更多硬核观点,例如“模型越狱”“前沿模型的本质是广度和深度”“数据分析的世界已经开始被重塑了”“硅谷过度狂热与恐惧错过”等。
全文就在下面!
企业端和消费端的拉扯:前沿模型的本质是广度和深度?
主持人:我看到了你的推文,我觉得太精妙了。你发推说,前沿模型的问题本质上是“广度 vs 深度”的问题。你能帮我解释一下吗?
Nikesh:是的。现在有了这些惊人的前沿模型,它们每隔几天就会互相比拼、跨越式发展。OpenAI、谷歌或者在 Anthropic 每隔几天就会发布一个全新的模型。问题就变成了:好吧,这些模型正在进入这个领域,我需要构建什么?我需要用这些模型做什么?当你意识到即使是最好的模型也有很高的误报率(false positive)时,你就会发现,由于某些原因,在消费者领域我们似乎并不在乎。
备注:false positive 是指在测试或检测过程中,系统错误地报告了一个问题或缺陷,而实际上并不存在这个问题。
今天早上我和我家人聊天,她说她刚用 ChatGPT 问了所有这些问题,感觉非常有帮助。我想,消费者对误报的容忍度要高得多,因为中间总是有“人”的存在,总有人在理解模型说的话,并做出自己的判断,决定是否相信这个模型。通过这种方式,人们在一定程度上过滤掉了误报,或者说人们根本不在乎误报,有时人们甚至选择相信误报。所以消费者对这种“误报”的概念高度容忍,而且模型看起来确实越来越好。
我甚至让 Gemini 为我正在看的一个投资项目写了一份备忘录。我看了一下,感觉相当准确,虽然我微调了几处,但看起来完全过关。所以在消费者端,这是一个“广度”问题。如果换作以前,我得雇一个银行家和一堆投资分析师,花上好几天时间,而我用它4分钟就搞定了。所以广度已经达到了,这意味着它成了我的首选之地。正如你所知,在消费者领域,如果你成了首选品牌,其分发效应是具有巨大的乘数效应的。无论是寻找流媒体视频时唯一会去的 YouTube,还是搜索时唯一会去的谷歌,从分发角度来看,这都会产生巨大的叠加效应。所以我们的前沿模型朋友们正在争夺消费者品牌,而误报在其中并不那么重要。
图片
但在企业端,误报至关重要。因为如果你设想一下未来智能体将做出独立决策并付诸行动,你对误报的容忍度必须是零。Waymo 是目前市面上最庞大的智能体产品,取代了一个被称为司机的职位。所有的决策都由 AI 和机器学习做出,它决定什么时候转弯、什么时候停车、该做什么。但想想看,为了用一个 AI 驱动的智能体有效取代人类司机,需要进行多少极端情况的训练?我不知道,大概花费了数百亿美元。这就是把一个应用场景研究透彻并进行极限训练所需要的代价。如果你想想那里发生了什么,他们本可以使用等同于 AI 模型的东西,但随后他们构建了如此多的上下文、智能、极端情况训练和专有数据,才让这一切成为现实。
那些数据在互联网上是找不到的。你不能直接把 Anthropic 的最新模型塞进你的梅赛德斯-奔驰里,然后对它说:“好了,送我回家吧。”它根本做不到,而这就是我所说的“深度”问题。因为你需要围绕模型构建深度的上下文、理解和智能,才能让它在真正具有自主性的智能体应用场景中发挥作用。
所以,我认为这里存在一种持续的拉扯。前沿模型渴望获得消费者的关注,因为这能推动模型的后训练,进而塑造模型的消费者品牌;但另一方面,企业端真正的收入将来自于那些需要更多上下文的应用场景。
我们都知道,目前最突出的一个应用场景就是编程。编程是一项通用活动,每个人都在做,所以每个人的数据对模型的训练都有帮助,这也就演变成了一种大型的企业应用。
超过一半的企业在 AI 的观念上是错误的!
主持人:当你在思考工作流以及企业与 AI(特别是模型)的互动方式时,你认为我们会在多大程度上陷入一个由前沿模型主导的世界?还是说大部分的企业工作流都可以通过开源模型来完成,而且我们在大多数时候走向开源会更具成本效益?
Nikesh:我认为,目前超过一半的企业在如何使用 AI 的观念上仍然是错误的。我觉得大家现在依然在忙着把 AI 生搬硬套到现有的商业惯例中。比如:如何把我今天在做的事情,加上一点点 AI,让效率稍微提高那么一点点,因为我不想再用老一套的方法了。
但我认为,真正的机遇在于利用 AI 从根本上重构你的工作流。这才是真正能带来核心效益的地方。从长远来看,真正的赢家将是那些用 AI 重新构想公司的人,而不是那些仅仅用 AI 对当前工作流进行微调、小修小补的人。
图片
放弃一部分人类的控制权,让 AI 帮我们完成 80% 的思考?
主持人:如果是一家企业,要怎么做才能实现这一点?
Nikesh:我认为大概可以划分为两到三个不同的类别。比如第一类:我们看看当今的工作流。我们有围绕企业资源计划的工作流,有围绕销售团队管理的工作流,有围绕人力资源管理的工作流。这些现有的工作流已经被“软件服务化”了,也就是说,有软件公司认为我们都有通用的流程,于是构建了一个容器,企业可以在其中对这些通用流程进行一些微调。企业把自己的工作流写进我的 SaaS 应用里,然后我们就开始运转了。
现在,这种工作流需要大量的人类判断和人类交互。因为软件本身并不是智能的,它只是被写好了代码。你定义输入,你定义输出,我输入进去,我就知道会得到什么输出。
但如果 AI 在提供信息和让流程变得更智能方面可以提供巨大的帮助,这就需要我们放弃一部分人类的控制权,让 AI 帮我们完成 80% 的思考。而这恰恰不是我们现在的做法。我们现在做的只是:“把这张发票拿去扫描,提取数据,放进 AI 里,然后说:速度提高了 20%。”
图片
SaaS 应用将让位于 AI 应用!从事管理类活动的岗位将减少一半
主持人:你认为我们愿意放弃人类的控制权吗?你看现在的例子,比如有些事件中,大约有1700人签署了请愿书,表示他们不愿意让系统追踪他们的鼠标和击键行为,我们能看到人们对于提供数据或数据点的抵触。
Nikesh:我认为这是两个不同的问题。为了训练 AI 而进行的大规模数据收集确实有点危险,因为人们能看到这会带来什么后果。我听说过有些公司甚至用摄像头来追踪人们折衣服、熨衣服,因为他们想在未来训练物理机器人来做这些事。但把这些撇开不谈,在企业端,如果我们决定在某些地方愿意向 AI 交出控制权,我们实际上可以把业务运行得更有效率、更有成效。
最好的例子就是营销,任何训练营销模型所需的内容,其实早就在公共领域里了。营销本身就是公共领域的东西,对吧?如果你不把它推向市场,它就不会出现在公共领域。所以我拥有营销领域最好的训练数据,我不需要用更多的营销内容去训练一个 AI 模型,我可能只需要针对我的品牌调性和品牌形象去训练它。
既然如此,我为什么还需要400或600人呆在营销部门?因为我在营销上面临的最大问题是:我有600人,但我无法确定他们是否都完全理解如何始终如一地传达我的品牌调性、我的价值主张,以及如何做到不因为在公共领域发布了不同的宣传材料而损害我的品牌。
主持人:在你们公司营销部门有600人吗?
Nikesh:以后不会是600人了。我的经验法则是,在接下来的三年里,公司里从事一般行政管理类活动(比如营销、财务、人力资源)的人员可能会减少一半。因为这些部门有大量的流程管理,而通过使用某种定制化的未来 AI 应用,大量的流程管理可以变得更加智能。
图片
因此,SaaS 应用将让位于 AI 应用。两者的区别在于:SaaS 应用没有观点,而 AI 应用将拥有观点。这是我们从工作流的角度需要进行的根本性重新思考。
SaaS 应用没有观点,而 AI 应用将拥有观点
主持人:你能帮我解释一下吗?AI 应用将拥有观点”这意味着什么?无论是从你如何使用它们,还是从它们的产出结果来看?
Nikesh:比如你的 AI 助手(无论你想叫它 AI 营销助手还是 AI HR 助手)会说:“我看过你写的文案了,写得太烂了。这还不够好,跟我们的品牌调性不符。这是我的修改建议。”
它拥有观点,这会让我的普通员工变得比现在聪明得多。这样一来,我就不需要那么多人了,因为 AI 已经帮你把大部分工作都做了。
AI将接手我们的工作时一种谬论,未来对计算资源的需求被低估了
主持人:对于那些认为你错了的人,你会说什么?他们认为我们不会看到这些职能人员减半,相反,营销团队会创作出更多的文案、更多的内容,并触达更多的地方。
Nikesh:不,我认为人们可能想错的地方在于,我们在未来需要多少技术资源。我认为我们需要更多,而不是更少。现在有一种谬论,人们认为因为 AI 要接管我们的工作,未来工作的人会变少。我不相信这个。
图片
我认为实际情况是,你无法想象我的团队里有多少人想要更多的技术资源、更多懂 AI 的资源,因为他们想做的恰恰就是这些事。他们会说:“哦,我有一个彻底改变营销的惊人项目。”而我会问:“你需要什么?”他们说:“我需要更多懂得如何向前沿模型提问、构建控制框架、将专有数据引入其中并建立护城河的人。我需要更多的算力和更多的存储空间,因为我想学习一切。”
现在的问题是,一天的时间根本不够用,因为我太忙于应付工作中某些陈旧的软件,还必须不断去维护它。试想一下,如果我让那个软件变得真正智能,它就会直接告诉我该做什么。
90% 的企业员工并不精通 AI,我们又回到了“达尔文适者生存”的时刻
主持人:就需要更多技术资源而言,我会把“token”也归为技术资源的一类。你如何看待如今有效的token分配?你现在能看到非常不同的阵营:像 Meta、Uber和微软这样的公司会设立预算上限;而另一些公司则采取自由放任的态度,让员工自由发挥、保持创意。你是怎么处理的?
Nikesh:我知道围绕人们使用了多少 token 的讨论,让整个 token maxing 的世界变得有些颠倒混乱。目前的挑战是,90% 的企业员工并不精通 AI,他们真的不懂。他们必须学习,但我又不能把他们送回大学去,因为现在任何地方的学校都没有这样的课程。他们必须能够自学。
图片
我认为我们又回到了一个“达尔文适者生存”的时刻,每个人都必须摸索出谁才是真正优秀的人才。你已经看到像布莱恩·阿姆斯特朗和杰克·多西这样的人站出来说:“我要彻底重组我的机构,我要从头开始构建。”他们已经走向了裁员 30% 到 40% 的模式,因为他们发现这没有挽回的余地,无法再去培训这些人,只能去寻找那些一进来就能帮他们做这些事的人。这是一种模式。
备注:布莱恩·阿姆斯特朗加密货币交易所Coinbase联合创始人兼首席执行官;杰克·多西Twitter创始人之一、Twitter原首席执行官。
另一种模式是渐进式的。我们现在只通过黑客马拉松来招人,对吧?我们看到每个月大概有 2% 的自然流失率,我们直接用真正懂 AI 的人来替换他们,也就是从黑客马拉松里招人。给我12个月,我就能让团队完成 20% 到 25% 的转型;给我3年时间,希望公司就能有足够多懂 AI 的员工在工作了。所以有这两种不同的方法可以达到目的。
备注:黑客马拉松(Hackathon)是起源于美国的编程比赛形式,参与者需在限定时间内协作完成软件开发项目。
长期的 Token 定价应该只有今天的十分之一
主持人:马克·贝尼奥夫前几天说,他每年为他的开发人员在 Anthropic 上花费3亿美元,这大约占开发人员平均薪资支出的 3.8%。如果一直保持在这个水平,Anthropic 和 OpenAI 的估值就被严重高估了;但如果这个比例移动到 20%,它们实际上被严重低估了;而如果变成麦考尔(Mccor)的布兰登(Brandon)所说的那样,我们在 token 上的支出将和我们在薪资上的支出一样多,那它们的估值就是被极其严重地低估了。我想谈谈你认为3年后,开发人员在 token 上的支出占薪资的比例会是多少?
备注:马克·贝尼奥夫(Marc Benioff),被称为“云计算之父”,现任Salesforce公司首席执行官兼联合创始人。
Nikesh:对我来说,这仍然是一个狭隘的视角。如果我把问题抽离出来,站在更高的角度来看,当今世界所要求的算力是严重不足的。你甚至买不到算力。现在的算力成本比两年前要贵上2到3倍甚至4倍,算力严重短缺。
这种算力的稀缺,以及构建和交付算力(以让 AI 发挥作用)所需的超额成本,正在造成瓶颈并推高价格。而且有趣的是,我认为超过一半的算力正在用来服务消费者端,而消费者端目前从根本上是一个亏本的实体。我不认为任何一家前沿模型公司在试图让你我每天使用 ChatGPT、Claude 或 Gemini 时赚到了钱,它是免费的。那可是消耗了大量的算力。想象一下,全世界有数十亿人每天在用它查询各种问题,这吞噬了一半的算力,却没有任何回报。
图片
你猜这种压力转移到了哪里?压力转移到了另外一半算力上,也就是用于企业应用中的编程等场景。所以现在等于是在说,在我们在消费者端建立起交易模型或广告模型之前(因为他们还没准备好),企业应用和编程必须为此买单。
你可能会说:“当年搜索领域也是这样发展的,对吧?”谷歌搜索刚出来时也是如此;人们大量观看 YouTube 视频,消耗了大量算力,但它当时并不能自给自足。问题在于,与那个时代相比,我们今天的算力需求和成本已经是当年的 10 倍了。这迫使 token 价格一路走高。
我认为,长期的 token 定价应该只有今天的十分之一。当这种情况发生时,你会看到人们的消耗量会大幅增加。至于占到 3.8% 还是 15.8%,我不确定我们现在能给出答案,因为价格在未来3到5年内会发生非常剧烈的波动。
像 OpenAI 一样构建广告引擎盈利?但AI 最终会夺取更多的“交易收入”
主持人:你认为我们会看到 token 价格出现下降?
Nikesh:我认为是的。在接下来的 3 到 5 年里,我们会看到token价格下降。我认为在未来的某个时间点,前沿 AI 公司将会限制消费者对 AI 的使用,因为他们已经拥有了超出所需的后训练数据,而且每个用户在前沿 AI 模型上进行的活动在本质上都是无利可图的。
主持人:你不认为他们会像 OpenAI 现在正在做的那样,直接通过构建广告引擎来为这部分业务买单吗?
Nikesh:你知道,这是一个很有意思的问题。钱总得从某个地方来。2004年我刚加入谷歌时,我们的收入只占全球广告总收入的 2%,而当时全球广告总收入估计在5000到6000亿美元之间。根据最新的统计,现在线上广告已经占到了广告总收入的 70% 左右。但我认为整个广告大盘每年增长不会超过 3% 到 5%。
所以,我不认为整个广告蛋糕的总体积会增加。在线上世界,你已经分走了 60% 到 70% 的广告蛋糕。除非你告诉我大盘会发生爆炸式增长,大家会把更多的钱投入到营销中,否则你希望能用来资助消费者 AI 的那些广告收入,必须从现有的广告总额里去抢。因此,我不认为广告能彻底改变消费端 AI 的盈利方程式,让它扭亏为盈。
不过,我确实认为存在一种可能性,那就是 AI 最终会夺取更多的“交易收入”,而这在以前并不属于 AI 的范畴。
图片
主持人:你能帮我解释一下吗?
Nikesh:你想想营销链条,我们做广告,但广告本质上是低效的。行业顶尖的转化率大概能达到 7% 到 10%,但平均水平可能也就是 1.5% 到 2%。这意味着你 85% 到 90% 的营销费用都被白白浪费了。
但现在如果系统变得非常聪明,拥有了记忆和上下文,并且在哈里想要买东西时能更精准地定位到他,那么你的转化率就会上升,对吧?
如果你看从你决定买东西到最后拿到产品的整个价值链,拿今天的消费品来说,我认为消费品的真实生产成本可能只占总标价的 5% 到 8%,剩下的 92% 全是分销和营销成本。这是极度低效的。所以你可以想象一个世界,AI 让营销变得极其高效,更多传统营销的资金将通过“交易”的形式涌入线上世界。
为什么现在 Token 价格还没下降?
主持人:如果 token 注定会变便宜,那为什么我们现在还没看到前沿模型降价呢?我们之前都以为这会越来越便宜,那也会越来越便宜。
Nikesh:好吧,因为现在这些前沿模型公司发现自己正在进行“价值最大化”,他们正在以一万亿美元的估值进行融资。
图片
但在某个时间点,他们会意识到:“天哪,下一个100亿美元的算力资金从哪里来?金融市场不可能在一万亿或一万五千亿美元的估值上,每年都为我承担另外100亿美元的成本,因为我第二年还要用这笔钱。”所以你会说:“好吧,我需要建立一个可持续的商业模式,开始展示一定程度的毛利和盈利能力。”而他们手中唯一的杠杆,就是从经济角度出发,对自己产品组合中增长最快的东西收取更高的费用。这就是现在 token 价格高的原因。
我认为现在的 token 价格很高。你可以想象,正因为价格高,每一位技术专家现在都在琢磨未来如何让我的算力变得更高效,对吧?所以我敢肯定,我们将看到科技界出现一整波新突破,从模型的角度来看,内存和算力将开始被更高效地利用。而且我依然相信,人们今天用 AI 做的 90% 的事情,根本不需要用到什么 Fable 5 或者是 Mythos 5 这种最先进的模型。
主持人:好吧,我认为从能力上来说,模型的发展严重过剩了,特别是面对消费者和大多数企业的需求时。比如,两年前的模型已经足够应付我们理解的大多数查询了。
Nikesh:问题在于,从算力的角度来看,两年前的模型效率太低了。所以你现在看到效率在不断提升。但问题是,现在的研发成本等于要靠token的收费来买单。所以我觉得 token 价格最终会降下来。
我认为在未来的10年里,我们需要的算力规模依然是巨大的。前沿 AI 模型完全有能力捕获未来 AI 应用中所产生的巨大经济价值。
AI 基础设施仍是印钞机,但未来可能会出现消化期
主持人:作为一名风险投资人,我可以非常坦率地和你说,每个人现在基本上都在审视这整个技术栈,因为我只是说出了每位风投人的心声。我们都在看着它,心想:“我完全不知道价值最终会积聚在哪个环节。”你基本上看到了底层基础设施,然后中间是模型,再往下是应用。
Nikesh:老实说,基础设施现在非常赚钱。基础设施现在比以往任何时候都要贵。正是由于算力的稀缺以及对速度的追求,你才能在基础设施领域看到万亿美元市值的公司。
图片
主持人:你认为我们正处于人们所说的基础设施泡沫中吗?
Nikesh:这个问题我不知道答案,或许你可以告诉我。问题在于,物理学的极限会在什么时候发生作用?也就是说,在我们无法像预期的那样快速生产算力的同时,基础设施厂商们却在为超大规模的产能和需求做准备。然后你会遇到一个瓶颈:你知道吗,我们能建立的数据中心就这么多,我们拥有的能源也就这么多。
主持人:Panthalassa 公司甚至开始在海上建立数据中心了,马斯克也在太空中搞建设。
Nikesh:所以,我认为在某个时间点可能会有一个消化期。当我们认为对算力的需求就在那里时,执行的能力却受到了物理学极限的限制,而基础设施玩家们针对这一需求已经建立了过剩的产能。我不知道这种情况什么时候会走向合理化,也许它合理化之后,会迫使我们重新思考投放这些算力的时间周期。
但这并没有削弱对算力的核心需求。我们仍然会希望以最快的速度交付尽可能多的算力。我认为有些模型公司的实力已经超越了其他任何人,其他公司很难在训练中以这种速度、这种规模去构建前沿 AI 模型了。所以我想你现在大概能看到未来谁能留在前沿模型的牌桌上了。
接下来的问题变成了经济层面的:正如你所说,价值究竟是向模型层积聚,还是向应用层积聚?我认为“应用层”可能是一个过于简单的词,因为应用第一次拥有了“记忆”,应用开始能够理解上下文了。它们能非常具体地理解你想要什么、我想要什么。你在消费者端已经能看到这一点了,有趣的是,这还没怎么进入企业端。我认为这未来会在企业端显现,这意味着企业端对算力和内存的需求将会激增。
我自己还没用过所有的编程模型,但随着时间的推移,这些编程模型必须变得非常聪明,能够理解企业和个人的个体上下文。只有这样,它们才会更有效率、更有成效。为了实现这一点,我们仍然需要更多的算力和更多的内存。所以,我认为这将开始定义价值积聚在哪里 。价值将由前沿模型与企业应用中所创造的“上下文”共同分享。
我认为前沿模型公司完全明白这就是差距所在。如果我能预测未来的话,我推测前沿 AI 公司在未来一两年内会花更多的时间去围绕“消耗”来构建记忆。
未来前沿模型护城河是“记忆”与“上下文”
主持人:围绕消耗构建记忆。你这是什么意思?是指扩大上下文窗口吗?
Nikesh:不仅如此,如果你观察你和自己最喜欢的前沿模型之间的日常互动,它现在已经开始记住了,比如:“噢,你昨天问过这个,前天问过那个。”那么,它面对你刚刚提出的新问题时,究竟是应该结合它对你所有的了解来回答,还是应该假装对你一无所知、把答案限制在字面意思上?
要知道,记住你过去30天、60天或90天对它说过的话,需要存储大量的信息,需要进行大量的个性化互动。在未来,如果前沿模型想要保持它在你、在哈里和Nikesh面前的“护城河”,它对我的上下文了解得越多,以后回答我的问题就会越轻松。一旦开始针对每一个独立用户建立起这样的上下文,就会产生用户粘性,而这就会变成公司的护城河。
图片
Mythos 最终会成为网络安全的催化剂
主持人:在多大程度上,Mythos 会蚕食你们的业务?又在多大程度上,它会成就你们的业务?
Nikesh:我认为 Mythos 最终会成为网络安全的催化剂。我觉得当 Mythos 问世时,它向世界证明了一件事:我们过去一直在用大量最优秀的优质代码来训练这些模型,但模型转过头来就会说:“好吧,其实我也知道怎么找出漏洞代码。”正如我们之前讨论过的,这里的挑战在于,它也会受到误报率的困扰。
从防御者的角度来看,这还不够好。因为我不能直接用这个模型对它说:“去把我发现的每个漏洞都写个补丁,然后把我的系统全打上补丁来保护我。”因为它写出来的补丁里,会有 30% 针对的是根本没出错的地方。谁知道那些错误的补丁会不会直接把你的整个基础设施给引爆了。
所以当 Mythos 出现时,我们对其进行了审视,给予了充分的重视,并用它来跑了我们自己的代码。我们发现它找出坏东西的速度比人类快得多,我们用它在 6 周内找到的漏洞,如果靠人工可能需要花上 5 到 6 年。
那么,这意味着什么?这意味着每一家企业最好都加快修复自家系统的速度。因为如果我把下一代模型对准你的基础设施,它就会轻易找出安全漏洞、安全隐患、配置错误,以及那些你平时根本没有注意到的死角。因此,这会在客户中创造出一种提升自身网络安全态势的紧迫感。我认为,这对于网络安全公司来说总体上是件好事。
主持人:这从根本上说并不全是坏事。如果把刚才的话总结一下,它相当于给坏人提供了寻找漏洞的武器,但它自身在提供解决方案上还不够完美。
Nikesh:解决方案是有的,现在的挑战在于,有时如何能引起客户的重视和聚焦,让他们意识到:“听着,我必须去修复我的系统,因为这至关重要。”
而这套模型所做到的,是给全球的安全从业人员点了一把火,让他们意识到:“这玩意可不是开玩笑的,它会武装那些不法分子,我最好现在就确保我的防御措施全部到位。”
请记住,网络防御的本质其实就是两件最基本的事:第一,如果它是坏的,而我正守在大门口,我就会拦住它。这意味着你必须有人在门口守着。我们现在在世界上拥有 1.5 亿个传感器,就像站在大门口一样保护着我们的客户。所以,如果我能找到一种方法,在大门口注入 AI,并把所有这些漏洞转化为保护你的壁垒,那我就成功了。我不需要更换看门人,因为外面并没有什么 Claude Agent,也没有什么 OpenAI Agent 能直接把 Palo Alto 或者这个领域的其他同行给替代掉。
问题往往不发生在大门口。实际情况是,不管你建立了多么完美的周界防御,总会有东西漏进来、渗透进来,或者由于员工犯错、密码泄露,黑客通过某些漏洞潜入了进来。紧接着问题就变成了:“糟糕,黑客已经进入了我的内部基础设施。我能多快找到他(或她)并把他赶出去?”
这就变成了一项纯粹的 AI 任务。这又回到了我们刚才一直在聊的同一个话题:我需要上下文,我需要智能,我需要知道这意味着什么。所以,在企业内部针对这种入侵行为创造出上下文和智能,并搞清楚如何防御它,就成了一个核心挑战。
这就是 AI 网络安全挑战。这也是我们花了 5 年时间,试图在企业内部建立起来的能力。所以总的来说,它最终成了一个催化剂。这是否意味着我已经拥有了所需的一切?并不是。这是否意味着我需要让 AI 模型开始协助我?是的。所以我们将把更多的 AI 注入到我们的防御基础设施中。
模型越狱是个简单的技术问题:把护栏当成一个真正的难题去面对
主持人:当现在面对像我们拥有的这样强大的模型时,你认为政府介入并进行干预是好事还是坏事?
Nikesh:我认为我们正在经历一个“探索和发现”的过程。我觉得所谓的“护栏”概念现在构建得还不够坚固,因为这些模型似乎很容易就被绕过去了。
还记得早期你经常读到这样的新闻:有人和模型聊天,换了种问法,就找到了绕过护栏的方法,模型轻易就被“越狱”了。这甚至成了大众的一个业余嗜好,大家喜欢和模型进行各种奇奇怪怪的对话。现在面临的是同样的挑战:你如何确保在你构建的 AI 模型周围设下足够的护栏,以确保它只被用于你预期的目的?这就是目前的挑战所在。
我认为护栏需要变得更好。在某种程度上,政府觉得护栏不够坚固,并试图告诉我们这是一个国家安全问题,需要去修复这些护栏。但我认为,这其实就是一个简单的技术问题,把护栏当成一个真正的难题去面对并解决它。
图片
AI 融入公司要采取特斯拉的方式,传统车企只是在进行“AI洗白”
主持人:如果让你在今天这个 AI 时代重新创立一家网络安全公司,从今天开始,你会做哪些现在没有在做的、不一样的调整?
Nikesh:如果参照自动驾驶的发展,我脑子里会有那种深刻的焦虑和危机感。大体上看,自动驾驶目前有两到三种截然不同的路径,对吧?
第一种路径是:“我的车里绝对不会坐着一个人类司机。”这就是 Waymo,对吧?我要不断地打磨它,不断地训练它,直到它自己学会开车,而且当我的客户坐在里面时,任何时候都不应该有人去触碰方向盘。你看,它现在已经跑在路上了。很多城市都有了,就在这条街的下边我就看到了一辆。
所以这是一种做产品开发的方式。你所做的是让每一个极端情况都被发掘出来,然后围绕它建立训练。每一次经历都是一次学习的机会,你围绕它建立训练,直到达到完全自主的境地。
另一种版本是,我开始截取驾驶中的某些片段,并在我感到非常舒适的片段里实现自动化。这样我的车有 50% 的时间在自驾,剩下的 50% 由人类在遇到极端情况时接管。这就是我的特斯拉,对吧?特斯拉以前只帮我开高速公路,现在它在其他街道上也开得越来越好了。它在慢慢变好,但我依然经常需要紧握方向盘。它会提醒我“你没有专心”,否则你就不被允许继续开。我知道 FSD(完全自动驾驶)会变得更好,但这毕竟是达到目标的另一种方式,对吧?也就是:“行,我会继续训练。我会修复这个。随着我业务的不断演进,我会开始解决那些极端情况。”
第三种是,我会在车里注入一定程度的自动驾驶功能,但我本身来自传统模式,拥有出色的跑车、强劲的 V8 发动机以及美丽流畅的车型,而我对技术层面的东西并不感冒。你在街上能看到这类车,现在市面上这三种版本都存在。
我目前的看法是:如果你是一家正在构建 AI 融入能力的企业,你必须采取特斯拉的方式,但你绝不能采取传统汽车制造商的方式,他们只是试图塞进一点点 AI,进行某种“AI 洗白”,然后说我最终会实现目标的。
备注:这里的“AI洗白”指企业不触动底层核心架构,只在边缘业务上塞一点 AI 进去,以此假装完成了智能化重构。
图片
FDE是“产品还没有完全成熟”的代名词,但短期内我们还需要它
主持人:你如何有效地切入并把落地和采用做扎实?之前有嘉宾在我的节目里说过:“在今天,没有FDE(前线部署工程师),你根本无法完成企业端的 AI 采用。”但后来 Factory 公司的 Matan 也上过节目,他却说:“如果你需要靠 FDE 才能把产品卖出去,说明你的产品做得很烂。”
随后 Palantir 的 Cheyenne 也加入了论战。那么,真相和对的事情到底是什么?要卖软件给大企业,真的必须配 FDE 吗?
Nikesh:我认为事实是,我们追逐企业 AI 的梦想充其量也才过去大概12个月。如果你想想每周发生的事情,就会发现不断有我们无法完全理解和掌握的新事物涌现出来。
我们先前都还在忙于弄清楚大语言模型,以及作为企业该如何用它来做聊天机器人和客户沟通,突然之间,“智能体”就蹦出来了。大家心想:“天哪,我得搞清楚智能体怎么在公司内部开始工作。”智能体能做很多事情。我敢说,即使你举办一场智能体大会,让台上的每个人都来定义一下什么是智能体,你离场时依然会一头雾水地想:“我不太确定他的智能体或她的智能体,跟上一个人说的到底是不是同一个东西。”
因为 AI 演进得太快了,我认为产品本身在目前还没有完全成型。在应用层,企业级的产品并没有完整地存在,因为我们还没有接受过大企业实际需求的真正检验。
所以,“FDE”在当下其实是“产品还没有完全成熟”的一种代名词。因为产品正在随着技术的演进同步演进。这意味着:我派几个人去你的办公室坐着,根据你的需求一边调整一边构建我的产品。所以把我的产品工程师或开发人员直接派驻到你的公司里。如果方法得当,他们会现场帮你构建产品。
图片
当然,FDE 也有不同的版本。有的人只是试图引导你去消耗 AI,这其实不叫 FDE,那只是在协助产品采用的技术销售顾问。而在另一方面,真正的 FDE 是能够把客户那边的代码带回来、反馈到你们核心产品中的人。他们会说:“听着,我在客户现场写了这个功能,因为他们有这个需求,而我们应该把这个融入到我们的标准产品中,因为所有人都会需要它。”这才是我想象中的 FDE。
因此,我认为在短期内是需要 FDE 的,因为所有企业级 AI 初创公司现在都渴望盈利。出于某种原因,市场上制造了这样一种观念:“别担心,只管继续卖就对了。”围绕 AI 应用存在着巨大的、被压抑的需求,在产品完全准备好之前就把它卖出去。
主持人:你觉得这是对的吗?
Nikesh:我认为事实就是如此。而且我认为,随着未来12到24个月的演进,人们会从一套产品转向另一套产品,因为会有更好的产品涌现出来。
看看关于编程的讨论,在过去的24个月里你听说过多少家 AI 编程公司?我想早期有 Windsurf,有 Devin(现在属于 Cognition)。这些是编程领域的早期玩家,但它们现在已经不是当时的形态了。现在你有了 Codex、Claude 以及 Anti-gravity。有了 Factory 公司在做 SDLC(软件开发生命周期),有 Cognition 公司也在做 SDLC。
所以你可以看到,随着市场的演进,那些专注于编程价值链不同环节的人正在逐步成型。随着时间的推移,产品变得越来越有规模,而谁知道两三年后这个领域的领头羊会是谁呢?因为产品在刚开始的时候都是不完美的。
数据分析的世界已经开始被重塑了
主持人:今天很多 SaaS 供应商就正在感受到这种被淘汰的危机,他们的股价也在如实地告诉他们这一点。你认为大多数 SaaS 厂商是被市场过度抛售了,还是说这准确地反映了市场的走向?
Nikesh:我认为市场正在告诉我们,“工作系统”或“记录系统”将迎来工作流的重新构想。正如你我刚才聊到的,我们要从“没有观点”的软件走向“拥有观点并表达观点”的软件。
同时,它还会帮人类分担大量的工作,让人们不用再去重复繁琐的任务。我认为这类真正的 AI 应用现在还没有被完全创造出来。现在的 SaaS 版本依然存在,我们每天也都在用。但我认为在未来的某个时间点,我们会看到 AI 应用接管大量的任务,工作流将被彻底重新构想。
我确实认为很多 SaaS 厂商在工作系统和记录系统之上,已经建立了非常强大的分析能力。但现在,把这些数据直接抽离到一个大型数据湖中,然后让大语言模型为你分析数据并给出答案,正变得容易得多。
所以,我认为数据分析的世界已经开始被重塑了。你可以看到像 Snowflake、Glean 或 Databricks 这样的公司,他们都在兜售企业数据湖,你可以把数据引进去,用大语言模型去跑,从而拿到比以前更具综合性、更有针对性的分析和结果。
我认为我们最开始讨论的第三个问题也和这有关,人们现在无法确定未来这些企业里还会有多少人在工作。因此,如果你把“SaaS 世界里到底能剩下多少个席位”的困惑,并且工作系统将被重新构想”。
主持人:在此我还是要声明一下:你是一位管理着无数人资金的成功投资人,这是事实,但我得声明我只是个主播。我能理解席位减少的问题,也能理解工作流的变化。你能帮我通俗地解释一下“数据分析”这一块吗?
Nikesh:好吧,如果你看看过去几年的大多数 SaaS 软件,一旦它在一家公司完全部署完毕,就会有人说:“听着,我在我的 HR 系统里拥有关于你所有员工的各种很酷的数据,我可以帮你对这个 HR 系统进行更深入的洞察。”或者拿 Salesforce 来说,他们有一个包含 300 多个应用的软件市场供你使用,这些全是基于你自己的记录系统和市场数据进行训练的分析类应用,来帮你分析那些数据。
10亿美元收购退出已经不够看了!未来10到25年里还会诞生市值数百亿美元的公司
主持人:“平台化”会不会抹杀掉风险投资所追求的那种规模化回报?这是我认为大多数创始人目前仍未完全看透的趋势。这听起来可能有点残酷,如今10亿美元的退出已经不顶用了,它必须是100亿,必须是200亿、300亿。
Nikesh:我不会去和创新唱反调。我认为网络安全领域依然会存在风险投资级别的暴利回报,因为我们是世界上最具创新性的行业。坏人永远在寻找新的入侵路径。他们可不会说:“噢,我两年前用过这个漏洞,我们再试一次吧,说不定有人还没针对它部署补丁呢。”当然,那个漏洞我们早就修好了。你得去找新的攻击方法。
所以这个行业高度创新,不断有新的攻击向量出现,大家都在外面追逐和防御它们。我不可能自己把所有的东西都盖出来。别人会做得很棒,有时他们还会围绕这些好东西建立一个平台,这完全没问题。
你要记住,我们是从一个完全不同的起点走过来的。当我刚进 Palo Alto 时,我们在整个网络安全总营收中的市场份额还不到2%。而现在,我们正逼近8%或9%,对吧?从8%或9%到20%、30%或40%之间,依然有巨大的成长空间。这意味着市场上还有60%的市值蛋糕等着不同公司去享受,而且这些不可能全落入现有的玩家手中。未来10到25年里,绝对还有空间诞生出市值数百亿美元的新公司。
图片
主持人:这真是一个巨大得惊人的市场,不是吗?
Nikesh:你想想看,现在的标普500指数中,科技股占了多大的比例?和20年前相比呢?今年以来的涨幅高达86%左右。在整个标普500的总市值中,科技股占了百分之多少?20年前又是多少?20年后又会变成多少?以前很少,以后会更多。
Nikesh:所以整个科技领域,比如你未来把营销技术叫做营销开支还是科技开支?把人力资源技术叫做人力资源开支还是科技开支?或者说,那些用来替代人类日常任务的token开支,最终全都会变成科技开支。
开源是一件好事
主持人:你刚才提到了一个词,“坏人”。在许多人眼里,中国就是这个角色。你认为中国开源模型的野蛮生长是一件令人担忧的事,还是说它只是一个蓬勃发展的生态系统中不可避免的特征?
Nikesh:让我们先做一个实验。把“中国”这个词先拿掉一秒钟,然后再来回答这个问题。
主持人:我不认为开源模型有什么危险。
Nikesh:所以它从哪里来,真的重要吗?
主持人:重要。
Nikesh:所以你担心的不是开源模型本身,你担心的是中国的开源模型。某家大型科技巨头也推出开源模型有一阵子了,对吧?所以观察开源模型很有意思。我认为未来的关键问题在于,我们是否会走向“因地制宜、各司其职”的局面?我们是否最终会拥有大量非常针对特定任务且在某些任务中表现极佳的模型,而不再需要凡事都去动用那种超大型的前沿大模型?
整个世界将变成一个由分化模型割据的世界
Nikesh:你现在已经在 ElevenLabs 以及市面上的语音模型身上看到这种苗头了。它们专注于特定的任务,而且它们在处理该任务时的表现,可能比通用前沿模型做得还要好。所以,如果你相信这个世界最终会分化为许多专有任务模型,那么这些模型在垂直领域的深度训练上会更胜一筹。
例如,“物理AI”就会发生这种情况。我认为物理AI不会像通用前沿模型那么简单,因为物理AI没有消费级的通用场景,它纯粹是一个深度垂直的赛道。现在的悬念在于:帮你开飞机的物理AI模型,跟帮你开汽车的物理AI模型会是同一个吗?大概率是。但它跟帮你做机器人制造的物理AI模型会是同一个吗?可能就不是了。
所以你会看到这些模型向深度垂直发展,整个世界将变成一个由分化模型割据的世界。正如我们聊过的,这里需要有某种“编排层”,而你现在也正忙着寻找那些能够允许用户针对正确任务挑选最合适模型的编排层公司。这些编排层必须变得越来越聪明,它们必须理解上下文,必须理解记忆。
所以问题变成了:我到底是把我的记忆和上下文存储在编排层,还是存储在前沿模型中?你认为会是哪一个?
顶级模型公司正把“记忆”和“上下文”融入模型,但用户可能要买两次单
主持人:你觉得会是哪一个?
Nikesh:我认为目前的挑战在于,前沿模型公司深知这个问题,所以他们正积极地把“记忆”和“上下文”融入到自己的模型中,因为他们明白这就是护城河。而挑战在于,你可能需要为此买两次单。如果你说:“不,我不想用你的记忆和上下文。”那么如果你用一个编排层,模型可能就无法发挥作用。
如今的编排层在资金实力上远不如这些大模型公司。这带来的风险是,你最终会陷入一种架构中,模型掌握了大量的上下文,导致你根本无法做到“模型中立”。实际上,为了让你想做的事情达到最大的效能和价值,你不得不成为某个特定模型的“俘虏”。对吧?
这不像是你有得选。你要么对这个模型“梭哈”,要么就完全用不了。你用另一个模型是做不出这一个的效果的。而如果你非要用另一个,你就必须重新设计你的整个应用程序,让它与第二个模型的底层能力进行深度嵌入。
所以,在这个模型分化、各司其职的世界里,我认为开源是一件好事,因为它允许你玩转成本曲线。我不需要动用最聪明的模型去帮我做最微不足道的事。
图片
所以开源是件好事,不管它来自哪个国家。但接下来的问题变成了:你担心这些开源模型里会有什么样的“后门”?你对这一点的担忧适用于任何主权国家,对吧?如果它是一个由国家背景资助的开源模型,那它会藏有什么后门?我能渗透进去吗?这个模型会不会在某天早上醒来,突然激活了体内的“潜伏特工”,开始把所有数据往别的地方传输?这些都是现实问题,但这些都是可以被防护的。
害怕错过下一个Anthropic,硅谷弥漫着过度狂热
主持人:今天在硅谷,大多数顶尖投资人和创始人普遍信奉、但你却认为完全错误的一个观点是什么?
Nikesh:我目前的担忧是,鉴于技术演进的疯狂速度,以及关于“什么能成、什么成不了”的巨大不确定性,市场上可能弥漫着过度的狂热和一些盲目跟风的恐惧错过情绪。大家总在焦虑:“天哪,如果我没有投资某个看起来很有意思的项目,或者没投进那个风头正劲的创始人,我就会被时代抛弃。”
因为大家都亲眼目睹过这样的先例。看看 Anthropic 的发展吧,对吧?如果你错过了他们的第一轮、第二轮、第三轮、第四轮、第五轮融资,你看起来就像是一个手里没钱的边缘人。要知道,你过去有整整20年的时间去投资 SpaceX,但你只有区区3年的时间去投 Anthropic。这种时代节奏是截然不同的。
我相信,有多少人因为 SpaceX 终于上市而感到高兴,可能就有同样多的人在暗自叹息:“两年前 Anthropic 主动找上门来的时候,我真应该把那一轮给投了。”所以,我认为现在是狂热与强烈的恐惧错过情绪并存。而这带来的风险是,我们误以为现在冒出来的每一家公司都会成为下一个 Anthropic,从而按捺不住必须硬挤进去。
主持人:Nikesh,我真的太感谢你愿意再次抽空来录制我们的第二期节目了。
参考链接:https://youtu.be/v4GN1q7HX1Y?si=AQ38SjpPv7EC9AZG
文章来自:51CTO
