
AI技术的快速更迭正成为企业面临的一个日益严峻的问题,企业发现,为了应对不断演进的AI能力以及不断变化的AI战略,它们不得不持续重建自己的AI基础设施。
AI数据质量供应商Cleanlab的一项调查显示,70%的受监管企业和41%的非监管企业每三个月至少会更换部分AI技术栈,另有25%的受监管企业和非监管企业每六个月进行一次更新。
Cleanlab的CEO Curtis Northcutt表示,这项对1800多名软件工程领导者的调查凸显出,各企业在努力跟上不断变化的AI格局以及将智能体投入生产方面仍面临困难。
受访者中仅有5%已将智能体投入生产或计划近期投入生产,根据受访工程师对技术挑战的回答,Cleanlab估计,只有1%的受访企业已将智能体部署到试点阶段之外。
Northcutt说:“企业级智能体根本还未出现,远未达到人们所说的水平。实际上,有数百家初创企业试图向企业销售智能体的组件,但都失败了。”
演变速度之快
Northcutt称,尽管尚未完全投入生产,但许多企业每隔几个月就重建其智能体技术栈组件的事实,不仅表明了AI格局变化之快,也显示出对智能体成果缺乏信心。
他指出,智能体技术栈的变化范围很广,从更新底层AI模型的版本这种简单操作,到从闭源模型转向开源模型,或者更改存储智能体数据的数据库等。他补充说,在许多情况下,更换技术栈中的一个组件会引发下游一系列连锁变化。
Northcutt说:“当你转向一个在自己服务器上运行的开源模型时,整个基础设施都会发生变化,你得处理很多以前没遇到过的问题,然后你可能会发现,‘这实际上比我们预期的还要糟糕。’于是你又换回不同的模型,但接着你又转向了云服务,而云服务的API与OpenAI的API完全不同,因为它们没有达成一致。”
语音AI供应商Cozmo AI的联合创始人兼CTO Nuha Hashem表示,Cozmo AI也观察到了智能体技术栈频繁变化的模式。她说,Cleanlab的调查结果与Cozmo在受监管环境中看到的情况相符。
她补充说:“许多客户团队每季度都会更换技术栈的部分组件,因为早期的设置往往是一个拼凑的方案,在测试时表现一种方式,在生产时表现另一种方式。库或路由规则的一个小变化都可能改变智能体处理任务的方式,这就迫使再次重建。”
她表示,虽然AI的快速发展可能导致频繁重建,但问题部分也在于AI模型的调整方式。
Hashem解释说:“更深层次的问题是,许多智能体系统依赖于模型内部的行为,而不是明确的规则。当模型更新时,行为就会发生漂移。当团队为智能体设置明确的步骤和检查点时,技术栈就可以在不出现持续故障的情况下演变。”
信心不足
另一个问题似乎是对AI技术栈现有组件的满意度较低,Cleanlab的调查询问了用户对智能体基础设施中几个组件的使用体验,包括智能体编排、快速推理和可观测性。只有约三分之一的受访者表示对列出的五个组件中的任何一个感到满意,约40%的受访者表示正在为每个组件寻找替代方案。
仅有28%的受访者对现有的智能体安全和防护措施感到满意,这表明对智能体成果缺乏信任。
虽然Cleanlab的调查可能描绘了当前智能体状况的黯淡图景,但几位AI专家表示,其结论似乎准确。
基于AI的客户体验供应商Laivly的CEO Jeff Fettes对许多企业每隔几个月就重建部分智能体技术栈并不感到惊讶,他看到了类似的现象。
他说:“就AI而言,更成功的企业与不太成功的企业之间的区别在于它们的迭代能力。你看到的情况是,企业没有放弃旧的做事方式,它们真的很难跟上AI本身作为一项技术的快速发展速度。”
他表示,对于大多数其他主要的IT平台,CIO们会经历一个漫长的评估和部署过程,但AI的进步速度已经打乱了这一时间表。
Fettes说:“IT部门过去会进行大规模的规划,然后改造他们的技术栈,而且这能在一段时间内保持良好状态,而现在,他们发现,在规划过程进行到一半——或者一小半——的时候,技术已经发展到了他们不得不重新开始的地步。”
Fettes看到他的许多客户随着技术的发展而放弃AI试点项目。
他说:“这造成了一种局面,许多公司不得不放弃现有的用例,我们知道,我们的技术在很短的时间内就会过时。”
Fettes表示,除了技术发展迅速之外,AI市场提供了如此多的选择,以至于CIO们很难跟上。
他补充说:“已经有数百家新公司涌入这个领域,有很多东西不起作用,有时候很难弄清楚。”
原地不动的风险
应用开发公司Tapforce的联合创始人兼CTO Artur Balabanskyy表示,由于不断演变,Tapforce也看到企业每隔几个月就重建其AI技术栈。
他说:“现在有效的方案,以后可能会变得不够理想。如果企业不积极更新和刷新其技术栈,就有可能在性能、安全性和可靠性方面落后。”
然而,Balabanskyy补充说,持续重建不一定会造成混乱。他建议CIO对其智能体技术栈采取分层方法,包括强大的版本控制、持续监控和模块化部署方法。
他说:“模块化架构使领导者能够在必要时破坏整个技术栈的稳定性以及更换组件,防护措施、自动化测试和可观测性对于确保生产系统在技术演进过程中保持可靠至关重要。”
Cleanlab的Northcutt建议,IT领导者在部署前应经过一个严格的过程,包括详细描述智能体的预期功能。
他说:“人们会说,‘让AI来做客户支持吧’,这是一个非常高级的想法。首要的步骤是,‘让我们非常精确地定义AI的起点,我们期望的良好性能是什么样的?我们期望它完成什么?它实际上将使用什么工具?’”
Northcutt表示,调查结果表明,智能体的广泛部署可能仍需数年时间。他预测,2027年,已投入生产的智能体企业占比将从估计的1%上升到3%或4%,到2030年,真正投入生产的企业级智能体将达到30%。
他认为智能体将带来重大益处,但在此期间,他敦促倡导者减少夸张言辞。
他说:“我们现在可以利用AI更好地完成工作,但企业级AI自动化一切、每个产品都有智能体的整个想法,它正在到来。如果我们能保持冷静,设定合理的期望,那么所有这些投入的资金才可能真正发挥作用。”
文章来自:51CTO
