
AI智能体很强大,直到它们崩溃,丢失所有学到的东西,你需要一个可靠的存储方案,防止它们的数据凭空消失。
OpenClaw最近在短短60天内GitHub star数突破了25万,超越了React保持了十年之久的纪录,成为GitHub历史上star数最多的软件项目。在GTC 2026上,英伟达CEO黄仁勋在主题演讲中称其为”个人AI的操作系统”,并说道:”对于各位CEO来说,问题是——你的OpenClaw战略是什么?”
我当时正在GTC上参加英伟达的Hack for Impact黑客马拉松,与工程师们并肩作战,他们正在使用NemoClaw、OpenClaw和Nemotron来解决真实世界的问题。有一个团队构建了一个野火检测系统,实时接入NASA的卫星数据,另一个团队分析了各警区的犯罪模式,还有一个团队对能源电网中的异常进行了预测。
每个项目都令人印象深刻,但看着他们,我一直在想:黑客马拉松结束后的第二天会发生什么?那些数据都去哪儿了?
自主AI智能体会持续不断地产生输出——报告、分析、告警、处理过的视频、音频和图像。在数周的运行中,它们不断积累记忆、对话历史和技能,它们做出的每一个决策都会生成审计追踪和合规元数据,所有这些数据增长得非常快。
如果没有一个有意识的策略来存储、版本化和调用这些数据,它们就会变成暗数据——也就是已经生成但无法访问、没有版本控制、对组织其他部分完全不可见的数据。在黑客马拉松上,暗数据是可以接受的取舍,但在生产环境中,它是一个隐患。
NemoClaw与暗数据缺口
NemoClaw在OpenClaw的基础上增加了一层名为OpenShell的安全层——一个在内核级别对每个智能体进行沙箱隔离的运行时。网络请求、文件访问和推理调用全部由声明式策略管控,并在智能体自身进程之外强制执行,因此智能体永远无法覆盖自己的规则,这是运行时治理方面的一次有意义的进步,也是NemoClaw在企业部署中获得关注的原因之一。
但运行时治理和保持数据可访问是两个不同的问题,而NemoClaw只解决了前者。
在NemoClaw内部,每个OpenClaw智能体都维护着定义其个性、偏好和行为上下文的工作区文件,这些文件存储在嵌入式Kubernetes集群中的专用卷内,它是受管控的、隔离的,但并不持久,事实上,开发者社区已经在NemoClaw的GitHub仓库上呼吁提供更好的备份和恢复工作流了。
这就是暗数据问题浮现的地方。
智能体在沙箱内部创建的任何文件都是临时的,当智能体停止运行时,它们就消失了。智能体在数周运行中积累的记忆和上下文,可能因为容器崩溃、迁移失败或一次常规的基础设施变更而被彻底抹去。如果运行时之下没有什么东西来接住这一切,那么你的智能体产生的所有东西都面临消失的风险。
解决这个问题不仅仅是一个存储问题,更是一个架构问题。据我所见,每一个进入生产环境的智能体系统都需要保证三件事:数据持久化、可解释性,以及出问题时可恢复。
持久化:别丢了
最直接的风险也是最显而易见的,智能体持续不断地生成输出,但在沙箱化的运行时中,这些产物只在创建它们的进程存活期间才存在,智能体一停,数据就随之而去。
智能体状态也是如此,记忆、会话历史和积累的上下文,是让智能体随时间推移而变得有价值的关键,但当这些东西存在于易失性卷中时,它们天生就是脆弱的。一次重新部署、一次失败的迁移或一次常规的基础设施变更,就可能抹去数周积累的知识。没有持久化,智能体的价值就无法复合增长,它们只会重置。
可追溯性:能解释
即使数据持久化了,第二个问题也会浮现:你无法解释它。一个智能体生成了一份报告,但如果没有任何关于它是如何生成的记录,你就无法验证或信任它。你不知道是哪个模型生成的,用了什么输入,什么策略管控了它的行为,或者它一路上用了什么工具。此时数据虽然存在,但不可用。
可追溯性通过在产物创建的那一刻捕获元数据,并将其与输出一起存储来解决这个问题:哪个智能体生成的、用了哪个模型和配置、接收了什么输入和上下文、什么策略塑造了结果,这让输出变成了记录。对于在SOC 2、HIPAA或GDPR框架下运营的企业来说,这些记录同时也是合规要求。
可恢复性:能信赖
第三个问题只有在出故障时才会显现,系统会失败,容器会崩溃,数据管道会出错。当这些情况发生时,仅仅把数据存在某个地方是不够的,你还得能把它拿回来。
智能体状态在这方面尤其敏感,智能体在你的系统、客户和工作流中建立的上下文,是不容易重建的。丢失它,就意味着丢失了智能体自部署以来一直在积累的运营价值。一个无法恢复数据的系统,无论在一切正常时表现多好,都不值得信赖。
持久化云存储层能为你的智能体做什么
在实践中,团队通过在运行时之下引入一个持久化存储层来解决这个问题。
关于持久化:它在产物和状态创建的那一刻就将其移出沙箱。你的智能体产生的所有东西在它们停止运行后依然可访问,可通过URL获取,并能在不同工具和工作流之间迁移。产物独立于运行时持久存在,因此能经受住故障、重新部署和基础设施变更。
关于可追溯性:它在创建时捕获元数据,并将其与每个产物一同存储,让每一个输出从存在的那一刻起就可被解释。当你上传一个产物时,你同时附上了创建时的元数据:哪个智能体生成的、用了哪个模型、接收了什么输入、受什么策略管控,这些元数据与文件永久绑定。例如,在GTC上,我们的FireWatch项目就是这样做的。野火风险报告被上传并生成了可分享的URL,这些链接被直接嵌入到利益相关方的告警邮件中,每一个输出从创建那一刻起就可追溯。
关于可恢复性:它提供自动化备份——对智能体配置、记忆和会话进行加密快照,以只追加的不可变方式保留,用于审计追踪,并配合生命周期策略实现长期留存。恢复工作流确保智能体状态和输出能被快速、可靠地恢复。那些本会因容器崩溃或迁移失败而被抹去的智能体状态得以存活,并且可以被恢复。
超越运行时治理
NemoClaw为智能体ic技术栈带来了治理能力,这是必要的第一步,但如果你的智能体产生的所有东西一离开沙箱就变成暗数据,那么运行时层面的治理也只能走到这一步。
持久化云存储层才是填补这一缺口的关键,你增加的每一个智能体、它们运行的每一周、它们处理的每一种模态,都会产生更多需要持久化、可解释和可恢复的数据。如果运行时之下没有一个有意识的存储架构,这些数据默认就会变成暗数据。
当前正在将自主智能体投入生产的团队,无论他们是否意识到,都在做这些架构决策。那些尽早做对了持久化、可追溯性和可恢复性的团队,他们的智能体会随时间推移而价值复合增长,而那些没做对的团队,则会发现自己不得不反复重建上下文、重构审计追踪,并向合规团队解释为什么数据不见了。
暗数据问题会悄然累积,直到变成某个人的紧急事件。从一开始就构建在持久化云存储层之上,才是确保它不会变成你的紧急事件的方法。
文章来自:51CTO
