图片
OpenAI致力于迭代部署最强大、最可靠的模型,用于真正的智能体和编码工作——这些模型能够高效思考、快速迭代并处理复杂任务,同时让开发者保持流畅的工作状态。

2025年11月13日,OpenAI正式在API平台发布GPT-5.1。

这是GPT-5系列的最新模型,在智能性和速度之间实现了完美平衡,专为广泛的智能体和编码任务而设计。

GPT-5.1最大的突破在于能够根据任务复杂度动态调整思考时间,让模型在处理简单日常任务时显著更快、更节省token,同时保持GPT-5.1的前沿智能水平。

自适应推理:智能与速度的完美平衡

GPT-5.1的核心创新在于其自适应推理能力。

对于简单直接的任务,GPT-5.1会减少思考token的使用,从而实现更快的响应速度和更低的使用成本;而对于需要深度思考的复杂任务,GPT-5.1会保持持久性,探索多种选项并检查自己的工作,以最大化可靠性。

实际测试数据令人印象深刻。

GPT-5.1 在完整动态评估套件中表现优于GPT-4.1和GPT-5,同时运行速度比GPT-5快2-3倍。

更重要的是,在工具密集型推理任务中,GPT-5.1在相似或更好的质量下,使用的token数量约为领先竞争对手的一半”。

图片

具体来看,GPT-5.1在任务难度分布上的表现更加动态。

在ChatGPT任务的代表性分布中,GPT-5.1在简单任务上明显更快,即使在高推理强度下也是如此。

例如,当被问及”显示列出全局安装包的npm命令”时,GPT-5.1只需2秒就能回答,而GPT-5需要10秒。

图片

全新”无推理”模式:极速响应新选择

开发者现在可以通过将reasoning_effort设置为’none’来使用GPT-5.1的无推理模式。

这使得模型在延迟敏感的使用场景中表现得像非推理模型,同时保持GPT-5.1的高智能水平和强大的工具调用性能。

与GPT-5相比,无推理模式的GPT-5.1在并行工具调用(这本身就能提高端到端任务完成速度)、编码任务、指令遵循和使用搜索工具方面表现更好,并且支持API平台中的网络搜索功能。

Sierra公司分享的数据显示,GPT-5.1在”无推理”模式下的低延迟工具调用性能相比GPT-5最小推理模式提升了20%。

GPT-5.1默认设置为’none’,这对于延迟敏感的工作负载来说是理想选择。OpenAI建议开发者为更高复杂度的任务选择’low’或’medium’,当智能性和可靠性比速度更重要时选择’high’。

扩展提示缓存:24小时持久化

扩展缓存功能通过允许提示在缓存中保持活跃状态长达24小时,而不是目前支持的几分钟,从而提高了推理效率。

更长的保留窗口意味着更多的后续请求可以利用缓存的上下文,从而降低延迟、减少成本,并为长时间运行的交互(如多轮对话、编码会话或知识检索工作流)提供更流畅的性能。

提示缓存定价保持不变,缓存的输入token比未缓存的token便宜90%,缓存写入或存储不收取额外费用。

要在GPT-5.1中使用扩展缓存,只需在Responses或Chat Completions API上添加参数”prompt_cache_retentinotallow=’24h'”。

编码能力全面提升:更智能、更可控

GPT-5.1在GPT-5的编码能力基础上进一步优化,具有更强的编码可控性、更少的过度思考、更高的代码质量、更好的面向用户的更新消息(序言),以及更实用的前端设计——特别是在低推理强度下。

在简单的编码任务(如快速代码编辑)上,GPT-5.1的更快速度使得来回迭代变得更加容易。

重要的是,GPT-5.1在简单任务上的更快速度并不会降低在困难任务上的性能。在SWE-bench Verified基准测试中,GPT-5.1甚至比GPT-5工作更长时间,准确率达到76.3%。

图片

OpenAI与多家编码公司密切合作,获得了早期反馈:

• Augment Code表示GPT-5.1″更加谨慎,浪费的动作更少,推理更高效,任务聚焦更好”,他们看到了”更准确的更改、更流畅的拉取请求,以及跨多文件项目的更快迭代”。

• Cline分享说,在他们的评估中,”GPT-5.1在我们的差异编辑基准测试中达到了SOTA,提升了7%,在复杂编码任务中表现出卓越的可靠性”。

• CodeRabbit称GPT-5.1是其”PR审查的首选顶级模型”。

• Cognition表示GPT-5.1″在理解你的需求并与你合作完成任务方面明显更好”。

• Factory说”GPT-5.1提供了明显更快的响应,并根据任务调整其推理深度,减少了过度思考,改善了整体开发者体验”。

• Warp正在将GPT-5.1设为新用户的默认选项,称其”建立在GPT-5系列引入的令人印象深刻的智能提升基础上,同时是一个响应速度更快的模型”。

“GPT 5.1不仅仅是另一个LLM——它是真正的智能体,是我测试过的最自然自主的模型。它像你一样写作,像你一样编码,轻松遵循复杂指令,在前端任务中表现出色,完美融入你现有的代码库。你可以在Responses API中真正释放其全部潜力,我们很高兴在我们的IDE中提供它。”——Denis Shiryaev,JetBrains AI开发工具生态系统负责人

两大新工具:apply_patch和shell

GPT-5.1引入了两个新工具,帮助开发者在Responses API中充分利用模型:一个自由格式的apply_patch工具,使代码编辑更加可靠,无需JSON转义;以及一个shell工具,允许模型在本地机器上运行命令。

  • apply_patch工具让GPT-5.1使用结构化差异在代码库中创建、更新和删除文件。模型不是仅仅建议编辑,而是发出补丁操作,应用程序应用这些操作并报告结果,从而实现迭代的、多步骤的代码编辑工作流。
  • shell工具允许模型通过受控的命令行界面与本地计算机交互。模型提出shell命令;开发者的集成执行这些命令并返回输出。这创建了一个简单的计划-执行循环,让模型检查系统、运行实用程序并收集数据,直到能够完成任务。

定价与可用性

GPT-5.1和gpt-5.1-chat-latest现已向API所有付费层级的开发者开放。定价和速率限制与GPT-5相同。

OpenAI还发布了API中的gpt-5.1-codex和gpt-5.1-codex-mini。虽然GPT-5.1在大多数编码任务中表现出色,但gpt-5.1-codex模型针对Codex或类似Codex的框架中长时间运行的智能体编码任务进行了优化。

开发者可以开始使用GPT-5.1开发者文档和模型提示指南进行构建。OpenAI目前不计划在API中弃用GPT-5,如果决定这样做,将提前通知开发者。

未来展望

OpenAI致力于迭代部署最强大、最可靠的模型,用于真正的智能体和编码工作——这些模型能够高效思考、快速迭代并处理复杂任务,同时让开发者保持流畅的工作状态。

凭借自适应推理、更强的编码性能、更清晰的面向用户的更新以及apply_patch和shell等新工具,GPT-5.1旨在帮助开发者减少摩擦。OpenAI将继续大力投资:在未来几周和几个月内,你可以期待更强大的智能体和编码模型。

GPT-5.1的发布标志着AI开发工具进入了一个新阶段,它不仅更智能,更重要的是更实用、更高效。对于开发者而言,这意味着更快的开发速度、更低的成本和更好的开发体验。随着AI代理工作流的日益普及,GPT-5.1将成为构建下一代智能应用的重要基石。

文章来自:51CTO

 

Loading

作者 yinhua

发表回复