OpenAI GPT-5.1震撼发布，有哪些重要更新值得关注？ -

2025年11月13日，OpenAI正式在API平台发布GPT-5.1。

这是GPT-5系列的最新模型，在智能性和速度之间实现了完美平衡，专为广泛的智能体和编码任务而设计。

GPT-5.1最大的突破在于能够根据任务复杂度动态调整思考时间，让模型在处理简单日常任务时显著更快、更节省token，同时保持GPT-5.1的前沿智能水平。

自适应推理：智能与速度的完美平衡

GPT-5.1的核心创新在于其自适应推理能力。

对于简单直接的任务，GPT-5.1会减少思考token的使用，从而实现更快的响应速度和更低的使用成本；而对于需要深度思考的复杂任务，GPT-5.1会保持持久性，探索多种选项并检查自己的工作，以最大化可靠性。

实际测试数据令人印象深刻。

GPT-5.1 在完整动态评估套件中表现优于GPT-4.1和GPT-5，同时运行速度比GPT-5快2-3倍。

更重要的是，在工具密集型推理任务中，GPT-5.1在相似或更好的质量下，使用的token数量约为领先竞争对手的一半”。

具体来看，GPT-5.1在任务难度分布上的表现更加动态。

在ChatGPT任务的代表性分布中，GPT-5.1在简单任务上明显更快，即使在高推理强度下也是如此。

例如，当被问及”显示列出全局安装包的npm命令”时，GPT-5.1只需2秒就能回答，而GPT-5需要10秒。

全新”无推理”模式：极速响应新选择

开发者现在可以通过将reasoning_effort设置为’none’来使用GPT-5.1的无推理模式。

这使得模型在延迟敏感的使用场景中表现得像非推理模型，同时保持GPT-5.1的高智能水平和强大的工具调用性能。

与GPT-5相比，无推理模式的GPT-5.1在并行工具调用（这本身就能提高端到端任务完成速度）、编码任务、指令遵循和使用搜索工具方面表现更好，并且支持API平台中的网络搜索功能。

Sierra公司分享的数据显示，GPT-5.1在”无推理”模式下的低延迟工具调用性能相比GPT-5最小推理模式提升了20%。

GPT-5.1默认设置为’none’，这对于延迟敏感的工作负载来说是理想选择。OpenAI建议开发者为更高复杂度的任务选择’low’或’medium’，当智能性和可靠性比速度更重要时选择’high’。

扩展提示缓存：24小时持久化

扩展缓存功能通过允许提示在缓存中保持活跃状态长达24小时，而不是目前支持的几分钟，从而提高了推理效率。

更长的保留窗口意味着更多的后续请求可以利用缓存的上下文，从而降低延迟、减少成本，并为长时间运行的交互（如多轮对话、编码会话或知识检索工作流）提供更流畅的性能。

提示缓存定价保持不变，缓存的输入token比未缓存的token便宜90%，缓存写入或存储不收取额外费用。

要在GPT-5.1中使用扩展缓存，只需在Responses或Chat Completions API上添加参数”prompt_cache_retentinotallow=’24h'”。

编码能力全面提升：更智能、更可控

GPT-5.1在GPT-5的编码能力基础上进一步优化，具有更强的编码可控性、更少的过度思考、更高的代码质量、更好的面向用户的更新消息（序言），以及更实用的前端设计——特别是在低推理强度下。

在简单的编码任务（如快速代码编辑）上，GPT-5.1的更快速度使得来回迭代变得更加容易。

重要的是，GPT-5.1在简单任务上的更快速度并不会降低在困难任务上的性能。在SWE-bench Verified基准测试中，GPT-5.1甚至比GPT-5工作更长时间，准确率达到76.3%。

OpenAI与多家编码公司密切合作，获得了早期反馈：

• Augment Code表示GPT-5.1″更加谨慎，浪费的动作更少，推理更高效，任务聚焦更好”，他们看到了”更准确的更改、更流畅的拉取请求，以及跨多文件项目的更快迭代”。

• Cline分享说，在他们的评估中，”GPT-5.1在我们的差异编辑基准测试中达到了SOTA，提升了7%，在复杂编码任务中表现出卓越的可靠性”。

• CodeRabbit称GPT-5.1是其”PR审查的首选顶级模型”。

• Cognition表示GPT-5.1″在理解你的需求并与你合作完成任务方面明显更好”。

• Factory说”GPT-5.1提供了明显更快的响应，并根据任务调整其推理深度，减少了过度思考，改善了整体开发者体验”。

• Warp正在将GPT-5.1设为新用户的默认选项，称其”建立在GPT-5系列引入的令人印象深刻的智能提升基础上，同时是一个响应速度更快的模型”。

“GPT 5.1不仅仅是另一个LLM——它是真正的智能体，是我测试过的最自然自主的模型。它像你一样写作，像你一样编码，轻松遵循复杂指令，在前端任务中表现出色，完美融入你现有的代码库。你可以在Responses API中真正释放其全部潜力，我们很高兴在我们的IDE中提供它。”——Denis Shiryaev，JetBrains AI开发工具生态系统负责人

两大新工具：apply_patch和shell

GPT-5.1引入了两个新工具，帮助开发者在Responses API中充分利用模型：一个自由格式的apply_patch工具，使代码编辑更加可靠，无需JSON转义；以及一个shell工具，允许模型在本地机器上运行命令。

apply_patch工具让GPT-5.1使用结构化差异在代码库中创建、更新和删除文件。模型不是仅仅建议编辑，而是发出补丁操作，应用程序应用这些操作并报告结果，从而实现迭代的、多步骤的代码编辑工作流。
shell工具允许模型通过受控的命令行界面与本地计算机交互。模型提出shell命令；开发者的集成执行这些命令并返回输出。这创建了一个简单的计划-执行循环，让模型检查系统、运行实用程序并收集数据，直到能够完成任务。

定价与可用性

GPT-5.1和gpt-5.1-chat-latest现已向API所有付费层级的开发者开放。定价和速率限制与GPT-5相同。

OpenAI还发布了API中的gpt-5.1-codex和gpt-5.1-codex-mini。虽然GPT-5.1在大多数编码任务中表现出色，但gpt-5.1-codex模型针对Codex或类似Codex的框架中长时间运行的智能体编码任务进行了优化。

开发者可以开始使用GPT-5.1开发者文档和模型提示指南进行构建。OpenAI目前不计划在API中弃用GPT-5，如果决定这样做，将提前通知开发者。

未来展望

OpenAI致力于迭代部署最强大、最可靠的模型，用于真正的智能体和编码工作——这些模型能够高效思考、快速迭代并处理复杂任务，同时让开发者保持流畅的工作状态。

凭借自适应推理、更强的编码性能、更清晰的面向用户的更新以及apply_patch和shell等新工具，GPT-5.1旨在帮助开发者减少摩擦。OpenAI将继续大力投资：在未来几周和几个月内，你可以期待更强大的智能体和编码模型。

GPT-5.1的发布标志着AI开发工具进入了一个新阶段，它不仅更智能，更重要的是更实用、更高效。对于开发者而言，这意味着更快的开发速度、更低的成本和更好的开发体验。随着AI代理工作流的日益普及，GPT-5.1将成为构建下一代智能应用的重要基石。

文章来自：51CTO

OpenAI GPT-5.1震撼发布，有哪些重要更新值得关注？

作者yinhua

作者 yinhua

相关文章

视频生成太慢？英伟达、谢赛宁等发布TMD框架，实现70倍加速

折腾一晚上，我让OpenClaw把微信公众号的文章搬运到飞书了

OpenCode：最佳的 Claude 代码替代方案

发表回复取消回复

您错过的