GitHub Copilot 通过上下文缓存和自动模型提高效率

GitHub Copilot 引入了重大更新，以提高令牌效率，包括上下文缓存和自动模型选择，从而降低开发人员的成本。

GitHub Copilot Boosts Efficiency with Context Caching and Auto Models

GitHub 推出了对其 Copilot AI 助手的重大升级，旨在提高成本效率并简化开发人员工作流程。这些更新于 6 月 17 日宣布，重点关注更智能的上下文处理和自动模型选择功能，这些功能旨在减少令牌使用，同时提高复杂任务的性能。

Copilot 现在在基于使用情况的计费模式下运行（每个处理的代币都会消耗 AI 积分），效率不仅仅是一个技术挑战；更是一个挑战。这是开发商的一个关键成本因素。与 Copilot 的每次交互都涉及一个上下文窗口，其中包括活动文件、聊天历史记录和工具输出。该窗口必须符合模型的代币限制，这使得优化对于避免超额和价值最大化至关重要。

通过上下文缓存提高效率

最显着的变化之一是在 GitHub Copilot for Visual Studio Code 中引入了提示缓存。不再需要为每次交互重新计算重复的上下文，例如工具定义和对话历史记录。相反，缓存的数据允许 Copilot 重用之前的提示前缀，从而显着减少令牌使用的开销。工具搜索功能还可以按需加载工具定义，避免在不立即需要时将整个工具模式发送到模型中的低效率。

随着 Copilot 越来越多地与越来越多的工具（从终端命令到产品特定操作）集成，这一改进尤其有价值。通过缓存和推迟不必要的数据，开发人员可以分配更多的人工智能积分来解决手头的实际任务。

自动模型选择以实现更智能的路由

新的自动模型选择功能解决了一个关键挑战：将任务的复杂性与适当的 AI 模型相匹配。 Copilot 现在不再依赖一刀切的方法，而是动态评估任务意图和实时模型运行状况，以选择最适合的模型。快速编辑等较轻的任务将路由到更高效的模型，而复杂的多文件更改则利用具有更深入推理功能的模型。

根据 GitHub 的说法，初步评估表明，这种方法不仅节省了代币成本，而且还保持了质量。 Auto系统使用名为HyDRA的路由模型，该模型可以分析代码复杂性和调试难度等因素。重要的是，路由仅在自然边界处（例如压缩较旧的上下文时）切换模型，从而避免了会话中的缓存破坏。

对开发者更广泛的影响

这些更新是在关键时刻发布的。 6 月 1 日，GitHub 将 Copilot 转变为基于使用的定价，每个 AI 积分收费 0.01 美元，相当于大约 1,000 个代币。开发人员和组织现在在如何管理 Copilot 使用方面面临着更严格的审查。新的效率功能旨在通过确保减少重复或不必要的计算上浪费的代币来减轻这种负担。

随着 Copilot 不断扩展以支持更大的上下文窗口（某些模型最近增加到 192K 令牌），这些更新预计也将提高长时间运行的复杂会话的性能。对于使用 Copilot 商业或企业计划（现在默认为 GPT-5.3-Codex）的团队来说，这些优化与更广泛的基础设施扩展工作相一致，包括 Microsoft 最近使用 AWS 来应对激增的需求。

最大化人工智能积分的实用技巧

GitHub 还提供了实用指南，帮助开发者从 AI 积分中获得更多收益：

从自动开始：使用自动模型选择功能可确保成本和性能之间的最佳平衡。
关注上下文：压缩长时间运行的会话并指定相关文件以减少不必要的令牌使用。
避免会话中更改：在会话中切换模型或设置会重置缓存数据，从而增加令牌消耗。
并行化之前进行规划：对于大型任务，请提前规划工作流程，以最大程度地减少并行代理之间的冗余令牌使用。

下一步是什么？

自动模型选择功能已在 Copilot 体验中上线，包括 Visual Studio Code、GitHub.com 和移动设备。 GitHub 计划在未来几个月内将该功能推广到 Copilot CLI 和其他 IDE 等其他界面。此外，“自动”将成为免费和学生计划的默认模型选择选项，并通过管理控制允许组织强制使用它。

这些变化突显了 GitHub 致力于让 AI 工具对开发者来说更容易使用且更具成本效益。随着令牌效率成为竞争优势，这些更新可以为人工智能助手管理上下文和资源的方式设定新标准。

书签