GitHub Copilot 按 premium request 次数计费( Pro 套餐每月 300 次,一次 Claude Opus 4.6 调用算 3 次),而不是按 token 计费。经过实验,我们发现:
操作 消耗 Premium Request ?
新的 user prompt ✅ 是
同 session 中的追问/后续提问 ✅ 是
Tool call / MCP 调用 ❌ 否
所以最划算的用法是:让一次 premium request 做尽可能多的事情。
问题是,人很难一次性把需求表达清楚,追问在所难免——但每次追问都会额外消耗一个 request 。
Copilot Leecher 提供了一个 request_review MCP tool 。Agent 完成任务后调用此工具,进入阻塞等待状态,你在本地 Web UI 上给出反馈。反馈以 tool call result (免费!)的形式返回给 Agent ,而不是新的 user prompt 。Agent 在同一个 request 内继续工作。
一次 prompt → 审查 → 改进 → 审查 → 通过。全程只消耗一个 premium request 。
简单来说:这个 MCP 服务"骗"大模型把你事实上的追问当成 tool call result 来处理。
项目地址:
https://github.com/xiangxiaobo/Copilot-Leecher
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://study.congcong.us/t/1193151
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.