Releases: ThreeFish-AI/coding-proxy
Release list
v0.5.2a1
v0.5.2a1(prerelease)
- fix(zhipu):将 529 过载重试退避抖动从 Full Jitter 改为 Equal Jitter(
[0, ceiling]→[ceiling/2, ceiling]),修复重试延迟非单调问题(实测 418.8→1857.7→961.6→3769.7ms),延迟呈单调非递减指数形态;429/529 同步受益 (#263) - feat(dashboard):Model Calling 实时监控扩展至全 vendor / 全 model(仅 CC 场景),其他 vendor 在 monitor 模式下仅计数不限流,Zhipu 保留 limited 模式 + FIFO 排队
- feat(concurrency):新增
peak_pending_recent最近 10s 排队峰值追踪,瞬时排队释放后前端仍可见"曾排队 N" 余晖徽章 - perf(dashboard):Model Calling 轮询间隔由 5000ms 缩短至 1500ms,提升瞬时排队可观测性
- refactor(vendors):
ModelConcurrencyLimiter重构为ModelConcurrencyController,统一 monitor / limited 双模式抽象;并发控制迁移至 executor 层track_in_flight,行为对所有 vendor 一致
Note
本版另补记 v0.5.1 Release Note 遗漏的 4 项并发与监控改动(代码已随 v0.5.1 上线,文档此前未记录)。
完整变更对照:v0.5.1...v0.5.2a1
v0.5.1
- feat(dashboard): Model Calling 实时监控扩展至全 vendor,修复排队队列长度不可见 (#253)
- fix(session-title): 剥离 标签前缀并放大标题存储长度至 600 字符 (#257)
- feat(session-title): 多层级回退标题提取与延迟补写,消除 Dashboard 空标题 (#258)
- feat(session-routing): 新增基于 Session 标题前缀的可配置 Vendor 自动绑定 (#260)
- feat(zhipu): 将 529 过载异常纳入指数退避重试范畴 (#261)
- feat(dashboard): 采用 Tabler terminal-2 作为 favicon 与 logo 品牌图标 (#262)
v0.5.0
Important
🚀 Model Calling 实时状态!
模型并发与排队深度一目了然,运行时动态调整每个模型并行度,预防 vendor 侧的 429 幺蛾子。
✨ 核心亮点
- feat(concurrency): 新增 Model Calling 实时状态模块,可视化每模型并发与排队深度,支持运行时动态修改每模型并行度 (#250) (#251)
- feat(zhipu): 新增每模型并发限制,默认 3 个并行请求 FIFO 排队 (#248)
- feat(zhipu): 为 429 Rate Limit 添加指数退避重试挽回机制 (#242)
🔧 更多特性
- fix(antigravity): 修复 v1internal 模式检测逻辑并新增 E2E 测试; (#234)
- fix(routes): 修复 count_tokens 路由对 target_vendor.name 的错误属性访问; (#235)
- fix(vendor-channels): 修复 zhipu→anthropic 通道 tool_use/tool_result 配对漏洞; (#236)
- fix(native-api): 修复 Gemini :verb 路径中 %3A URL 编码导致上游 400 的兼容问题; (#237)
- fix(zhipu): 诊断首选 tier 语义拒绝降级问题,增强可观测性并提取跨供应商清洗共享函数 (#243)
v0.4.0
Important
🚀 Session 级专属路由策略!
给每个 Session 指定专属的 vendor,动态调节不同 vendors 间的 LLM 流量。
✨ 核心亮点
🔧 更多特性
v0.3.0
Important
🚀 OpenAI、Anthropic、Gemini 原生 API 进驻 Coding Proxy!
服务对象不在局限于 Claude Code,凡兼容 OpenAI、Anthropic、Gemini 三巨头 API 协议的客户端,出口 LLM 流量可统一收敛到 Coding Proxy。
✨ 核心亮点
- feat(native-api): 新增
/api/{openai,gemini,anthropic}/**原生 LLM API 全量 catch-all 透传通道; - feat(dashboard): 新增实时 Web Dashboard 页面,聚合展示流量与用量统计;
- feat(usage):
usage区分 Claude Code 场景('cc')与原生 API 场景('api'); - refactor(vendor-channels): 将供应商转换通道从目标专属重构为源→目标绑定模型;
- docs(user-guide): 补充 POST /v1/messages 完整 API 参考文档;
🔧 更多特性
- feat(server): 默认监听端口
8046→3392,规范化 Negentropy 体系端口;
v0.2.3
v0.2.2
- feat(reset): CLI reset 命令新增 -v/--vendor 参数,支持运行时 N-tier 链路重排序(逗号分隔的 vendor 列表);
- fix(logging): 修复 uvicorn.error 日志在文件中重复打印的问题;
v0.2.1
- feat(logging): 实现日志双写(控制台 + 本地文件),日志文件支持 5MB 自动轮转及 gzip 压缩备份;ModelCall 日志降级为 DEBUG 级别;
- feat(circuit-breaker): 补全熔断器状态转换日志的 vendor 上下文信息;
v0.2.0
Important
🚀 供应商大扩军 × 用量仪表盘全面进化,双线暴击!
卡在一家供应商的限额天花板下抬不起头?现在你手握 九条命——新增 MiniMax、小米 MiMo、阿里千问、Kimi、豆包五路援军,全部原生讲 Anthropic 话,无缝接入 N-tier。 Token 烧到哪儿心里没数?新版 usage 命令解锁日/周/月/全量四档视角,多供应商并排比,汇总行一行看全局。备用仓更满,账单更透,从此宕机只是别人家的故事。
✨ 核心亮点
- 5 家供应商集体入场:MiniMax、小米 MiMo、阿里千问、Kimi、豆包(火山引擎)正式入编 N-tier。备用通道数量直接翻倍,不怕堵;
usage命令全面升级:从"只有天数"进化为日 / 周 / 月 / 全量四档时间维度(-d 7/-w/-m/-t)。支持多值过滤——-v anthropic,kimi或--model claude-opus-4-6,glm-5.1用逗号隔开随便选。表格末行自动追加汇总行,请求总量、Token 总计、总成本、加权平均延迟四项一览无余。Token 花在哪家、烧了多少、谁最能扛——这张表给你答案;
🔧 更多特性
- 品牌横幅正式上线:
proxy start启动时打印 Coding Proxy 专属 ASCII Banner 与版本号,告别冷冰冰的裸日志起手式; - 529 过载纳入降级触发:HTTP
529 overloaded_error正式加入故障转移白名单,Anthropic 喊"我堵了"时 Proxy 不再干等; - Zhipu 跨供应商级联故障根治:
Internal Network Failure纳入 500 降级条件;tool_result角色错位导致的下游级联崩溃彻底斩断,再也不因历史 message 的"历史遗留问题"把整条链拖下水;
v0.1.3
Important
🔥 跨供应商"身份危机" + 熔断器"装死"双杀!
Zhipu 的 thinking blocks 偷渡到 Anthropic 被当场识破 → 400 无限循环降级?斩了。429 限流后熔断器嘴上说"我没事"身体却已躺平?修了。两大隐蔽 Bug 一锅端,跨供应商丝滑切换从此告别"薛定谔的可用性"。
✨ 核心亮点
- Thinking Blocks "安检门":Anthropic 对请求体 deepcopy 后,精准剥离 assistant messages 中的
thinking/redacted_thinkingblocks。Zhipu → Anthropic 迁移时历史思考签名不再越界,400invalid_request_error彻底根除,其他供应商零影响; - 熔断器 Force-Open 闪电响应:为
record_failure()新增force_open参数——当检测到 429/403 携带retry_after_seconds(即 Rate Limit 硬信号)时,跳过累积阈值直接 OPEN,状态展示与实际可用性分秒对齐;非 429 错误(5xx、超时等)保持原有累积行为不变。


