Skip to content

Releases: ThreeFish-AI/coding-proxy

v0.5.2a1

Choose a tag to compare

@ThreeFish-AI ThreeFish-AI released this 30 Jun 12:00
0c330d5

v0.5.2a1(prerelease)

  • fix(zhipu):将 529 过载重试退避抖动从 Full Jitter 改为 Equal Jitter([0, ceiling][ceiling/2, ceiling]),修复重试延迟非单调问题(实测 418.8→1857.7→961.6→3769.7ms),延迟呈单调非递减指数形态;429/529 同步受益 (#263)
  • feat(dashboard):Model Calling 实时监控扩展至全 vendor / 全 model(仅 CC 场景),其他 vendor 在 monitor 模式下仅计数不限流,Zhipu 保留 limited 模式 + FIFO 排队
  • feat(concurrency):新增 peak_pending_recent 最近 10s 排队峰值追踪,瞬时排队释放后前端仍可见"曾排队 N" 余晖徽章
  • perf(dashboard):Model Calling 轮询间隔由 5000ms 缩短至 1500ms,提升瞬时排队可观测性
  • refactor(vendors)ModelConcurrencyLimiter 重构为 ModelConcurrencyController,统一 monitor / limited 双模式抽象;并发控制迁移至 executor 层 track_in_flight,行为对所有 vendor 一致

Note

本版另补记 v0.5.1 Release Note 遗漏的 4 项并发与监控改动(代码已随 v0.5.1 上线,文档此前未记录)。

完整变更对照v0.5.1...v0.5.2a1

v0.5.1

Choose a tag to compare

@ThreeFish-AI ThreeFish-AI released this 18 Jun 08:07
  • feat(dashboard): Model Calling 实时监控扩展至全 vendor,修复排队队列长度不可见 (#253)
  • fix(session-title): 剥离 标签前缀并放大标题存储长度至 600 字符 (#257)
  • feat(session-title): 多层级回退标题提取与延迟补写,消除 Dashboard 空标题 (#258)
  • feat(session-routing): 新增基于 Session 标题前缀的可配置 Vendor 自动绑定 (#260)
  • feat(zhipu): 将 529 过载异常纳入指数退避重试范畴 (#261)
  • feat(dashboard): 采用 Tabler terminal-2 作为 favicon 与 logo 品牌图标 (#262)

v0.5.0

Choose a tag to compare

@ThreeFish-AI ThreeFish-AI released this 27 May 03:35
8a86e64

Important

🚀 Model Calling 实时状态!

模型并发与排队深度一目了然,运行时动态调整每个模型并行度,预防 vendor 侧的 429 幺蛾子。

model-calling

✨ 核心亮点

  • feat(concurrency): 新增 Model Calling 实时状态模块,可视化每模型并发与排队深度,支持运行时动态修改每模型并行度 (#250) (#251)
  • feat(zhipu): 新增每模型并发限制,默认 3 个并行请求 FIFO 排队 (#248)
  • feat(zhipu): 为 429 Rate Limit 添加指数退避重试挽回机制 (#242)

🔧 更多特性

  • fix(antigravity): 修复 v1internal 模式检测逻辑并新增 E2E 测试; (#234)
  • fix(routes): 修复 count_tokens 路由对 target_vendor.name 的错误属性访问; (#235)
  • fix(vendor-channels): 修复 zhipu→anthropic 通道 tool_use/tool_result 配对漏洞; (#236)
  • fix(native-api): 修复 Gemini :verb 路径中 %3A URL 编码导致上游 400 的兼容问题; (#237)
  • fix(zhipu): 诊断首选 tier 语义拒绝降级问题,增强可观测性并提取跨供应商清洗共享函数 (#243)

v0.4.0

Choose a tag to compare

@ThreeFish-AI ThreeFish-AI released this 01 May 01:13
403a471

Important

🚀 Session 级专属路由策略!

给每个 Session 指定专属的 vendor,动态调节不同 vendors 间的 LLM 流量。

session

✨ 核心亮点

  • feat(session-policy): 新增 Session 级专属路由策略 (#219)
  • feat(dashboard): 新增会话活动面板 (#222)

🔧 更多特性

  • refactor(logging): 移除已被 ModelCall 汇总行覆盖的冗余 DEBUG 日志 (#203)
  • style(dashboard): 加宽图表 tooltip 令模型名称与用量值单行显示 (#211)
  • fix(usage-parser): 补充 OpenAI/Gemini SSE 流式分支的 model_served 提取 (#214)
  • fix(usage-parser): 兼容 SSE chunk 中 usage 字段为 null 的极端格式 (#212)

v0.3.0

Choose a tag to compare

@ThreeFish-AI ThreeFish-AI released this 20 Apr 10:52
cf5a3c2

Important

🚀 OpenAI、Anthropic、Gemini 原生 API 进驻 Coding Proxy!

服务对象不在局限于 Claude Code,凡兼容 OpenAI、Anthropic、Gemini 三巨头 API 协议的客户端,出口 LLM 流量可统一收敛到 Coding Proxy。

✨ 核心亮点

  • feat(native-api): 新增 /api/{openai,gemini,anthropic}/** 原生 LLM API 全量 catch-all 透传通道;
  • feat(dashboard): 新增实时 Web Dashboard 页面,聚合展示流量与用量统计;
  • feat(usage): usage 区分 Claude Code 场景('cc')与原生 API 场景('api');
  • refactor(vendor-channels): 将供应商转换通道从目标专属重构为源→目标绑定模型;
  • docs(user-guide): 补充 POST /v1/messages 完整 API 参考文档;

🔧 更多特性

  • feat(server): 默认监听端口 80463392,规范化 Negentropy 体系端口;

v0.2.3

Choose a tag to compare

@ThreeFish-AI ThreeFish-AI released this 16 Apr 03:47
bad0523
  • feat(dashboard): 新增实时 Web Dashboard 页面,聚合展示流量与用量统计;

dashboard

  • docs(user-guide): 补充 POST /v1/messages 完整 API 参考文档;
  • fix(request-normalizer): misplaced tool_result 从剥离改为重定位,修复跨供应商降级后 Anthropic 恢复失败;

v0.2.2

Choose a tag to compare

@ThreeFish-AI ThreeFish-AI released this 13 Apr 13:34
5f55b8f
  • feat(reset): CLI reset 命令新增 -v/--vendor 参数,支持运行时 N-tier 链路重排序(逗号分隔的 vendor 列表);
  • fix(logging): 修复 uvicorn.error 日志在文件中重复打印的问题;

v0.2.1

Choose a tag to compare

@ThreeFish-AI ThreeFish-AI released this 11 Apr 13:33
d74f367
  • feat(logging): 实现日志双写(控制台 + 本地文件),日志文件支持 5MB 自动轮转及 gzip 压缩备份;ModelCall 日志降级为 DEBUG 级别;
  • feat(circuit-breaker): 补全熔断器状态转换日志的 vendor 上下文信息;

v0.2.0

Choose a tag to compare

@ThreeFish-AI ThreeFish-AI released this 10 Apr 01:33
52a9b84

Important

🚀 供应商大扩军 × 用量仪表盘全面进化,双线暴击!

卡在一家供应商的限额天花板下抬不起头?现在你手握 九条命——新增 MiniMax、小米 MiMo、阿里千问、Kimi、豆包五路援军,全部原生讲 Anthropic 话,无缝接入 N-tier。 Token 烧到哪儿心里没数?新版 usage 命令解锁日/周/月/全量四档视角,多供应商并排比,汇总行一行看全局。备用仓更满,账单更透,从此宕机只是别人家的故事。

✨ 核心亮点

  • 5 家供应商集体入场:MiniMax、小米 MiMo、阿里千问、Kimi、豆包(火山引擎)正式入编 N-tier。备用通道数量直接翻倍,不怕堵;
  • usage 命令全面升级:从"只有天数"进化为日 / 周 / 月 / 全量四档时间维度(-d 7 / -w / -m / -t)。支持多值过滤——-v anthropic,kimi--model claude-opus-4-6,glm-5.1 用逗号隔开随便选。表格末行自动追加汇总行,请求总量、Token 总计、总成本、加权平均延迟四项一览无余。Token 花在哪家、烧了多少、谁最能扛——这张表给你答案;

🔧 更多特性

  • 品牌横幅正式上线proxy start 启动时打印 Coding Proxy 专属 ASCII Banner 与版本号,告别冷冰冰的裸日志起手式;
  • 529 过载纳入降级触发:HTTP 529 overloaded_error 正式加入故障转移白名单,Anthropic 喊"我堵了"时 Proxy 不再干等;
  • Zhipu 跨供应商级联故障根治Internal Network Failure 纳入 500 降级条件;tool_result 角色错位导致的下游级联崩溃彻底斩断,再也不因历史 message 的"历史遗留问题"把整条链拖下水;

v0.1.3

Choose a tag to compare

@ThreeFish-AI ThreeFish-AI released this 07 Apr 09:54
cbe95fc

Important

🔥 跨供应商"身份危机" + 熔断器"装死"双杀!

Zhipu 的 thinking blocks 偷渡到 Anthropic 被当场识破 → 400 无限循环降级?斩了。429 限流后熔断器嘴上说"我没事"身体却已躺平?修了。两大隐蔽 Bug 一锅端,跨供应商丝滑切换从此告别"薛定谔的可用性"。

✨ 核心亮点

  • Thinking Blocks "安检门":Anthropic 对请求体 deepcopy 后,精准剥离 assistant messages 中的 thinking / redacted_thinking blocks。Zhipu → Anthropic 迁移时历史思考签名不再越界,400 invalid_request_error 彻底根除,其他供应商零影响;
  • 熔断器 Force-Open 闪电响应:为 record_failure() 新增 force_open 参数——当检测到 429/403 携带 retry_after_seconds(即 Rate Limit 硬信号)时,跳过累积阈值直接 OPEN,状态展示与实际可用性分秒对齐;非 429 错误(5xx、超时等)保持原有累积行为不变。