这个页面保存了一份基于仓库示例 bundle 生成的 taskbundle report 输出,方便直接查看结果长什么样。
现在它旁边还配套放了一个浏览器可直接打开的 docs/sample-benchmark-report.html,以及放在 assets/ 里的 SVG badge,这样同一组 benchmark 数据就能从 CLI 结果直接变成可分享制品,而不用先搭一套更重的平台。
npm run dev -- report ./examples --out ./dist/benchmark-report.md --html-out ./dist/benchmark-report.html
npm run dev -- badge ./examples --metric avg-score --out ./dist/avg-score.svg- Bundles: 2
- Scored bundles: 2
- Average score: 0.91
| Rank | Title | Tool | Model | Status | Score | Events | Workspace |
|---|---|---|---|---|---|---|---|
| 1 | Fix greeting punctuation | codex | gpt-5 | success | 0.93 | 3 | 1 |
| 2 | Fix greeting punctuation | claude-code | claude-sonnet-4 | success | 0.89 | 4 | 1 |
| Tool | Model | Runs | Scored | Successes | Avg Score | Best Score |
|---|---|---|---|---|---|---|
| codex | gpt-5 | 1 | 1 | 1 | 0.93 | 0.93 |
| claude-code | claude-sonnet-4 | 1 | 1 | 1 | 0.89 | 0.89 |
- 让读者直接看到报告输出的样子。
- 说明仓库里的示例 bundle 可以继续拿来比较和分析。
- 说明同一个目录还能继续产出 HTML 页面和 SVG badge。
- README 可以稳定链接到这份示例结果。