- 🔭 Focus: AI Agent Systems · RAG Architecture · Multi-LLM Engineering · Workflow Automation
- 🏠 Based in: Shenzhen, China
- 🌏 Open to: Beijing · Shanghai · Guangzhou · Singapore · Remote
- 📫 Reach me: fgotbe@gmail.com
NightWatch · 🆕
通宵运行的 AI Agent 黑匣子 · Logs are claims, replays are proofs
Fable 5 时代的多天自主运行,第二天早上谁来审查?Claude Code hooks 把每个事件写入 SHA-256 哈希链台账,git plumbing 沿途快照,晨报独立核验三类主张:测试是否真通过(重跑原命令)、是否越界(声明 glob vs git 事实)、有没有绕过工具的暗写入。Fail-open 设计、确定性核验(不让 LLM 给 LLM 打分)、46 测试、中英双语。
TypeScript Hash-chain Ledger Claude Code Hooks Deterministic Verification Checkpoints
工具调用型 Agent 的录制/回放可靠性闸门 · Determinism ≠ Faithfulness
录一次 Agent 运行、离线确定性回放,在 CI 上分别卡两条独立的轴:确定性(每次是否走相同轨迹,pass^k + 置信区间)与可信度(是否真改变了 SQLite / 文件系统的真实状态,而非只看转录)。mypy --strict、107 测试、四道 CI 门禁、中英双语文档与从零教程。
Python AI Agents Eval / CI Gate Record-Replay mypy strict
🔧 同域实战:为 mastra#17737(Agent 工具回放 · 确定性评测)根因诊断三个红 CI,修复建议 16 分钟内被作者采纳并在 commit 中致谢。
玻璃盒账单审计 Agent · 每个数字都带密码学回执
逐项审计任意账单,LLM 全程禁止做算术——所有计算走确定性引擎,每条结论生成 HMAC 签名的 Proof Receipt,可脱离模型独立校验。配 React 驾驶舱、Docker/CI、mypy --strict、BillAudit-Bench、中英双语文档。
Python AI Agents Verifiable Compute HMAC Receipts React
可验证的自主编码 Agent(CLI)· TypeScript + Bun
「完成」不由模型自述,而由机器门禁判定:feature_list 状态机 → verify-fix 循环 → rubric 门禁 → 签名可回放的运行台账(run ledger)。支持录制轨迹回放做回归评测,内存 agent 自管但全程可审查。538 测试、tsc --noEmit 全绿、运行时仅 3 个依赖。
TypeScript Bun Autonomous Agent Replay Eval Signed Ledger
simp-skill · ⭐ 240+
不教 PUA,只教真心 — A Claude Code skill for authentic relationship coaching
完整验证 Claude Code Skill 框架的多模块协同能力:多源数据解析、上下文信号识别、策略状态机、危机应对 fallback。本地化处理保障隐私边界。
Python Claude API Multi-mode System Local Processing
RAG-learning · ⭐ 35+
从零到生产的中文 RAG 完整学习路径
覆盖 LangChain 基础 → 进阶技术(HyDE / CRAG / GraphRAG / Agentic RAG)→ 企业级应用。支持 GPT / Qwen / Gemini 多模型。
LangChain LangGraph PydanticAI LlamaIndex RAG Multi-LLM
面向 TypeScript 开发者的 Mastra 中文教程
按真实工程路径重写的 Mastra 学习指南:先建立心智模型,再做可运行项目,最后进入 Memory、RAG、MCP、评测、观测和部署。
TypeScript Mastra Agent Workflow RAG MCP
Harness Engineering 中文模板 · AI 自动化工作流模板集
为 AI 自动化工程提供可复用的模板和最佳实践,降低 Harness Engineering 上手门槛。
Shell Automation AI Workflow
Model-agnostic 开源电商对话系统
支持多模型接入的开源电商客服解决方案,灵活切换 LLM 后端。
Python LLM E-Commerce Multi-Model
Hermes Agent 使用指南 · Multi-agent orchestration
Hermes 多智能体编排框架的中文实践指南。
Agent Multi-Agent Guide
Languages
LLM & Agent Framework
Vector Storage
Infrastructure
Frontend
Open to Agent Engineer / AI Engineer roles · 欢迎 Agent 工程师相关机会



