style: lint markdown files

Snailclimb · Snailclimb · commit 9628dca7c994 · 2026-05-08T23:43:33.000+08:00
- Remove duplicate headings (already in frontmatter)
- Optimize Mermaid diagrams
- Add emoji markers (⭐️) to key sections
- Format quotes and whitespace
diff --git a/docs/ai-coding/claudecode-commands.md b/docs/ai-coding/claudecode-commands.md
@@ -10,8 +10,6 @@ head:
 
 <!-- @include: @article-header.snippet.md -->
 
-# Claude Code 核心命令详解：simplify、review、loop、batch
-
 说实话，Claude Code 里有些命令我用了一次就离不开了，但问身边朋友知道的人反而不多。这个系列文章就来聊聊这些被严重低估的命令——`/simplify`、`/review`、`/loop`、`/batch`。
 
 这些命令你知道有就行了，不用硬背。打个斜杠 `/` 就出来了，比你吭哧吭哧打字快多了。
diff --git a/docs/ai-coding/cli-vs-ide.md b/docs/ai-coding/cli-vs-ide.md
@@ -10,8 +10,6 @@ head:
 
 <!-- @include: @article-header.snippet.md -->
 
-# AI 编程选 CLI 还是 IDE？这篇文章帮你彻底搞清楚
-
 说实话，这个话题我酝酿很久了。很早就想聊聊，但一直拖着没有抽出时间写（其实就是懒！）。
 
 每次在群里聊 AI Coding 或者公众号分享 AI Coding 技巧，总有人问："Claude Code 那个黑窗口到底好在哪？我 Cursor 用得好好的为什么要换？" 然后另一边马上有人回："都 2026 年了还在用 IDE？CLI 才是正道。"
diff --git a/docs/ai-coding/deepseek-v4-claude-code.md b/docs/ai-coding/deepseek-v4-claude-code.md
@@ -10,8 +10,6 @@ head:
 
 <!-- @include: @article-header.snippet.md -->
 
-# DeepSeek V4 + Claude Code 实战：代码能力深度测评
-
 这几天 AI 圈基本被一件事刷屏了——DeepSeek V4 发布，同步开源。从技术报告里的 benchmark 数据到社区的实测反馈，到处都在讨论。
 
 开源模型在对话和写作上已经做得相当成熟，各家你追我赶，迭代速度肉眼可见。但 Agent Coding 是另一回事。
@@ -25,7 +23,7 @@ head:
 这篇文章接近 **7000 字**，建议收藏，通过本文你将搞懂：
 
 1. **Claude Code 接入 DeepSeek V4 的两种方式**：配置文件法 + CC Switch 可视化切换
-2. **三个真实开发任务的实战记录**：V4-Pro 干起活来到底怎么样
+2. **五个真实开发任务的实战记录**：V4-Pro 干起活来到底怎么样
 3. **DeepSeek V4-Pro 和 Flash 的核心参数与定价**：值不值得切
 4. **场景建议**：什么时候该用，什么时候先观望
 
diff --git a/docs/ai/llm-basis/llm-api-engineering.md b/docs/ai/llm-basis/llm-api-engineering.md
@@ -42,13 +42,16 @@ Guide 见过太多这样的事故。真正难的并非”怎么发一个 HTTP 
 
 ```mermaid
 flowchart LR
-    User["用户请求"] --> App["业务服务"]
-    App --> Prompt["Prompt 与上下文组装"]
-    Prompt --> Gateway["模型网关"]
-    Gateway --> Provider["供应商 API"]
-    Provider --> Stream["流式事件"]
-    Stream --> Parser["增量解析"]
-    Parser --> Sink["前端展示、落库与观测"]
+    User["用户请求"]:::client
+    App["业务服务"]:::business
+    Prompt["Prompt 组装"]:::business
+    Gateway["模型网关"]:::gateway
+    Provider["供应商 API"]:::external
+    Stream["流式事件"]:::infra
+    Parser["增量解析"]:::infra
+    Sink["前端/落库/观测"]:::success
+
+    User --> App --> Prompt --> Gateway --> Provider --> Stream --> Parser --> Sink
 
     classDef client fill:#00838F,color:#FFFFFF,stroke:none,rx:10,ry:10
     classDef business fill:#E99151,color:#FFFFFF,stroke:none,rx:10,ry:10
@@ -57,12 +60,6 @@ flowchart LR
     classDef infra fill:#9B59B6,color:#FFFFFF,stroke:none,rx:10,ry:10
     classDef success fill:#4CA497,color:#FFFFFF,stroke:none,rx:10,ry:10
 
-    class User client
-    class App,Prompt business
-    class Gateway gateway
-    class Provider external
-    class Stream,Parser infra
-    class Sink success
     linkStyle default stroke-width:2px,stroke:#333333,opacity:0.8
 ```
 
@@ -109,7 +106,7 @@ TTFT（Time To First Token）指从请求发出到收到第一个可展示 Token
 
 Guide 的经验：面向用户展示的长文本默认用流式，后台批处理和强结构化任务默认用同步。
 
-## SSE、WebSocket 和 HTTP chunked 这三种流式协议怎么选
+## ⭐️ SSE、WebSocket 和 HTTP chunked 这三种流式协议怎么选
 
 流式输出有几种常见承载方式，别把它们混成一个东西。
 
@@ -327,7 +324,7 @@ tenantId:userId:conversationId:messageId:attemptGroup
 
 落库时，只允许一个 attempt 成为 `final`。其他 attempt 保留为诊断记录，不参与用户上下文。这样既能排查问题，又不会污染下一轮 Prompt。
 
-## 为什么要限流？如何限流？
+## ⭐️ 为什么要限流？如何限流？
 
 很多团队的限流是从收到 429 开始的。
 
@@ -344,6 +341,49 @@ AI 应用的限流应该在自己的系统里先完成。供应商的 429 是最
 | 模型级   | 某个模型或模型族             | 避免热门模型被打满           | 模型维度令牌桶、降级到备用模型 |
 | 供应商级 | OpenAI、Anthropic、Gemini 等 | 保护外部依赖和 API Key       | 全局 RPM、TPM、并发、熔断      |
 
+```mermaid
+flowchart TB
+    subgraph User["用户层"]
+        U1["单用户/账号"]:::client
+        U2["每分钟请求数"]:::info
+        U3["每日 Token 上限"]:::info
+    end
+
+    subgraph Tenant["租户层"]
+        T1["企业/团队/项目"]:::business
+        T2["月度配额"]:::info
+        T3["并发上限"]:::info
+    end
+
+    subgraph Model["模型层"]
+        M1["指定模型/模型族"]:::gateway
+        M2["令牌桶"]:::info
+        M3["降级备用模型"]:::info
+    end
+
+    subgraph Provider["供应商层"]
+        P1["OpenAI/Anthropic\n/Gemini"]:::external
+        P2["全局 RPM/TPM"]:::info
+        P3["熔断器"]:::info
+    end
+
+    User --> Tenant --> Model --> Provider
+
+    classDef client fill:#00838F,color:#FFFFFF,stroke:none,rx:10,ry:10
+    classDef business fill:#E99151,color:#FFFFFF,stroke:none,rx:10,ry:10
+    classDef gateway fill:#7B68EE,color:#FFFFFF,stroke:none,rx:10,ry:10
+    classDef external fill:#607D8B,color:#FFFFFF,stroke:none,rx:10,ry:10
+    classDef success fill:#4CA497,color:#FFFFFF,stroke:none,rx:10,ry:10
+    classDef info fill:#95A5A6,color:#FFFFFF,stroke:none,rx:10,ry:10
+
+    style User fill:#F5F7FA,stroke:#005D7B,stroke-width:2px,rx:10,ry:10
+    style Tenant fill:#F5F7FA,stroke:#005D7B,stroke-width:2px,rx:10,ry:10
+    style Model fill:#F5F7FA,stroke:#005D7B,stroke-width:2px,rx:10,ry:10
+    style Provider fill:#F5F7FA,stroke:#005D7B,stroke-width:2px,rx:10,ry:10
+
+    linkStyle default stroke-width:2px,stroke:#333333,opacity:0.8
+```
+
 Gemini 官方限流文档把限流维度拆成 RPM、输入 TPM、RPD，并说明限制按项目而不是单个 API Key 应用；OpenAI 官方文档也展示了请求数、Token 数、剩余额度等 rate limit header。具体数值和模型关系变化很快，生产系统不要把文档里的静态数字写死，要从控制台、响应头或配置中心动态管理。
 
 ### 为什么 Token 预算比请求数更重要
@@ -485,6 +525,48 @@ OpenAI 官方 Structured Outputs 文档强调可以让输出遵循开发者提
 3. **降级 Schema**：复杂对象拆成多个小对象，或先分类再抽取字段。
 4. **人工或规则兜底**：高价值订单、金融、医疗、法务场景不要完全依赖自动修复。
 
+```mermaid
+flowchart TB
+    Start([结构化输出失败]):::client
+    L1["第一级：本地校验"]:::business
+    L1A["JSON Schema\nJackson\nBean Validation"]:::info
+
+    L2["第二级：轻量修复"]:::business
+    L2A["只修格式\n不重新生成业务内容"]:::info
+
+    L3["第三级：降级 Schema"]:::business
+    L3A["拆成多个小对象\n先分类再抽取字段"]:::info
+
+    L4["第四级：人工兜底"]:::danger
+    L4A["高价值订单\n金融/医疗/法务"]:::info
+
+    Success([完成]):::success
+    Fail([标记异常\n人工处理]):::danger
+
+    Start --> L1
+    L1 --> L1A
+    L1A -->|校验通过| Success
+    L1A -->|校验失败| L2
+    L2 --> L2A
+    L2A -->|修复成功| Success
+    L2A -->|修复失败| L3
+    L3 --> L3A
+    L3A -->|降级成功| Success
+    L3A -->|降级失败| L4
+    L4 --> L4A --> Fail
+
+    classDef client fill:#00838F,color:#FFFFFF,stroke:none,rx:10,ry:10
+    classDef business fill:#E99151,color:#FFFFFF,stroke:none,rx:10,ry:10
+    classDef success fill:#4CA497,color:#FFFFFF,stroke:none,rx:10,ry:10
+    classDef danger fill:#C44545,color:#FFFFFF,stroke:none,rx:10,ry:10
+    classDef warning fill:#F39C12,color:#FFFFFF,stroke:none,rx:10,ry:10
+    classDef info fill:#95A5A6,color:#FFFFFF,stroke:none,rx:10,ry:10
+
+    linkStyle default stroke-width:2px,stroke:#333333,opacity:0.8
+    linkStyle 2,4,6,8 stroke:#4CA497,stroke-width:2px
+    linkStyle 9 stroke:#C44545,stroke-width:2px,stroke-dasharray:5 5
+```
+
 一个实用原则：结构化返回失败时，不要把原始自然语言硬塞给下游系统。能展示给用户，不代表能被程序执行。
 
 ## Java 后端怎么落地 LLM 调用？
diff --git a/docs/ai/llm-basis/llm-operation-mechanism.md b/docs/ai/llm-basis/llm-operation-mechanism.md
diff --git a/docs/ai/llm-basis/structured-output-function-calling.md b/docs/ai/llm-basis/structured-output-function-calling.md