模型支持

9+ Provider，一个统一接口

Adapter 层吃掉各家字段差异，外面用统一的 OpenAI 兼容接口。本地模型始终 0 成本，hard-stop 永远不挡它们。

deepseek-chat · deepseek-reasoner · deepseek-coder

thinking 已适配

qwen-coder · qwen-vl · qwen-max

thinking_budget 自动转

moonshot-v1 · kimi-thinking

reasoning_content 完整保留

MiMo 多轮 tool_calls 兼容

tool_calls 原样回传

glm-4 · glm-4v

vision 兼容

实验性 provider，已接通

已适配

本地任意 GGUF 模型

本地 · 0 成本

自部署 OpenAI 兼容端点

本地 · 0 成本

桌面端 OpenAI 兼容服务

本地 · 0 成本

Adapter

Adapter 解决了什么

国产模型字段差异大 (reasoning_content vs thinking vs tool_calls)，不处理就会在多轮里丢内容、或者 400 Bad Request。

Provider	特殊字段	Adapter 处理
MiMo	`reasoning_content` + `raw` + 多轮 `tool_calls`	assistant 消息原样回传，不清洗，避免 `400`。
Kimi / DeepSeek-reasoner	`reasoning_content` 思考过程	多轮完整保留，不丢思考内容。
Qwen 百炼	`thinking` · `thinking_budget`	走 adapter 自动转换，调用方不用关心。
GLM	`glm-4v` 多模态	vision 通道独立，能直接看图。
Ollama / vLLM / LM Studio	本地模型可能不支持 tools	第一次调用时报清晰错误，不静默失败。

安装 CLI 文档全部能力