模型支持

9+ Provider,一个统一接口

Adapter 层吃掉各家字段差异,外面用统一的 OpenAI 兼容接口。 本地模型始终 0 成本,hard-stop 永远不挡它们。

DeepSeek

deepseek-chat · deepseek-reasoner · deepseek-coder

thinking 已适配

Qwen (DashScope / 百炼)

qwen-coder · qwen-vl · qwen-max

thinking_budget 自动转

Kimi (Moonshot)

moonshot-v1 · kimi-thinking

reasoning_content 完整保留

MiMo (Xiaomi)

MiMo 多轮 tool_calls 兼容

tool_calls 原样回传

GLM (智谱)

glm-4 · glm-4v

vision 兼容

MiniMax

实验性 provider,已接通

已适配

Ollama

本地任意 GGUF 模型

本地 · 0 成本

vLLM

自部署 OpenAI 兼容端点

本地 · 0 成本

LM Studio

桌面端 OpenAI 兼容服务

本地 · 0 成本
Adapter

Adapter 解决了什么

国产模型字段差异大 (reasoning_content vs thinking vs tool_calls), 不处理就会在多轮里丢内容、或者 400 Bad Request

Provider特殊字段Adapter 处理
MiMoreasoning_content + raw + 多轮 tool_callsassistant 消息原样回传,清洗,避免 400
Kimi / DeepSeek-reasonerreasoning_content 思考过程多轮完整保留,不丢思考内容。
Qwen 百炼thinking · thinking_budget走 adapter 自动转换,调用方不用关心。
GLMglm-4v 多模态vision 通道独立,能直接看图。
Ollama / vLLM / LM Studio本地模型可能不支持 tools第一次调用时报清晰错误,静默失败。

挑一个模型,先跑起来