支持的模型

ModelMax 将请求路由到最优的可用供应商。所有模型通过单一 API 访问。

对话模型

文本输入、文本输出的对话模型。通过 POST /v1/chat/completions 使用。

模型 ID	输入	输出	备注
`gemini-3.1-pro-preview`	文本, 图像, 音频, 视频	文本	最新 Gemini Pro
`gemini-3-pro-preview`	文本, 图像, 音频, 视频	文本	Gemini 3.0 Pro
`gemini-3-flash-preview`	文本, 图像, 音频, 视频	文本	快速, 高性价比
`gemini-3.1-flash-image-preview`	文本, 图像	文本, 图像	支持图像生成
`gemini-3.1-flash-lite-preview`	文本, 图像, 音频, 视频	文本	轻量级

模型 ID	输入	输出	备注
`grok-4.3`	文本, 图像	文本	Google Cloud 托管的 xAI 旗舰模型
`grok-4.1-fast-non-reasoning`	文本, 图像	文本	快速、高性价比的非推理模型

模型 ID	输入	输出	备注
`gpt-5.5`	文本, 图像	文本	旗舰 GPT 模型
`gpt-5.4`	文本, 图像	文本	高能力 GPT 模型
`gpt-5.4-mini`	文本, 图像	文本	均衡 GPT 模型
`gpt-5.4-nano`	文本, 图像	文本	快速、低成本 GPT 模型

模型 ID	输入	输出	备注
`claude-opus-4-8`	文本, 图像	文本	最高能力 Claude 模型
`claude-sonnet-4-6`	文本, 图像	文本	均衡 Claude 模型
`claude-haiku-4-5`	文本, 图像	文本	快速 Claude 模型

模型 ID	输入	输出	备注
`deepseek-r1`	文本	文本	推理模型，带思维链
`deepseek-v3.1`	文本	文本	通用
`deepseek-v3.2`	文本	文本	最新通用模型
`deepseek-v4-flash`	文本	文本	快速直连模型
`deepseek-v4-pro`	文本	文本	更高能力的直连模型

模型 ID	输入	输出	备注
`qwen3-coder-30b-a3b`	文本	文本	代码专用, 轻量
`qwen3-32b`	文本	文本	通用
`qwen3-235b-a22b-2507`	文本	文本	大型, 强大
`qwen3-coder-480b-a35b`	文本	文本	代码专用, 高容量
`qwen3-next-80b-a3b`	文本	文本	高效 MoE 架构
`qwen3-vl-235b-a22b`	文本, 图像	文本	视觉语言模型
`qwen3-coder-next`	文本	文本	最新代码模型
`qwen3-max`	文本	文本	旗舰直连模型
`qwen3.5-plus`	文本	文本	均衡直连模型
`qwen3.5-flash`	文本	文本	快速直连模型

模型 ID	输入	输出	备注
`minimax-m2`	文本	文本	MiniMax M2
`minimax-m2.1`	文本	文本	MiniMax M2.1
`minimax-m2.7`	文本	文本	MiniMax 直连模型
`minimax-m2.5`	文本	文本	MiniMax 直连模型

模型 ID	输入	输出	备注
`kimi-k2.6`	文本	文本	最新 Kimi 直连模型
`kimi-k2-thinking`	文本	文本	带推理
`kimi-k2.5`	文本	文本	最新 Kimi

模型 ID	输入	输出	备注
`glm-5.1`	文本	文本	GLM 直连模型

模型 ID	输入	输出	备注
`doubao-seed-2-0-lite-260428`	文本	文本	快速、高性价比
`doubao-seed-2-0-mini-260428`	文本	文本	轻量级模型
`doubao-seed-2-0-pro-260215`	文本	文本	更高能力模型
`doubao-seed-2-0-code-preview-260215`	文本	文本	代码专用模型

模型 ID	输入	输出	备注
`ernie-5.1`	文本	文本	ERNIE 直连模型

模型 ID	输入	输出	备注
`hy3-preview`	文本	文本	混元 3 预览模型

价格默认值写在模型 seed 数据中。如果你的供应商合同价不同，可以在管理后台的模型配置中调整。

异步视频生成。通过队列 API（POST /v1/queue/{model}）使用。

模型 ID	速度	质量	音频
`veo-3.1`	标准	最高	支持
`veo-3.1-fast`	快速	高	支持
`veo-3`	标准	高	支持
`veo-3-fast`	快速	良好	支持
`veo-2`	标准	良好	支持

所有 Veo 模型支持：

能力	Gemini 对话	国产文本	Qwen VL	Veo 视频
文本输入	支持	支持	支持	支持
图像输入	支持	—	支持	支持
音频输入	支持	—	—	—
视频输入	支持	—	—	—
文本输出	支持	支持	支持	—
图像输出	部分	—	—	—
视频输出	—	—	—	支持
流式传输	支持	支持	支持	—

通用对话： 从 gemini-3-flash-preview（快速, 多模态）或 deepseek-v3.2（强文本推理）开始。

代码： 试试 qwen3-coder-480b-a35b 或 qwen3-coder-next。

推理： 使用 deepseek-r1、glm-5.1 或 kimi-k2.6。

国产高吞吐路由： 使用 doubao-seed-2-0-lite-260428、qwen3.5-flash 或 hy3-preview。

视觉： 使用 gemini-3-flash-preview（图像、音频、视频输入）或 qwen3-vl-235b-a22b（仅图像）。

视频生成： 追求质量用 veo-3，追求速度用 veo-3-fast。