支持的模型
ModelMax 将请求路由到最优的可用供应商。所有模型通过单一 API 访问。
对话模型
文本输入、文本输出的对话模型。通过 POST /v1/chat/completions 使用。
Google Gemini
| 模型 ID | 输入 | 输出 | 备注 |
|---|---|---|---|
gemini-3.1-pro-preview | 文本, 图像, 音频, 视频 | 文本 | 最新 Gemini Pro |
gemini-3-pro-preview | 文本, 图像, 音频, 视频 | 文本 | Gemini 3.0 Pro |
gemini-3-flash-preview | 文本, 图像, 音频, 视频 | 文本 | 快速, 高性价比 |
gemini-3.1-flash-image-preview | 文本, 图像 | 文本, 图像 | 支持图像生成 |
gemini-3.1-flash-lite-preview | 文本, 图像, 音频, 视频 | 文本 | 轻量级 |
AWS Bedrock — DeepSeek
| 模型 ID | 输入 | 输出 | 备注 |
|---|---|---|---|
deepseek-r1 | 文本 | 文本 | 推理模型,带思维链 |
deepseek-v3.1 | 文本 | 文本 | 通用 |
deepseek-v3.2 | 文本 | 文本 | 最新通用模型 |
AWS Bedrock — Qwen
| 模型 ID | 输入 | 输出 | 备注 |
|---|---|---|---|
qwen3-coder-30b-a3b | 文本 | 文本 | 代码专用, 轻量 |
qwen3-32b | 文本 | 文本 | 通用 |
qwen3-235b-a22b-2507 | 文本 | 文本 | 大型, 强大 |
qwen3-coder-480b-a35b | 文本 | 文本 | 代码专用, 高容量 |
qwen3-next-80b-a3b | 文本 | 文本 | 高效 MoE 架构 |
qwen3-vl-235b-a22b | 文本, 图像 | 文本 | 视觉语言模型 |
qwen3-coder-next | 文本 | 文本 | 最新代码模型 |
AWS Bedrock — MiniMax
| 模型 ID | 输入 | 输出 | 备注 |
|---|---|---|---|
minimax-m2 | 文本 | 文本 | MiniMax M2 |
minimax-m2.1 | 文本 | 文本 | MiniMax M2.1 |
AWS Bedrock — Kimi (Moonshot)
| 模型 ID | 输入 | 输出 | 备注 |
|---|---|---|---|
kimi-k2-thinking | 文本 | 文本 | 带推理 |
kimi-k2.5 | 文本 | 文本 | 最新 Kimi |
视频模型
异步视频生成。通过队列 API(POST /v1/queue/{model})使用。
Google Gemini — Veo
| 模型 ID | 速度 | 质量 | 音频 |
|---|---|---|---|
veo-3.1 | 标准 | 最高 | 支持 |
veo-3.1-fast | 快速 | 高 | 支持 |
veo-3 | 标准 | 高 | 支持 |
veo-3-fast | 快速 | 良好 | 支持 |
veo-2 | 标准 | 良好 | 支持 |
所有 Veo 模型支持:
- 文生视频和图生视频
- 最长 8 秒时长
- 720p、1080p 和 4K 分辨率
- 音频生成
能力矩阵
| 能力 | Gemini 对话 | Bedrock 对话 | Qwen VL | Veo 视频 |
|---|---|---|---|---|
| 文本输入 | 支持 | 支持 | 支持 | 支持 |
| 图像输入 | 支持 | — | 支持 | 支持 |
| 音频输入 | 支持 | — | — | — |
| 视频输入 | 支持 | — | — | — |
| 文本输出 | 支持 | 支持 | 支持 | — |
| 图像输出 | 部分 | — | — | — |
| 视频输出 | — | — | — | 支持 |
| 流式传输 | 支持 | 支持 | 支持 | — |
如何选择模型
通用对话: 从 gemini-3-flash-preview(快速, 多模态)或 deepseek-v3.2(强文本推理)开始。
代码: 试试 qwen3-coder-480b-a35b 或 qwen3-coder-next。
推理: 使用 deepseek-r1(响应中返回 reasoning_content)。
视觉: 使用 gemini-3-flash-preview(图像、音频、视频输入)或 qwen3-vl-235b-a22b(仅图像)。
视频生成: 追求质量用 veo-3,追求速度用 veo-3-fast。
