模型列表

凯洛 Kailoo 通过稳定的中转节点接入全球顶级大语言模型。所有模型均兼容 OpenAI SDK，无需修改代码即可切换。

国内访问说明：所有模型均通过凯洛中转节点统一路由，国内无需自备代理工具，支付宝或微信充值后即可直接调用。因上游服务商政策调整，少数模型可能出现临时限流，我们会在此页面实时标注可用状态。

能力：

凯洛定价说明上表为官方 API 价的 8 折（比官方便宜 20%），按实际 token 用量计费、与控制台扣费一致。附加价值：无需 KYC、支付宝 / 微信充值、国内直连无需梯子、一个密钥跨 OpenAI / Anthropic / Google 三家随时切换。

海外模型

OpenAI

US● 稳定

GPT-5 Pro旗舰

上下文 400K

OpenAI 顶级 Pro tier，深度推理与复杂任务能力最强，企业 SLA 客户专享高吞吐通道。

视觉函数调用深度推理流式

输入 / 1M Token

¥36.5

输出 / 1M Token

¥175.2

最新Pro tier

GPT-5.5旗舰

上下文 256K

OpenAI 最新旗舰推理模型，复杂推理与代码能力最强，适合重度 agent、深度问题求解。

视觉函数调用深度推理流式

输入 / 1M Token

¥29.2

输出 / 1M Token

¥175.2

推理代码

GPT-5.4均衡

上下文 256K

标准生产主力，能力与成本均衡，适合大多数对话、写作、代码场景。

视觉函数调用流式

输入 / 1M Token

¥14.6

输出 / 1M Token

¥87.6

通用代码

GPT-5.4 mini轻量

上下文 256K

轻量高速版，成本最低，适合分类、摘要、高频轻量任务。

函数调用流式

输入 / 1M Token

¥4.38

输出 / 1M Token

¥26.28

低成本高速

GPT-5.4 nano轻量

上下文 128K

极致便宜的 nano 档，纯文本分类 / 路由 / 简单提取场景批量打底。

函数调用流式

输入 / 1M Token

¥1.17

输出 / 1M Token

¥7.3

最便宜批量

Anthropic

US● 稳定

Claude Opus 4.8旗舰

上下文 200K

Anthropic 当代最旗舰，推理 / 长文档 / 代码工程全面升级，Claude Code 重度 agent 首选最新代。

视觉函数调用长上下文深度推理流式

输入 / 1M Token

¥58.4

输出 / 1M Token

¥292

Google

US● 稳定

Gemini 3.1 Pro Preview旗舰

上下文 1M

Google 最新代旗舰，原生百万 Token 上下文，多模态推理升级，preview 阶段限流配额。

视觉函数调用长上下文深度推理流式

输入 / 1M Token

¥11.68

输出 / 1M Token

¥70.08

最新preview

Gemini 2.5 Flash均衡

上下文 1M

Google 高速模型，原生百万 Token 上下文，多模态输入，适合高频 RAG 检索与实时问答。

视觉函数调用长上下文流式

输入 / 1M Token

¥1.75

输出 / 1M Token

¥14.6

超长上下文多模态

Gemini 2.5 Pro推理

上下文 1M

Google 旗舰推理模型，原生百万 Token 上下文，多模态，适合复杂推理与长文档分析（reasoning 模型，max_tokens 勿设太小）。

视觉函数调用长上下文流式

输入 / 1M Token

¥7.3

输出 / 1M Token

¥58.4

超长上下文多模态

接入兼容性

所有模型均通过标准 OpenAI 兼容接口提供。将您现有代码中的 baseURL 替换为凯洛端点，并使用您的凯洛 API Key，即可无缝切换，无需修改其他代码。

// 原 OpenAI SDK 接入
baseURL: "https://kailoo.ai/v1"
apiKey: "zk_xxxxxxxx"