模型列表

凯洛 Kailoo 通过稳定的中转节点接入全球顶级大语言模型。所有模型均兼容 OpenAI SDK, 无需修改代码即可切换。

国内访问说明:所有海外模型均通过凯洛境内中转节点路由,无需自备代理工具,支付宝或微信充值后即可直接调用。 因上游服务商政策调整,少数模型可能出现临时限流,我们会在此页面实时标注可用状态。
能力:
境内便利溢价说明海外模型定价含 1.5–2× 中转便利溢价, 已涵盖:境外节点带宽与维护、实时汇率波动对冲、支付宝 / 微信通道手续费、7×24 小时可用性保障。 如对价格敏感,优先使用国产模型(DeepSeek 等),同等任务成本可降低 80–95%。

海外模型

OpenAI logo

OpenAI

US稳定
OpenAI logo
GPT-5旗舰
上下文 128K

OpenAI 最新旗舰多模态模型。推理、代码、长文写作综合能力当前最强。支持图像输入。

视觉函数调用流式

输入 / 1M Token
¥120
输出 / 1M Token
¥480
多模态推理
OpenAI logo
GPT-4o均衡
上下文 128K

实时多模态主力模型,速度与能力均衡。适合高并发业务接入。

视觉函数调用流式

输入 / 1M Token
¥36
输出 / 1M Token
¥108
多模态高并发
OpenAI logo
GPT-4o mini轻量
上下文 128K

轻量高速版,成本最低,适合分类、摘要、简单问答等轻量任务。

视觉函数调用流式

输入 / 1M Token
¥2.4
输出 / 1M Token
¥9.6
低成本高速
OpenAI logo
o3推理
上下文 128K

OpenAI 深度推理模型,适合数学竞赛、逻辑推理、复杂代码生成。响应较慢。

深度推理函数调用

输入 / 1M Token
¥144
输出 / 1M Token
¥576
深度推理数学
An

Anthropic

US稳定
An
Claude Sonnet 4.6旗舰
上下文 200K

Anthropic 当前主力模型,长文档理解和代码工程能力突出,上下文 200K,适合企业知识库接入。

视觉函数调用长上下文流式

输入 / 1M Token
¥22
输出 / 1M Token
¥108
长上下文代码
An
Claude Haiku 4.5轻量
上下文 200K

轻量快速版,成本约为 Sonnet 1/5,适合实时聊天机器人和简单任务流。

函数调用长上下文流式

输入 / 1M Token
¥4
输出 / 1M Token
¥20
低成本实时
Google logo

Google

US稳定
Google logo
Gemini 2.5 Pro旗舰
上下文 1M

Google 旗舰模型,原生百万 Token 上下文,代码生成与科学推理能力强,支持音频、图像、视频输入。

视觉函数调用长上下文流式深度推理

输入 / 1M Token
¥18
输出 / 1M Token
¥72
超长上下文多模态
Google logo
Gemini 2.0 Flash轻量
上下文 1M

极速轻量版,延迟极低,适合高频 RAG 检索和实时问答场景。

视觉函数调用长上下文流式

输入 / 1M Token
¥2
输出 / 1M Token
¥8
极速RAG
xAI

xAI

US稳定
xAI
Grok 3旗舰
上下文 131K

xAI 旗舰模型,接入实时 X 平台数据,适合舆情分析、时事问答与创意写作。

视觉函数调用流式联网搜索

输入 / 1M Token
¥22
输出 / 1M Token
¥88
实时数据舆情
xAI
Grok 3 mini轻量
上下文 131K

轻量推理版,成本低,适合高并发轻量推理场景。

函数调用流式深度推理

输入 / 1M Token
¥8
输出 / 1M Token
¥32
推理低成本
Mistral logo

Mistral

FR稳定
Mistral logo
Mistral Large 2旗舰
上下文 128K

欧洲顶级开源闭源混合模型,代码和多语言能力强,数据主权友好,GDPR 合规。

函数调用流式

输入 / 1M Token
¥24
输出 / 1M Token
¥72
多语言GDPR
Perplexity logo

Perplexity

US稳定
Perplexity logo
Sonar Pro搜索增强
上下文 127K

内置实时联网搜索的 LLM,每次回答自动引用来源,适合调研助手和实时信息检索类应用。

流式联网搜索

输入 / 1M Token
¥18
输出 / 1M Token
¥72
联网引用来源

国产模型对照

数据驻留中国大陆,适合对数据出境有合规要求的企业场景。价格通常低于同级海外模型。

DS
DeepSeek V3对标 GPT-4o
上下文 64K

国产顶级开源模型,综合能力对标 GPT-4o。数据驻留中国大陆,合规优先选择。

函数调用流式

输入 / 1M Token
¥1
输出 / 1M Token
¥4
国产开源
DS
DeepSeek R1对标 o3
上下文 64K

国产深度推理模型,数学和代码推理能力对标 o3,响应较慢但成本极低。

深度推理流式

输入 / 1M Token
¥4
输出 / 1M Token
¥16
推理数学

接入兼容性

所有模型均通过标准 OpenAI 兼容接口提供。将您现有代码中的 baseURL 替换为凯洛端点,并使用您的凯洛 API Key,即可无缝切换,无需修改其他代码。

// 原 OpenAI SDK 接入
baseURL: "https://kailoo.cn/v1"
apiKey: "kailoo-xxxxxxxx"