🤖 AI 摘要
Claude Code 等 Agent 工具比普通聊天更容易遇到超时问题,核心原因是任务执行时间长、涉及多轮 API 调用串联。Cloudflare 默认 120 秒超时是主要瓶颈,导致 524 Gateway Timeout。503 Service Unavailable 则表示上游服务暂时不可用。空回复(completion_tokens=0)的扣费问题也值得关注——如果空回复是由服务端错误导致,理论上预扣费应该返还。解决方案是使用 api2.link-ai.cc 直连通道,适合 Claude Code、Codex CLI 等长任务场景。
💡 直接答案
Claude Code 长任务推荐配置:ANTHROPIC_BASE_URL="https://api2.link-ai.cc",ANTHROPIC_AUTH_TOKEN="你的 API Key"。api2 提供直连通道,超时策略比 api1 更宽松,适合长上下文和长输出场景。如果仍然遇到 524,参考 524 排查指南。担心扣费问题,用 扣费检测工具 核验 raw quota 数据。
Claude Code 为什么比普通聊天更容易超时
Claude Code 是一个 Agent 工具,它的工作方式与普通聊天有本质区别:
- 多轮 API 调用:一个任务可能触发数十次 API 请求
- 长上下文处理:需要读取、分析大量文件内容并发送给模型
- 长输出生成:生成代码、重构系统等输出量很大
- 任务执行时间长:一个完整任务可能持续数分钟到数十分钟
这些特点叠加起来,很容易超过 Cloudflare 默认的 120 秒超时限制。
长上下文、长输出、Agent 任务的耗时特点
| 任务类型 | 典型耗时 | 超时请注意 |
|---|---|---|
| 普通聊天问答 | 5-30 秒 | 一般不会超时 |
| 代码片段生成 | 10-60 秒 | 可能超时 |
| Claude Code 中型重构 | 2-10 分钟 | 高概率 524 |
| Claude Code 系统设计 | 10-30 分钟 | 几乎必定 524 |
api1 为什么适合普通请求
https://api1.link-ai.cc/v1 适合:
- 普通聊天和快速问答
- 单轮或少量多轮对话
- 短文本生成和翻译
- 测试和调试
api1 走 Cloudflare 标准通道,响应速度快,但超时限制严格。
api2 为什么适合长请求
https://api2.link-ai.cc/v1 提供:
- 直连通道,绕过部分 Cloudflare 超时限制
- 长任务优先队列
- 更宽松的连接保持策略
- 更适合 Claude Code、Codex CLI 等工具
503 和 524 的区别
| 错误码 | 含义 | 常见原因 | 处理建议 |
|---|---|---|---|
| 524 | Cloudflare 超时 | 任务太长了,上游未在 120s 内响应 | 用 api2 直连通道;减少单次输出长度 |
| 503 | Service Unavailable | 上游过载或暂时不可用 | 等待后重试;检查是否渠道异常 |
| 401 | 认证失败 | API Key 无效或未设置 | 检查 ANTHROPIC_AUTH_TOKEN 是否正确 |
| 403 | 权限不足 | Key 没有该模型的访问权限 | 在控制台检查模型授权 |
推荐配置
Claude Code 配置
# 在 Claude Code 的 .env 或环境变量中设置
ANTHROPIC_BASE_URL="https://api2.link-ai.cc"
ANTHROPIC_AUTH_TOKEN="sk-你的APIKey"
验证配置是否生效
# 测试 API 是否可达
curl https://api2.link-ai.cc/v1/models \
-H "Authorization: Bearer sk-你的APIKey"
# 应该返回模型列表,包含 claude-3-opus、claude-3-sonnet 等
如果仍然 524,尝试
- 减少单次任务的上下文量(减少发送给模型的文件数量)
- 降低
max_tokens限制 - 分多次小任务而不是一次大任务
- 参考 524 完整排查指南
空回复是否应该扣费
如果请求返回空回复(completion_tokens: 0),需要判断原因:
- prompt 本身有问题:模型无法从 prompt 生成有效回复,用户承担预扣费是合理的
- 503/524 导致请求失败:服务端错误导致无输出,理论上中转站不应让用户承担预扣费
- 渠道质量问题:上游返回异常,中转站应该处理并返还预扣费
判断方法:用 API 扣费检测工具 检查 raw quota 数据,对比页面余额和实际消耗。
让 Claude Code 稳定运行
使用 api2 直连通道,减少 524 和空回复问题
ANTHROPIC_BASE_URL="https://api2.link-ai.cc"