快速结论
- 编码场景表现强:代码生成、解释、重构、单测补全与 Bug 定位都能覆盖。
- 支持 Anthropic Messages + tools,可把“写代码”和“执行工具”串成一条链路。
- 支持 stream=true 的 SSE 增量返回,适合 IDE Copilot、终端助手和实时 Agent。
关键参数
- model | string | 必填 | claude-haiku-4-5 | - | 模型名称,使用当前页面模型 ID(例如 claude-haiku-4-5)。
- messages | object[] | 必填 | - | - | 对话消息列表,按时间顺序排列;仅支持 user 和 assistant 角色。
- max_tokens | integer | 必填 | - | >=1 | 生成内容的最大 token 数量。
- system | string | object[] | 可选 | - | - | 系统提示词,在顶层设置(不要放在 messages 中)。
- stream | boolean | 可选 | false | - | 是否启用流式输出(SSE)。
- temperature | number | 可选 | 1 | 0-1 | 采样温度,控制输出随机性。
- top_p | number | 可选 | - | 0-1 | 核采样概率阈值,建议不要同时设置 temperature 和 top_p。
- stop_sequences | string[] | 可选 | - | - | 停止序列,遇到指定字符串时停止生成。
- Authorization | HTTP Header | 可选 | - | - | Bearer Token 认证:Authorization: Bearer <YOUR_API_KEY>。
- x-api-key | HTTP Header | 可选 | - | - | API Key 认证(Anthropic SDK 常用),与 Authorization 二选一。
- anthropic-version | HTTP Header | 可选 | 2023-06-01 | - | Anthropic API 版本号;使用 Anthropic SDK 时通常自动传入。
常见错误
- 400 invalid_request_error: 触发=请求体字段缺失、messages 结构错误或参数类型不匹配。; 修复=重点校验 model、messages、max_tokens 字段及类型。; 重试=修正参数后再重试。
- 401 authentication_error: 触发=Authorization 缺失、格式错误或密钥无效。; 修复=确认 Bearer Token 与密钥权限。; 重试=修复鉴权后重试。
- 429 rate_limit_exceeded: 触发=请求频率、并发或当前额度命中上游限流策略。; 修复=先做指数退避重试,并检查当前请求节奏、并发设置和额度使用情况。; 重试=建议 1s/2s/4s + 抖动;连续触发时再收紧提交节奏。

