| 模型名 | Bedrock Model ID | 区域类型 | 备注 |
|---|---|---|---|
claude-opus-4-7-us |
us.anthropic.claude-opus-4-7 |
us | 新 |
claude-opus-4-7-global |
global.anthropic.claude-opus-4-7 |
global | 新 |
claude-opus-4-7 |
us.anthropic.claude-opus-4-7 |
us | Claude Code 默认别名 新 |
claude-opus-4-6-us |
us.anthropic.claude-opus-4-6-v1 |
us | |
claude-opus-4-6-global |
global.anthropic.claude-opus-4-6-v1 |
global | |
claude-opus-4-5 |
global.anthropic.claude-opus-4-5-20251101-v1:0 |
global | |
claude-opus-4-1 |
us.anthropic.claude-opus-4-1-20250805-v1:0 |
us | |
claude-sonnet-4-6-us |
us.anthropic.claude-sonnet-4-6 |
us | |
claude-sonnet-4-6-global |
global.anthropic.claude-sonnet-4-6 |
global | |
claude-opus-4-6 |
us.anthropic.claude-opus-4-6-v1 |
us | Claude Code 默认别名 |
claude-sonnet-4-6 |
us.anthropic.claude-sonnet-4-6 |
us | Claude Code 默认别名 |
claude-haiku-4-5-20251001 |
global.anthropic.claude-haiku-4-5-20251001-v1:0 |
global | Claude Code 默认别名 |
claude-sonnet-4-5 |
global.anthropic.claude-sonnet-4-5-20250929-v1:0 |
global | |
claude-sonnet-3-7 |
us.anthropic.claude-3-7-sonnet-20250219-v1:0 |
us | |
claude-haiku-4-5 |
global.anthropic.claude-haiku-4-5-20251001-v1:0 |
global | |
bedrock/* |
任意 Bedrock 模型 ID | 通配符(直接透传) |
区域类型说明:
- us - Cross-Region Inference 端点,us-west-2 和 us-east-1 自动负载均衡
- global - Global Inference 端点,跨多个区域全球负载均衡
claude-opus-4-7-us
└─失败(3次)→ claude-opus-4-7-global
└─失败(3次)→ claude-opus-4-6-us
└─失败(3次)→ claude-opus-4-6-global
└─失败(3次)→ claude-opus-4-1
claude-opus-4-6-us
└─失败(3次)→ claude-opus-4-6-global
└─失败(3次)→ claude-opus-4-1
└─失败(3次)→ claude-opus-4-5
└─失败(3次)→ claude-sonnet-4-6-us
└─失败(3次)→ claude-sonnet-4-6-global
└─失败(3次)→ claude-sonnet-4-5
└─失败(3次)→ claude-sonnet-3-7
└─失败(3次)→ claude-sonnet-3-7
└─失败(3次)→ claude-sonnet-4-6-us (回环兜底)
claude-haiku-4-5
└─失败(3次)→ claude-sonnet-4-6-us (兜底)
Fallback 参数:
allowed_fails: 3- 连续失败 3 次后标记不健康cooldown_time: 60s- 冷却 60 秒后重新启用num_retries: 2- 路由层自动重试 2 次timeout: 600s- 单次请求超时 10 分钟
直接调用任意 Bedrock 模型,绕过 Fallback 链:
curl -X POST https://litellm.example.com/chat/completions \
-H "Authorization: Bearer $API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "bedrock/us.anthropic.claude-opus-4-6-v1",
"messages": [{"role": "user", "content": "Hello"}]
}'本项目使用 simple-shuffle 策略(等概率随机选择部署)。
其他可选策略(需要 Redis):
| 策略 | 说明 |
|---|---|
latency-based-routing |
优先路由到响应最快的部署 |
least-busy |
优先路由到当前负载最低的部署 |
cost-based-routing |
优先选择价格最低的模型 |
在 kubernetes/configmap.yaml 的 router_settings 中修改。