原文摘要
You can now access GLM-4.5 and GLM-4.5 Air, new flagship models from Z.ai designed to unify frontier reasoning, coding, and agentic capabilities, using Vercel's AI Gateway with no other provider accounts required.
AI Gateway lets you call the model with a consistent unified API and just a single string update, track usage and cost, and configure performance optimizations, retries, and failover for higher than provider-average uptime.
To use it with the AI SDK v5, start by installing the package:
Then set the model to either zai/glm-4.5 or zai/glm-4.5-air:
Includes built-in observability, Bring Your Own Key support, and intelligent provider routing with automatic retries.
Learn more about AI Gateway.
<p class="more">
<a href="https://vercel.com/changelog/z-ais-glm-4-5-and-glm-4-5-air-are-now-supported-in-vercel-ai-gateway">Read more</a>
</p>
进一步信息揣测
- Vercel的AI Gateway可能隐藏了供应商锁定风险:虽然宣传中强调"无需其他供应商账户",但实际可能通过统一API将用户绑定在Vercel生态内,长期使用可能导致迁移成本增加。
- GLM-4.5系列模型的性能优化存在未公开阈值:文中提到的"性能优化"可能涉及未披露的QPS限制或冷启动延迟,企业级应用时可能需要额外付费解锁更高性能层级。
- BYOK(自带密钥)功能可能有隐藏限制:虽然支持用户使用自己的API密钥,但实际可能仍会通过AI Gateway代理流量,存在密钥被记录或中间层延迟增加的风险。
- 故障转移机制的真实SLA未透明:宣传"高于供应商平均水平的正常运行时间",但未提供具体数据对比,实际可能依赖供应商自身SLA且不承诺赔偿条款。
- SDK v5的版本锁定策略:强制使用最新SDK版本可能隐含兼容性陷阱,旧版代码库升级时可能面临未公开的breaking changes。
- 智能路由的成本转嫁:自动重试和供应商路由功能可能导致意外账单激增,尤其在多区域部署时可能产生隐性跨云服务费用。
- Z.ai模型的实际推理成本结构:未说明GLM-4.5与Air版本的计费差异,Air版本可能通过降低浮点精度或上下文长度来压缩成本,但文档未明确警示精度损失。
- 可观测性数据的采样限制:内置的监控功能可能对高流量用户实施数据采样,关键诊断需要额外购买企业级监控套件。