20250712-Moonshot_发布_k2_模型，1T_参数

原文摘要

总参数 1T，激活参数 32B，
上下文长度为 128k
支持 ToolCalls
支持 JSON Mode
支持 Partial Mode
支持联网搜索功能等

不支持视觉功能

更多信息，可参考：
https://platform.moonshot.cn/docs/pricing/chat#%E7%94%9F%E6%88%90%E6%A8%A1%E5%9E%8B-kimi-k2

原文链接

进一步信息揣测

模型参数的真实利用率：虽然总参数高达1T，但激活参数仅32B，暗示实际推理时可能通过稀疏化或动态激活技术大幅降低计算成本，这种设计通常不会在官方文档中详细说明。
上下文长度的隐藏限制：128k的上下文长度可能在极端场景下（如高并发或复杂查询）出现性能下降或隐性截断，需通过压力测试才能发现。
ToolCalls的兼容性风险：支持ToolCalls但未提及具体兼容范围，实际使用中可能因第三方工具接口变动或权限问题导致功能失效，需内部API白名单。
JSON Mode的解析陷阱：JSON Mode可能对嵌套结构或特殊字符（如未转义引号）有严格限制，未在文档中标注的解析规则可能导致数据丢失。
Partial Mode的延迟代价：Partial Mode虽提升响应速度，但可能牺牲结果的连贯性，尤其在长文本生成时需多次请求拼接，增加调试成本。
联网搜索的过滤机制：联网搜索功能可能内置黑名单（如竞品或敏感站点），且结果排序受商业合作影响，非公开算法可查。
视觉功能的未来规划：明确“不支持视觉”可能暗示团队资源集中于NLP赛道，或底层架构未预留多模态扩展接口，影响长期技术路线判断。
计费策略的隐性成本：定价页未说明的细节（如ToolCalls调用次数是否单独计费、联网搜索的流量附加费）可能通过客服或企业协议才披露。
竞品对标信息：未提及与其他1T级模型（如GPT-4）的基准对比，实际性能差异可能通过内部测试报告或行业闭门会议流出。
模型部署的硬件依赖：虽未公开，但1T参数推测需特定GPU集群（如H100）支持，中小厂商接入时可能面临云服务商绑定或硬件适配问题。