原文摘要
彭博社,刚刚透露了 GLM-4.5 的发布
“Zhipu AI, OpenAI's global competitor, will release and open source a new model tonight.”
翻译成中文:
“Zhipu AI, OpenAI 的全球竞争对手,将于今晚发布新开源模型”
———
👆上面消息是靠谱的
👇下面我来做一些【额外补充】
🟢 模型是 MoE?
是的,新模型叫 GLM-4.5:355B 总参,32B 激活
还有个小点的 GLM-4.5-Air:106B 总参,12B 激活
🟢 今晚会发?
是的
🟢 会开源吗?
MIT 协议开源,可商用
🟢 GLM-4.5 比 Kimi-K2/ DeepSeek R1强?
评测、体感上是的,参数还更小
🟡 GLM-4.5 比 Claude Sonnet 强?
互有胜负
🔴 GLM-4.5 比 Claude Opus / OpenAI O3 强?
想啥呢...
进一步信息揣测
- GLM-4.5的MoE架构细节:模型采用混合专家系统(MoE),总参数355B但仅激活32B,小版本GLM-4.5-Air为106B总参/12B激活,暗示通过动态计算节省资源的技术路径。
- 开源策略的商业意图:MIT协议开源且可商用,可能是为了快速抢占开发者生态,对抗OpenAI的闭源商业模式,同时通过后续企业级服务变现。
- 性能对标内幕:评测显示GLM-4.5优于Kimi-K2/DeepSeek R1(参数更小却更强),但弱于Claude Opus/OpenAI O3,反映国产模型在中等梯队已具备竞争力,但顶尖梯队仍有差距。
- 发布时机的博弈:选择深夜发布可能为规避国际主流媒体的即时追踪,同时利用中文社区夜间活跃度进行精准传播。
- 行业竞争动态:提及与Claude Sonnet“互有胜负”,暗示国产模型在特定垂直场景(如中文处理)已能挑战国际二线产品,但未公开的测试集可能存在偏差。
- 技术路线取舍:参数规模与激活参数的悬殊比例(如355B总参仅激活32B),透露团队在模型稀疏化、推理成本控制上的激进优化,可能牺牲部分泛化能力。
- 信源可信度暗示:作者强调消息“靠谱”但未提具体背景,可能为内部人士通过非正式渠道释放信息,规避企业官方披露规则。