20250730-一手实测GLM4.5满血版Claude_Code，可算有将推理代码Agent融为一体的大模型了！

原文摘要

没有技巧，全是数值

原文链接

进一步信息揣测

MoE架构的实际成本优势：GLM-4.5采用混合专家（MoE）架构，激活参数仅32B（总参数355B），相比传统密集模型（如DeepSeek-R1、Kimi-K2）可大幅降低计算成本，但需注意专家路由的隐性开销（如GPU显存碎片化问题）。
开源策略的潜在动机：MIT License开源可能意在吸引开发者生态，但背后或有商业版闭源模型（如GLM-4.5-Pro）的付费计划，开源版本可能功能受限或数据采集用途。
性能宣传的隐藏前提：宣称“开源模型Top1”可能依赖特定评测基准（如SWE-Bench），实际工业场景中长上下文或复杂Agent任务的表现可能未充分披露。
混合推理模式的实践陷阱：“思考/非思考”模式虽提升效率，但需开发者手动优化触发逻辑，否则可能导致响应延迟或资源浪费。
Claude Code兼容性的代价：支持Claude Code可能需额外适配层，可能牺牲原生模型性能或增加API调用成本（如Token消耗翻倍）。
小模型（GLM-4.5-Air）的隐藏优势：106B参数+12B激活参数的设计更适合边缘部署，但需警惕其“最佳性能”可能依赖特定硬件（如定制推理芯片）。
数据质量的未明细节：未提及训练数据清洗策略，开源模型可能包含未过滤的低质量代码（如GitHub重复或错误片段），影响微调效果。
社区支持的隐性门槛：虽开源，但企业级支持（如模型蒸馏、量化工具链）可能需付费订阅或商业合作。