20250731-Step-3_发布：包括发布会上没说的，都在这了

原文摘要

一切信息，都在这了

原文链接

进一步信息揣测

国产芯片适配内幕：华为昇腾已率先实现Step-3运行，但其他联盟成员（如沐曦、天数智芯等）仅处于“初步运行”阶段，实际适配进度可能滞后于宣传，需警惕厂商夸大技术成熟度。
成本降低的“文字游戏”：官方宣称“推理效率达DeepSeek-R1的300%”，但未明确对比条件（如芯片型号、batch size等），实际落地可能因硬件差异大打折扣。
MoE架构的隐藏缺陷：虽强调321B总参、38B激活的高效性，但未提及MoE动态路由的额外计算开销，尤其在国产芯片上可能引发隐性性能损耗。
联盟合作的真实动机：模芯生态联盟表面是技术合作，实则为分摊国产芯片研发风险，厂商通过绑定模型生态抢占市场，后续可能面临资源分配不均问题。
开源策略的潜在限制：7月31日开源，但技术报告需回复关键词获取，暗示核心优化细节（如分布式推理技巧）可能被保留或商业化。
性能对比的“选择性”：Benchmark仅对比DeepSeek-R1（无视觉能力），回避与同级多模态模型（如GPT-4o）的直接竞争，实际差距可能被掩盖。
国产卡部署的隐性成本：强调国产卡兼容性，但未提及需定制算子库或额外优化投入，企业需预留更高隐性开发成本。
“低训练成本”的真相：DeepSeek案例中“低成本”可能依赖数据/算法黑箱技巧（如知识蒸馏），Step-3未披露具体方法，实际复现难度高。