20250711-Cursor终结者？Grok_4正式登顶！马斯克扬言编程碾压，20万N卡年赚47亿美金！

原文摘要

马斯克表示，Grok 4 在基准测试的任何科目上的表现都超过了博士水平。

Grok 4的真实性能存疑：马斯克宣称其“超过博士生水平”且“无测试题可问”，但承认模型仍缺乏常识且未实现技术突破，暗示宣传可能存在夸大，实际能力或受限于当前技术瓶颈。
团队动荡的隐忧：发布会前首席科学家Igor Babuschkin突然辞职，结合团队合照中70%为亚洲人的高比例，可能反映内部文化冲突或技术路线分歧，稳定性存疑。
商业化策略激进：跳过Grok 3.5直接推4.0，并计划三个月内密集发布多款垂直模型（编码/多模态/视频），疑似通过快速迭代抢占市场，但可能牺牲产品成熟度。
订阅制分层暗藏玄机：最高档300美元/月的“Supergrok Heavy”提供未发布产品优先体验权，实为变相付费测试，用户可能承担高额费用却成为调试工具。
数据源垄断倾向：强调深度搜索依赖X平台数据，暗示未来可能通过AI反哺社交平台流量，形成封闭生态，存在数据垄断风险。
多模态能力滞后：虽提及未来支持视频，但对比GPT-5o和Gemini 2.5 Pro已落伍，侧面暴露xAI在非文本领域的研发短板。
测试成绩的可操作空间：SAT/GRE满分宣传未披露具体测试条件（如题库覆盖度、是否允许联网），行业惯例中此类成绩可能通过针对性训练达成，不代表真实泛化能力。