20250711-Cursor终结者?Grok_4正式登顶!马斯克扬言编程碾压,20万N卡年赚47亿美金!

原文摘要

马斯克表示,Grok 4 在基准测试的任何科目上的表现都超过了博士水平。

原文链接

进一步信息揣测

  • Grok 4的真实性能存疑:马斯克宣称其“超过博士生水平”且“无测试题可问”,但承认模型仍缺乏常识且未实现技术突破,暗示宣传可能存在夸大,实际能力或受限于当前技术瓶颈。
  • 团队动荡的隐忧:发布会前首席科学家Igor Babuschkin突然辞职,结合团队合照中70%为亚洲人的高比例,可能反映内部文化冲突或技术路线分歧,稳定性存疑。
  • 商业化策略激进:跳过Grok 3.5直接推4.0,并计划三个月内密集发布多款垂直模型(编码/多模态/视频),疑似通过快速迭代抢占市场,但可能牺牲产品成熟度。
  • 订阅制分层暗藏玄机:最高档300美元/月的“Supergrok Heavy”提供未发布产品优先体验权,实为变相付费测试,用户可能承担高额费用却成为调试工具。
  • 数据源垄断倾向:强调深度搜索依赖X平台数据,暗示未来可能通过AI反哺社交平台流量,形成封闭生态,存在数据垄断风险。
  • 多模态能力滞后:虽提及未来支持视频,但对比GPT-5o和Gemini 2.5 Pro已落伍,侧面暴露xAI在非文本领域的研发短板。
  • 测试成绩的可操作空间:SAT/GRE满分宣传未披露具体测试条件(如题库覆盖度、是否允许联网),行业惯例中此类成绩可能通过针对性训练达成,不代表真实泛化能力。