20250723-Altman_秀新模型“翻车”，谷歌补刀躺赢！OpenAI_前员工爆肝3天，编程再赢老东家模型！

原文摘要

近期， OpenAI 接连在多个场合携不同新模型“上桌”，且这些模型均还未公开发布。

原文链接

进一步信息揣测

OpenAI新模型测试策略：OpenAI正在通过非公开渠道（如WebArena）测试未发布的新模型（如“o3-alpha-responses-2025-07-17”），并以匿名身份（Anonymous-Chatbot）隐藏真实意图，可能是为规避早期舆论压力或竞争对手监测。
IMO竞赛内幕争议：
OpenAI自行评分并抢先宣布“金牌成绩”，但未遵循IMO官方评分标准（未公开），且疑似违反保密协议（其他AI公司如Harmonic、DeepMind均遵守延期发布要求）。
内部评审团由前IMO奖牌得主盲审，但缺乏第三方验证，存在“自评自夸”嫌疑。
模型性能差异：
OpenAI模型以纯文本处理IMO题目，不同于谷歌DeepMind的专门优化系统（如AlphaProof需3天解题），但实际效率与公平性存疑（是否严格遵循4.5小时限制？）。
网友爆料称o3 Alpha模型在网页开发任务中表现惊艳，可能暗示其多模态能力远超当前公开模型（如Gemini 2.5 Pro）。
公关博弈：
OpenAI被指责“博眼球无底线”，而谷歌DeepMind通过“尊重IMO流程”塑造专业形象，反映两家公司不同的舆论操控策略。
OpenAI提前泄密可能为抢占媒体声量，但激怒了IMO社群，影响后续合作信任。
行业潜规则：
IMO题目会同步分享给多家AI公司，但成绩发布需遵守官方时间表，OpenAI的违规行为暴露了行业对“首发权”的激烈争夺。
未公开模型（如疑似GPT-5的伪装版本）通过小范围测试收集数据，规避公开发布前的监管审查。