20250721-OpenAI新Agent遭中国24人初创团队碾压!实测成本、质量全输惨,海外用户:中国Agent代差

原文摘要

昨日凌晨,OpenAI 推出了 ChatGPT Agent 这一新功能。

原文链接

进一步信息揣测

  • Agent功能实际限制:尽管宣传中强调多步骤任务处理能力,但幻灯片生成功能仍处于测试阶段,输出质量可能较基础,需人工二次调整,暗示其复杂任务处理尚未成熟。
  • 性能数据对比内幕:官方基准测试中,Agent表现远超人类(如数据分析任务89.9% vs 人类64.1%),但未公开测试的具体条件或数据量级,可能存在选择性展示优势场景的倾向。
  • 早期功能替代策略:Operator工具将被逐步关闭,强制用户迁移至Agent,反映OpenAI通过功能整合降低维护成本,同时推动付费用户升级(仅Pro/Plus/Team可用)。
  • 沙盒环境安全风险:Agent使用虚拟沙盒执行操作,虽声称不控制用户设备,但未提及潜在漏洞(如API连接Gmail/GitHub时的数据泄露风险),实际安全性依赖第三方集成。
  • 行业竞争隐含信号:推出自主浏览和任务执行功能,直接对标AI代理赛道(如Adept、AutoGPT),可能加速行业对“多步骤自动化”的军备竞赛,但未提及其他厂商已暴露的可靠性问题(如错误操作率)。
  • 付费墙背后的优先级:企业/教育用户需等待数周才能访问,表明OpenAI优先服务高利润的B端客户(Pro/Plus订阅者),免费用户可能长期被排除在核心功能外。
  • 实际用户体验落差:用户反馈生成财务报告“与投行初级分析师差距较远”,暗示宣传中的“专家级表现”可能局限于特定简化场景,复杂任务仍需人工干预。
  • 观察模式的控制成本:需全程监督发送邮件等高敏感操作,实际节省时间有限,暴露出AI在责任归属场景的局限性(如法律风险规避)。