原文摘要
今年Agent的核心变化在于,Tool Use能力取得了突破。
进一步信息揣测
- DeepSeek打破OpenAI垄断的细节:DeepSeek可能通过特定优化(如垂直领域微调或成本控制策略)在推理模型赛道突围,而非单纯技术超越,这背后可能涉及未公开的算力合作或数据源优势。
- 大厂Agent项目的真实进展:Google的Project Mariner、百度的“心响”APP等虽高调宣传,但实际落地可能受限于内部资源争夺或技术瓶颈(如多工具协同的可靠性),部分功能演示可能存在“技术化妆”(Tech Demo包装)。
- PMF的隐藏挑战:Agent产品普遍面临“伪需求”问题,用户实际使用频率远低于预期,商业化依赖企业定制(如阿里“心流”),但企业端对自动化替代人力的接受度仍存隐性抵触。
- Operator与Deep Research的局限性:OpenAI两款产品的“上网执行”和“深度研究”能力可能依赖严格白名单或人工审核,实际场景中错误率(如错误点击/数据误解)未公开,需付费版才能解锁完整功能。
- 模型军备竞赛的副作用:头部厂商频繁迭代模型(如Claude 4、Gemini 2.5 Pro)导致中小团队被迫跟进,但训练成本剧增,部分团队可能通过“模型套壳”(基于API二次包装)虚标能力。
- Tool Use突破的实践陷阱:尽管工具调用能力提升,但多步骤任务中Agent易陷入“死循环”(如反复调用无效API),需开发者手动设置熔断机制,这一经验罕见于公开文档。
- 数据壁垒的行业真相:Agent表现差异的核心可能非模型本身,而是厂商未公开的专有数据(如特定行业交互日志),这类数据通常通过封闭合作或高价采购获得。