原文摘要
Google 正式在 Gemini 中推出了由 Veo 3 驱动的图生视频功能。
进一步信息揣测
- AI视频生成工具的隐藏成本:虽然Google Gemini的Veo 3和NVIDIA的DiffusionRenderer展示了强大的视频生成能力,但实际使用中需要极高的算力支持,普通用户可能面临高昂的云服务费用或硬件升级成本,这些隐性支出很少在官方宣传中提及。
- AI模型的“免费体验”陷阱:快手“可图2.1”提供限时免费体验,但通常此类活动是为了收集用户数据以优化模型,后续可能转为付费模式或限制免费功能,需警惕数据隐私问题。
- AI在抽象任务中的致命缺陷:ChatGPT和Copilot无法通关1979年象棋游戏的案例揭示了当前AI在长期策略和抽象推理上的短板,行业内部普遍认为这类问题短期内难以解决,但企业会刻意弱化宣传。
- 数字人公司的盈利模式内幕:Anam等AI数字人公司按会话时长计费,实际运营中会通过故意延长对话(如重复确认需求)增加收入,这种“隐形溢价”在客户合同中往往以模糊条款存在。
- 3D视频编辑的技术壁垒:DiffusionRenderer结合3D模型生成看似便捷,但需专业团队预先建模和调试,普通用户难以直接应用,实际目标客户是影视工作室而非个人创作者。
- AI初创公司的融资套路:Anam种子轮融资后高调宣称年营收预期,实为吸引下一轮投资的手段,业内常见通过夸大早期客户合作规模(如将试点项目包装为稳定收入)来抬高估值。
- 大模型测试的“选择性披露”:科技公司测试AI能力时,通常避开象棋等逻辑密集型任务,转而强调图像/文本生成等优势领域,内部测试报告与公开演示存在显著差异。