20250710-Infinite_Monkey

原文摘要

Infinite Monkey

Mihai Parparita's Infinite Mac lets you run classic MacOS emulators directly in your browser. Infinite Monkey is a new feature which taps into the OpenAI Computer Use and Claude Computer Use APIs using your own API keys and uses them to remote control the emulated Mac!

Here's what happened when I told OpenAI Computer Use to "Open MacPaint and draw a pelican riding a bicycle" - video sped up 3x.

<p><small></small>Via <a href="https://bsky.app/profile/persistent.info/post/3ltk6lke5ek2m">@persistent.info</a></small></p>


<p>Tags: <a href="https://simonwillison.net/tags/macos">macos</a>, <a href="https://simonwillison.net/tags/mihai-parparita">mihai-parparita</a>, <a href="https://simonwillison.net/tags/ai">ai</a>, <a href="https://simonwillison.net/tags/webassembly">webassembly</a>, <a href="https://simonwillison.net/tags/generative-ai">generative-ai</a>, <a href="https://simonwillison.net/tags/llms">llms</a>, <a href="https://simonwillison.net/tags/ai-agents">ai-agents</a>, <a href="https://simonwillison.net/tags/pelican-riding-a-bicycle">pelican-riding-a-bicycle</a></p>

原文链接

进一步信息揣测

  • OpenAI/Claude Computer Use API的潜在限制:虽然文章提到可以调用这些API远程控制模拟Mac,但未提及API的速率限制、成本消耗或特定操作(如图形绘制)可能触发的额外费用,这些细节通常需要实际使用或查阅付费文档才能发现。
  • 浏览器模拟器的性能陷阱:Infinite Mac基于浏览器运行经典MacOS模拟器,但未说明复杂操作(如AI控制绘图)对浏览器性能的要求,可能导致低配设备卡顿或崩溃,这是实际使用中常见的坑。
  • AI控制精度问题:视频展示了AI成功绘制鹈鹕骑自行车,但未提及失败案例或需要多次调整提示词的情况,实际使用中AI可能因理解偏差产生错误操作(如误触菜单或画错图形)。
  • API密钥的安全风险:要求用户自行提供API密钥,但未警告密钥泄露或被滥用的可能性,业内通常建议通过代理层或限制权限来规避风险。
  • 非公开的兼容性限制:未明确说明哪些MacOS版本或应用程序在模拟器中稳定支持AI控制,某些旧软件可能因API无法识别界面元素而失效。
  • 隐藏的延迟成本:AI生成操作指令到模拟器执行的延迟(尤其在网络不佳时)可能影响体验,但文章未提及优化技巧(如本地缓存或指令批处理)。
  • 行业竞争动态:同时支持OpenAI和Claude的API可能反映开发者对多模型集成的试探,暗示未来AI工具链的兼容性设计趋势,这是内部人士关注的动向。
  • 未公开的扩展用例:文章仅展示绘图场景,但未提及AI控制模拟器在自动化测试、复古软件教学等领域的潜力,这些可能是付费用户或深度合作者才能接触的方向。