AI 自动编程王者之争:Cursor vs Roo Code vs Gemini CLI vs Claude Code
2025 7 11 06:56 PM 127次查看
正好最近在研究 MacBook 的 ANE 芯片能干啥时,发现它可以做 OCR,且 Apple 原生提供了 OCR 的接口。
考虑到经常有同事找我排查问题时只发截图,我还需要将其中的文字提取出来才能用于定位问题,于是想让 AI 帮我写一个简单的 OCR 工具。
我并没有什么 macOS 应用的开发经验,因此这个项目正好可以考查一下各种 AI 工具对小白的帮助程度。
我设计的测试方案如下:
- 基于我简单的了解,开发 macOS 应用应该需要 XCode,可能需要先配置一些环境,因此我先设计一段提示词,故意让它用 VSCode 配置:
帮我开发一个macOS应用:
1. 平时它在后台静默运行。
2. 当用户截图或在任意应用(如浏览器)中复制图片时,它自动检测图片中的文本内容。
3. 如果检测到有文本内容,就弹出一个小窗口,并提供一键复制功能,过几秒钟自动关闭窗口。
4. 用户可以打开菜单栏,查看历史的文本列表。(无需持久化,保存最近5条。)
先不要写代码,如果需要用vscode创建必要的环境,指导我怎么做。直到我完成环境配置后,才开始生成代码 - 配置完成后,用下面的提示词生成代码:
我已经创建好了,请检查下项目结构,开始写代码。如果需要操作,请通知我
接下来介绍参赛选手:
- Cursor(1.2.4):最低收费每月 $20 或每年 $16 * 12。
- Roo Code(3.23.6):按 API 收费,但 Gemini 2.5 Pro 每天有 100 次的免费额度。
- Gemini CLI(0.1.7):免费,但 Gemini 2.5 Pro 有额度限制,超过时降级到 Gemini 2.5 Flash。
- Claude Code(1.0.48):最低收费每月 $20 或每年 $17 * 12 或按 API 调用收费。
OK,下面开始比赛。
第一名选手是我最常用的 Cursor,我先让它使用 Gemini 2.5 Pro 模型。
它很顺利地指导我使用 XCode 创建了一个项目,然后写出了一个可以运行的版本,并且正确识别到了图片中的文字。但是点击复制按钮时,应用崩溃了。
我截图后让它修复,但尝试多次仍没成功。
之后它清理了项目,又遇到无法编译的错误。
再次修复后,日志中看到它 OCR 成功了,但是没有弹出窗口。
之后修复多次均没成功,我放弃了。
接着我将模型换成了 Claude 4 Sonnet。
它第一次运行时多显示了一个空白窗口,其他问题和 Gemini 2.5 Pro 一样。
之后它修复了空白窗口的问题,但是复制时仍然崩溃。
再之后也出现了编译错误。
再之后 OCR 无效,修复多次均没成功,我又放弃了。
我再把模型换成 Claude 4 Sonnet Thinking,给它最后一次机会。
这次它直接用 swift 命令创建了项目,不需要我使用 XCode 了。
然后自己一路开始写代码、编译、修复等工作,整个过程不需要我用 XCode 点击运行按钮,非常流畅。
但是它尝试了十多分钟,仍然没有实现任何一个功能点,只要一截图就会立刻崩溃。
我彻底对 Cursor 失望了,开始测试 Roo Code + Gemini 2.5 Pro 的组合。
它第一次运行就编译错误了。
尝试修复了很多次,编译错误越来越多,我只能放弃了。
接下来轮到 Gemini CLI 登场。
它也没能解决编译错误,并且还不能截图给它,只能复制文本。
尝试修复几次后,我遇到了限额的问题,强行降智到 Gemini 2.5 Flash,于是只好放弃。
最后的机会留给了 Claude Code,我直接使用默认的 Claude 4 Sonnet 模型,没有使用更贵的 Opus。
它很轻松地就完成了任务,第一次运行就成功了,花费约 $0.7。
我发现点击复制按钮之后,窗口没有立即关闭,而是等待几秒后才关闭。于是让它修复这个问题,又花了 $0.3 后成功修复了。
我又进入了第一个项目,让它修复没有弹出窗口的问题,花费约 $1 后成功修复了,但是也遇到了复制后崩溃的问题。
我让它继续修复,这个问题它尝试 4 次才修复,又花费了约 $5。
Claude Code 的表现有点出乎意料地好,不仅轻松完成了自己的任务,还能解决其他选手产生而解决不了的 bug。
剩下唯一的问题就是钱了,然而赛博菩萨 Any Router 连这个问题也帮我解决了。
它免费给所有用户赠送 Claude 模型的额度:注册时送 $50;如果你通过我上面的链接注册,再送 $50;每天签到都送 $10。(怎么感觉像卖货直播的台词?)说实话我也不知道会送多久,所以早点注册比较好。
注意使用时需要配置
ANTHROPIC_AUTH_TOKEN
和 ANTHROPIC_BASE_URL
,这个网站的使用指南里有介绍,我就不复述了。Cursor 真的让我有点惋惜,它确实也有一定用处,但是解决 bug 的能力是差强人意。希望在它倒闭前,我能找到 Tab 模型的替代品吧。
0条评论 你不来一发么↓