O3, O4mini-high, claude3.7, Gemini2.5pro 编程能力该怎么排序

10 天前
 jdz
3156 次点击
所在节点    程序员
28 条回复
jdz
10 天前
编程能力
crackidz
10 天前
laogui
10 天前
事实上 o3 效果最好,用过就知道,但价格太贵,都不在考虑范围之内,都在讨论 Gemini 2.5 Pro 和 Claude 3.7 Sonnet
dbg
10 天前
大模型 前端编程 排行榜
https://web.lmarena.ai/leaderboard
icyalala
10 天前
Cursor 官方统计: https://x.com/cursor_ai/status/1917982557070868739
现在用得最多的还是 Claude3.7 和 Gemini2.5 pro ,但是 o3/o4-mini 增长很快
Numeron
10 天前
https://aider.chat/docs/leaderboards/
Leoking222
10 天前
编程无脑 Claude 3.7 就对了,目前没对手
lneoi
10 天前
Gemini2.5 pro 很厉害,加上上下文足够大
murmurkerman
10 天前
genimi 2.5 pro
huluhulu
10 天前
genimi 2.5 pro ,尤其是大段代码重构的时候,简直无敌。
nanjoyoshino
10 天前
我投 Claude 一票,有一次一个关于 redis memory usage 命令的东西,全部问了一遍,只有 Claude 第一次就回答了正确答案,其它的始终都没有给出正确答案
Zhoukker
10 天前
o3 非常强。就是门槛和价格,综合考虑还是 2.5pro
yibie
10 天前
已转 gemini
ShadowPower
10 天前
写前端或者新写独立的代码的时候,claude 3.7 强
对现有的整个项目或者整个模块做分析、重构、genimi 2.5 pro 强
godqueue
10 天前
gemini 感觉最新的内容会比较好,比如最新的 springboot3 以上的版本,他就能给出正确的答案;其他的会差一些
但是编程整体应该是 Claude 最强
yueyingky
10 天前
以前用 3.7 ,现在觉得 genimi 2.5 pro 更好用
ooops
10 天前
个人实测 3.7 3.5 > 2.5pro
aarontian
10 天前
平时用 cursor 写 go 和 python 多些,经常是提出一个比较复杂的需求用 agent 模式一次性写完。感觉写代码 claude 独一档,但 gemini 2.5 pro 规划总结能力和 debug 能力似乎更强(实际写代码时候不那么准确)

以及 claude 在多轮对话和中断重启的时候容易丢失上下文,我有时候会让 gemini 总结一下我的要求,列计划,然后切换到 claude 3.7 去执行

o3/o4-mini 没怎么试过
yulon
10 天前
Claude 原生很积极使用 tool ,别的模型估计提示词写多一点也行,但是为什么要写呢
azraeljack
9 天前
cursor 里用 gemini 2.5 pro 高血压的次数显著少于 claude 3.7

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://yangjunhui.monster/t/1129424

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX